世界数字技术院发布大模型安全标准 推动AI安全评估新进程

2024-04-17 19:46:53   |   探索者   |   214

最近,世界数字技术院(WDTA)发布了两项国际标准,即《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》,这标志着国际组织首次就大模型安全领域发布了国际标准,为全球人工智能安全评估和测试树立了新的基准。

这两项标准的发布是多家知名单位的多名专家学者共同编制的成果,包括OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等。《生成式人工智能应用安全测试标准》由WDTA牵头制定,为测试和验证生成式AI应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。该标准定义了人工智能应用程序架构每一层的测试和验证范围,确保AI应用各个方面都经过严格的安全性和合规性评估,保障其在整个生命周期内免受威胁和漏洞侵害。

《大语言模型安全测试方法》由蚂蚁集团牵头制定,为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。该标准提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并给出了四种不同攻击强度的分类标准,可解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力。

WDTA人工智能安全可信负责任工作组组长黄连金表示,随着人工智能系统,特别是大语言模型的广泛应用,制定全面的安全标准变得至关重要。这些标准汇集了全球AI安全领域的专家智慧,填补了安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强公众信任。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

世界数字技术院发布大模型安全标准 推动AI安全评估新进程

2024-04-17 19:46:53 浏览量: 214 作者: 探索者

最近,世界数字技术院(WDTA)发布了两项国际标准,即《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》,这标志着国际组织首次就大模型安全领域发布了国际标准,为全球人工智能安全评估和测试树立了新的基准。

这两项标准的发布是多家知名单位的多名专家学者共同编制的成果,包括OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等。《生成式人工智能应用安全测试标准》由WDTA牵头制定,为测试和验证生成式AI应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。该标准定义了人工智能应用程序架构每一层的测试和验证范围,确保AI应用各个方面都经过严格的安全性和合规性评估,保障其在整个生命周期内免受威胁和漏洞侵害。

《大语言模型安全测试方法》由蚂蚁集团牵头制定,为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。该标准提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并给出了四种不同攻击强度的分类标准,可解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力。

WDTA人工智能安全可信负责任工作组组长黄连金表示,随着人工智能系统,特别是大语言模型的广泛应用,制定全面的安全标准变得至关重要。这些标准汇集了全球AI安全领域的专家智慧,填补了安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强公众信任。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号