新闻中心
成立人工智能安全工作组,MLCommons宣布迈出重要一步
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息和偏见。与其他复杂技术一样,社会需要行业标准的安全测试来实现效益,同时将风险降至最低。
新平台将允许用户选择测试库中的基准,并将这些基准的结果汇总为有用且易于理解的分数。这类似于其他行业的标准,例如汽车安全测试评级和能源星级评分
这项工作的当务之急是支持更严格、更可靠的人工智能安全测试技术的快速发展。AIS工作组将利用其成员和更大的人工智能社区的技术和运营专业知识,帮助指导和创建人工智能安全基准技术。
埃因霍温理工大学机器学习(ML)副教授Joaquin Vanschoren表示:“广泛的人工智能社区正在制定的安全基准具有开放性和动态性,这为制定和实现共同目标创造了真正的激励。”“如果任何人看到未解决的安全问题,他们都可以提出新的测试。我们有一些世界上最聪明的人聚在一起实际解决这些问题,使用基准意味着我们将清楚地了解哪些人工智能模型最能解决安全问题。”
重写后的内容:重点是开发大型语言模型(LLM)的安全基准,并以斯坦福大学基础模型研究中心(CRFM)和语言模型整体评估(HELM)的研究人员的开创性工作为基础。除了在HELM框架上建立并纳入许多安全相关测试外,工作组还希望一些公司将其内部用于专有目的的人工智能安全测试公开化,并与MLCommons社区分享,以加快创新步伐
基础模型研究中心主任Percy Liang表示:“我们开发HELM这一模块化评估框架已经有大约2年的时间了。我很高兴能与MLCommons合作,利用HELM进行人工智能安全评估,这是我思考了7年的课题,随着强大的基础模型的兴起,这一课题变得极其紧迫。“
AIS工作组认为,随着测试的成熟,标准的人工智能安全基准将成为人工智能安全方法的重要组成部分。这与负责任的人工智能技术发展和基于风险的政策框架相一致,例如几家科技公司于2025年7月向美国白宫做出的关于安全、安保和信任的自愿承诺、NIST的人工智能风险管理框架以及欧盟即将出台的《人工智能法》。
MLCommons致力于支持行业和学术界的广泛利益相关者,共同开发共享的数据、工具和基准,以更加高效地构建和测试人工智能系统。MLCommons执行董事D*id Kanter表示:“我们非常高兴能够与会员们合作。明年,我们将着重于构建和推广人工智能安全基准,首先从开源模型入手,旨在在初步方法验证后将这些基准广泛应用于其他LLM。”
首次参与AIS工作组的包括一个由人工智能专家组成的多学科小组,包括:Anthropic、Coactive AI、Google、Inflection、Intel、Meta、Microsoft、NVIDIA、OpenAI、高通,以及埃因霍温理工大学的学者Joaquin Vanstoren、斯坦福大学的Percy Liang和芝加哥大学的Bo·Li。学术界和产业界的研究人员和工程师以及民间社会和公共部门的领域专家均可参加工作组。点击阅读原文,了解如何参与AIS工作组。
关于MLCommons
MLCommons是一个世界领先的组织,致力于构建人工智能基准。它是一个开放的工程联盟,
旨在通过基准和数据的使用,帮助每个人更好地进行机器学习。MLCommons的起源可以追溯到2018年的MLPerf基准,这个基准迅速发展成为一系列行业指标,用于衡量机器学习性能,并提高机器学习技术的透明度。MLCommons与125多个成员、全球技术提供商、学者和研究人员合作,专注于通过基准和指标、公共数据集和最佳实践来共同构建整个机器学习行业的工具
以上就是成立人工智能安全工作组,MLCommons宣布迈出重要一步的详细内容,更多请关注其它相关文章!
# 美图
# 贵阳搜索seo精准获客
# 鄂州seo推广公司
# 那曲seo外包公司
# seo和推广专员的区别
# 农业考古网站建设
# 珠海英文网站建设
# 公司用营销推广
# 宝安提供网站建设哪个好
# 智能化网站建设报价
# seo投诉k站
# 安全
# 芝加哥大学
# 新能源
# 将于
# 互动
# 欧盟
# 麦当劳
# 这一
# 斯坦福大学
# 关键词
# 人工智能
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
soup是什么意思
折叠屏手机为什么凉凉
三星相机里power是什么意思
固态硬盘损坏如何修复
华硕k20ce怎么装win7
华为5g手机怎么用4g网络
春运什么时候开始抢票
ftp$如何执行宏命令
苹果16会升级哪些
春运高速高铁抢票攻略
如何使硬盘升级固态硬盘
苹果16系统有哪些缺陷
苹果16会有哪些更新
夸克绑定设备是什么意思
苹果16新增哪些功能
虚拟机服务器如何关机命令
华为如何面对苹果16
喇叭上POWER4欧是什么意思
雅迪电动车上的power是什么意思
春运抢票哪个平台好抢
双十一哪一天买比较便宜?
j*a 数组怎么循环输出
db2命令中如何去到指定的副本
python 如何执行linux命令
typescript和哪个语音很像
有什么基础可以学typescript
dos命令 如何将变量 作为路径的一部分
如何由js快速切换typescript
春运抢票可以抢几张
vb中的datediff函数怎么用 VB中的DateDiff函数:详尽指南
为什么youtube音乐打不开
如何用命令连接mysql
苹果16将会带来哪些升级
为什么用typescript
市盈率底下 18A 19E 是什么意思
混合固态硬盘如何分区
估值水平比较中市盈率E是什么意思
如何在命令行执行存储过程
video是什么意思
如何去除计算器的命令
j*a怎么用json数组
苹果16有哪些改装模式
如何在固态硬盘上安装win7系统
夸克为什么老是投屏失败
如何使用批处理命令编译vc程序
如何学习typescript
折叠屏手机信号哪个最强
单片机*计步器怎么用
命令行ftp如何创建目录
为什么夸克无法注销账户


2023-10-30
浏览次数:次
返回列表