新闻中心
OpenAI加强安全团队,授予其权力以否决危险人工智能
生产中的模型由“安全系统”团队管理。开发中的前沿模型有“准备”团队,该团队会在模型发布之前识别和量化风险。然后是“超级对齐”团队,他们正在研究“超级智能”模型的理论指南
将安全顾问小组重新组建,使其位于技术团队之上,以便向领导层提出建议,并给予董事会否决的权力
OpenAI宣布,为了抵御有害人工智能的威胁,他们正在加强内部的安全流程。他们将设立一个名为“安全顾问小组”的新部门,该部门将位于技术团队之上,向领导层提供建议,并被授予董事会否决权。这一决定于当地时间12月18日宣布
更新引起关注的原因主要是因为OpenAI首席执行官山姆·奥特曼被董事会解雇,而这似乎与大型模型的安全问题有关。在高层人事变动后,OpenAI董事会的两位“减速主义”成员伊尔亚·苏茨克维和海伦·托纳失去了董事会席位
在这篇文章中,OpenAI讨论了他们最新的“准备框架”,即OpenAI如何跟踪、评估、预测和防范日益强大的模型所带来的灾难性风险。灾难性风险的定义是什么?OpenAI解释道,“我们所说的灾难性风险是指可能导致数千亿美元经济损失,或者导致许多人严重伤害或死亡的风险,这也包括但不限于生存风险。”
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

有三组安全团队分别覆盖不同的时间框架和风险
根据OpenAI官网的资料,生产中的模型由“安全系统”团队负责管理。而在开发阶段,有一个名为“准备”的团队,他们会在模型发布之前识别和评估风险。此外,还有一个名为“超级对齐”(superalignment)的团队,他们正在研究“超级智能”(superintelligent)模型的理论指南
OpenAI团队将对每个模型根据四个风险类别进行评级,这四个类别分别是网络安全、说服能力(如虚假信息)、模型自主性(即自主行为能力)以及CBRN(化学、生物、放射性和核威胁,例如创造新病原体的能力)
OpenAI在假设中考虑了各种缓解措施:例如,该模型对于描述制作凝固汽油或管式炸弹的过程保持着合理的保留态度。在考虑已知的缓解措施后,如果一个模型仍然被评估为具有“高”风险,它将无法被部署,如果一个模型存在任何“关键”风险,将不会进一步开发
并非所有制作模型的人都是评估模型和提出建议的最佳人选。出于这个原因,OpenAI正在建立一个名为“跨职能安全咨询小组”的团队,该团队将从技术层面审查研究人员的报告,并从更高的角度提出建议,希望能够发现一些“未知的未知”
这个过程要求将这些建议同时发送给董事会和领导层,领导层将决定是否继续或停止运行,但董事会有权撤销这些决定。这样可以避免高风险产品或流程在董事会不知情的情况下获得批准
然而,外界仍然担心的是,如果专家小组提出建议,首席执行官根据这些信息做出决策,OpenAI的董事会是否真的有权利进行反驳并采取行动?如果他们这样做了,公众会听到相关声音吗?目前,除了OpenAI承诺征求独立第三方审计之外,他们的透明度问题实际上并没有得到真正的解决
OpenAI的“准备框架”包含以下五个关键要素:
1. 评估和打分
我们将对我们的模型进行评估,并持续更新我们的“记分卡”。我们将评估所有最新的模型,包括在训练期间将有效计算量增加两倍。我们将推动模型的极限。这些发现将有助于我们评估最新模型的风险,并衡量任何拟议的缓解措施的有效性。我们的目标是探测特定边缘的不安全因素,以有效地减轻风险。为了跟踪我们模型的安全水平,我们将制作风险“记分卡”和详细报告
VALL-E
VALL-E是一种用于文本到语音生成 (TTS) 的语言建模方法
134
查看详情

要评估所有前沿模型,需要使用“记分卡”
设定风险阈值的目的是为了在进行决策和管理风险时能够有一个明确的界限。风险阈值是指在特定情况下,组织或个人愿意承受的最大风险水平。通过设定风险阈值,可以帮助组织或个人识别出何时需要采取行动来减轻风险或避免风险。风险阈值的设定应基于风险评估的结果、相关法规和政策以及组织或个人的风险承受能力。在设定风险阈值时,需要考虑到不同风险类型的特点和影响程度,以确保风险管理措施的有效性和适用性。最后,设定的风险阈值应定期进行评估和调整,以保持与组织或个人的风险管理目标相一致
我们将设定触发安全措施的风险阈值。我们根据以下初步追踪类别设定了风险级别的阈值:网络安全、CBRN(化学、生物、放射性、核威胁)、说服和模型自主。我们指定了四个安全风险级别,只有缓解后得分为“中”或以下的模型才能被部署;只有缓解后得分为“高”或以下的模型才能进一步开发。对于具有高风险或严重风险(缓解前)的模型,我们还将实施额外的安全措施

危险水平
重新设定监督技术工作和安全决策运营结构
我们将设立一个专门的团队来监督技术工作和安全决策的运营结构。准备团队将推动技术工作,以检查前沿模型的能力极限,并进行评估和综合报告。这项技术工作对于OpenAI安全模型的开发和部署决策至关重要。我们正在创建一个跨职能的安全咨询小组,以审查所有报告,并同时发送给领导层和董事会。尽管领导层是决策者,但董事会拥有推翻决定的权力

监督技术工作和安全决策运营结构的新变化
增强安全性和加强对外部问责制
我们将制定协议以提高安全性和外部责任。我们将定期进行安全演习,以压力测试我们的业务和自身文化。一些安全问题可能会迅速出现,因此我们有能力标记紧急问题以进行快速响应。我们认为,从OpenAI外部人员那里获得反馈并由合格的独立第三方进行审核是很有帮助的。我们将继续让其他人组成红队并评估我们的模型,并计划与外部共享更新
减少其他已知和未知的安全风险:
我们将协助减少其他已知和未知的安全风险。我们将与外部各方以及内部的安全系统等团队密切合作,以跟踪现实世界中的滥用情况。我们还将与“超级对齐”合作,跟踪紧急的错位风险。我们还开创了新的研究,以衡量风险随着模型规模扩展而演变的情况,并帮助提前预测风险,这类似于我们早期在规模法则方面取得的成功。最后,我们将进行连续的流程,以尝试解决任何新出现的“未知的未知”
以上就是OpenAI加强安全团队,授予其权力以否决危险人工智能的详细内容,更多请关注其它相关文章!
# 开源
# 益阳网站优化报价多少
# 宁波网站seo哪家好
# 小酒吧营销推广文案范文
# 网站seo优化招聘
# 菏泽网站推广是什么平台
# 长宁区营销推广诚信企业
# 吴中网站优化排名方案
# seo从哪里开始
# 加强营销推广的方法
# 亚马逊seo商标留痕
# 风险管理
# OpenAI
# 首席执行官
# 山姆
# 记分卡
# 将与
# 第三方
# 将对
# 会在
# 是指
# 危险AI
# 安全团队
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
夸克为什么老是投屏失败
16苹果有哪些机型
固态硬盘2m如何修复
typescript性能如何
固态硬盘4k如何看
广东春运抢票怎么抢不到
ip dhcp是什么意思
typescript是什么软件
如何以管理员身份打开cmd命令行窗口
sqlite中datediff函数怎么用 SQLite中DATEDIFF()函数的用法分享
固态硬盘颗粒如何修理
三星固态硬盘如何保修
如何退出数据库命令行
划水是什么意思
红米手机怎么设置变成5G手机
typescript怎么使用map
angluar如何命令删除dist
微信最多可以加多少好友
如何体验苹果16系统
如何编写一个linux命令
问一下市盈率是什么意思
计数器上power是什么意思
typescript学会要多久
如何判断固态硬盘
如何通过命令检测u盘启动
估值水平比较中市盈率E是什么意思
typescript解决了什么
typescript怎么加号
光刻机的分类及其优缺点
云淡风轻什么意思
linux命令行如何使用中文输入法
区块链的热闹将何去何从?
360n6锁屏壁纸怎么设置
春运抢票极速版怎么抢票
如何安装大华固态硬盘
充电器上的power是什么意思
ai文件里无法找到链接文件要怎么解决步骤
如何清理固态硬盘
折叠屏手机为什么凉凉
夸克缺什么登录不了
vivo怎么投屏到电视看爱奇艺教程
51单片机贴片怎么*
linux如何跳回命令行界面
更换固态硬盘如何检查
笔记本如何使用固态硬盘
台达plc只有power灯亮是什么意思
市盈率为负值是什么意思
电脑命令如何删除账号
calm是什么意思
广东春运抢票怎么抢的


2023-12-19
浏览次数:次
返回列表