新闻中心

谷歌新方法ASPIRE:赋予LLM自我评分能力,有效解决「幻觉」问题,超越10倍体积模型

2024-01-23
浏览次数:
返回列表

大模型的「幻觉」问题马上要有解了?

威斯康星麦迪逊大学和谷歌的研究人员最近推出ASPIRE系统,使大模型能够自评输出。

如果用户看到模型的生成的结果评分不高,就能意识到这个回复可能是幻觉。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

如果系统能够根据评分结果进一步筛选输出内容,例如当评分较低时,大模型可以生成类似"我无法回答此问题"的语句,这可能最大程度地改善幻觉问题。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

论文地址:https://aclanthology.org/2025.findings-emnlp.345.pdf

ASPIRE能让LLM输出答案以及答案的置信度得分。

研究人员的实验结果表明,ASPIRE在各种QA数据集(例如 CoQA 基准)上显著优于传统的选择性预测方法。

让LLM不仅要回答问题,还要评估这些答案 。

选择性预测的基准测试上,研究人员通过ASPIRE系统取得了超过10倍规模的模型的成绩。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

就像让学生在课本后面验证他们自己的答案,虽然听起来有点不靠谱,但是细细一想,每个人在做出一道题目之后,确实会对答案的满意程度会有一个评分。

这就是ASPIRE的本质,它涉及三个阶段:

(1) 针对特定任务的调优,

(2) 答案采样,

(3) 自我评估学习。

在研究人员看来,ASPIRE不仅仅是另一个框架,它代表着一个全面提升LLM可靠性,降低幻觉的美好未来。

如果LLM可以成为决策过程中值得信赖的合作伙伴。

只要通过不断优化选择性预测的能力,人类距离充分发挥大模型的潜力就又近了一步。

研究人员希望能凭借ASPIRE,开启下一代LLM的进化,从而能创建更可靠和更具有自我意识的人工智能。

ASPIRE 的机制

针对特定任务的微调

ASPIRE执行特定于任务的微调以训练适应性参数消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型,同时冻结LLM。

给定生成任务的训练数据集,它会微调预训练的LLM以提高其预测性能。

为此,可以采用参数高效的微调技术(例如,软提示词微调和LoRA)来微调任务上的预训练LLM,因为它们可以有效地通过少量目标获得强泛化任务数据。

具体来说,LLM参数(θ)被冻结,并添加自适应参数消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型进行微调。

仅更新 θ (p) 以最小化标准 LLM 训练损失(例如交叉熵)。

这种微调可以提高选择性预测性能,因为它不仅提高了预测精度,而且还提高了正确输出序列的可能性。

答案采样

在针对特定任务进行调优后,ASPIRE使用LLM和学习到的消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型为每个训练问题生成不同的答案,并创建用于自评估学习的数据集。

研究人员的目标是生成具有高可能性的输出序列。他们使用波束搜索(Beam Search)作为解码算法来生成高似然输出序列,并使用Rouge-L度量来确定生成的输出序列是否正确。

自评估学习

在对每个查询的高似然输出进行采样后,ASPIRE添加自适应参数消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型,并且仅微调消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型来学习自评估。

由于输出序列的生成仅取决于 θ 和消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型,因此冻结 θ 和学习到的消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型可以避免在学习自评估时改变LLM的预测行为-评估。

研究人员优化了消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型,使得改编后的LLM可以自己区分正确和错误的答案。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

在这个框架中,可以使用任何参数有效的微调方法来训练消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

在这项工作中,研究人员使用软提示微调,这是一种简单而有效的机制,用于学习「软提示」来调节冻结的语言模型,从而比传统的离散文本提示更有效地执行特定的下游任务。

这种方法背后的核心在于认识到,如果能够开发出有效激发自我评价的提示,那么应该可以通过结合有针对性的训练目标的软提示微调来发现这些提示。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

在训练消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型后,研究人员通过波束搜索解码获得查询的预测(beam search decoding)。

然后,研究人员定义一个选择分数,将生成答案的可能性与学习到的自我评估分数(即,预测对于查询正确的可能性)结合起来,以做出选择性预测。

结果

刺鸟创客 刺鸟创客

一款专业高效稳定的AI内容创作平台

刺鸟创客 110 查看详情 刺鸟创客

为了证明ASPIRE的效果,研究人员使用各种开放式预训练Transformer (OPT)模型在三个问答数据集(CoQA、TriviaQA和SQuAD)上对其进行评估。

通过使用软提示调整训练消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型研究人员观察到LLM的准确性大幅提高。

例如,与使用CoQA和SQuAD数据集的较大预训练OPT-30B模型相比,采用ASPIRE的OPT-2.7B模型表现出更好的性能。

这些结果表明,通过适当的调整,较小的LLM在某些情况下可能有能力匹配或可能超过较大模型的准确性。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

当深入研究固定模型预测的选择分数计算时,ASPIRE获得了比所有数据集的基线方法更高的AUROC分数(随机选择的正确输出序列比随机选择的不正确输出序列具有更高选择分数的概率)。

例如,在CoQA基准上,与基线相比,ASPIRE将AUROC从51.3%提高到80.3%。

TriviaQA数据集评估中出现了一个有趣的模式。

虽然预训练的OPT-30B模型表现出更高的基线精度,但当应用传统的自我评估方法(Self-eval和P(True))时,其选择性预测的性能并没有显著提高。

相比之下,小得多的OPT-2.7B模型在使用ASPIRE进行增强后,在这方面表现优于其他模型。

这种差异体现了一个重要的问题:利用传统自我评估技术的较大LLM在选择性预测方面可能不如较小的ASPIRE增强模型有效。

消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型

研究人员与ASPIRE的实验之旅强调了LLM格局的关键转变:语言模型的容量并不是其性能的全部和最终目的。

相反,可以通过策略调整来大幅提高模型的有效性,即使在较小的模型中也可以进行更精确、更自信的预测。

因此,ASPIRE证明了LLM的潜力,它可以明智地确定自己答案的确定性,并在选择性预测任务中显著地超越地超越其他10倍体量的模型。

以上就是谷歌新方法ASPIRE:赋予LLM自我评分能力,有效解决「幻觉」问题,超越10倍体积模型的详细内容,更多请关注其它相关文章!


# 训练  # 榆林专业网站优化选哪家  # 开源  # 个月  # 首款  # 表现出  # 博客  # 可以通过  # 将于  # 较小  # 更高  # 给自己  # 数据  # 女生头像关键词排名软件  # 鄂州网站推广优化  # 河北哪家网站推广好用  # 骑士网站建设公司  # 兴安抖音seo  # 网站推广方法就选k火9星好棒  # 网站建设考什么  # 信息关键词排名经验  # 红桥区荥阳网站建设 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: typescript如何做项目  折叠屏手机哪个卖得最好  营收和gmv区别_营收和gmv有什么区别  折叠屏手机哪个有性价比  新的固态硬盘如何分区  j*a数组怎么新增值  手机换电池要多少钱  折叠屏有哪些手机  rxjs和typescript什么意思  锤子手机怎么不出5g  估值水平比较中市盈率E是什么意思  如何引用typescript中的方法  openwrt有哪些功能  vb中的datediff函数怎么用 ​VB中的DateDiff函数:详尽指南  自己如何安装固态硬盘  为什么进行域名解析  linux命令行如何使用中文输入法  如何更新苹果ios16  望远镜上power是什么意思  老电脑如何装固态硬盘  固态硬盘如何接主机  固态硬盘如何打开软件  舆论是什么意思  单片机怎么加死循环  typescript怎么设置滚动条  苹果16更新了哪些软件  360桌面壁纸怎么弄掉  为什么要出折叠屏手机  折叠屏手机信号哪个最强  单片机蜂鸣器响了怎么停  sqlite中datediff函数怎么用 SQLite中DATEDIFF()函数的用法分享  记录仪power灯亮是什么意思  苹果16系统有哪些缺陷  12306退票手续费最新规定  交管12123协议头不完整是什么原因  单片机是怎么计时的  如何提高import命令的性能  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  春运抢票何时开始抢票的  固态硬盘2m如何修复  360f4怎么取消百变壁纸  联想的固态硬盘如何  苹果16送哪些配件  单片机怎么控制内功率  苹果16讲解有哪些功能  免费恢复删除的微信聊天记录软件有哪些  openwrt有什么用  如何创建sql命令  空调主板单片机怎么拆开  美食音乐每日推荐怎么写 

搜索