新闻中心

从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题

2025-02-15
浏览次数:
返回列表

腾讯ai lab联合苏州大学、上海交通大学团队的研究揭示了长推理模型的“思考不足”现象,并提出了一种改进方法。这项研究发表于arxiv,通讯作者为腾讯专家研究员涂兆鹏。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

研究发现,类似OpenAI o1等长推理模型,虽然展现出强大的深度思考能力,但在解决复杂问题时,往往会频繁切换思路,无法深入思考某个方向,导致最终答案错误。 研究团队将这种现象称为“思考不足”(Underthinking),并将其比喻为模型的“注意力缺陷多动障碍”。

图片

  • 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs
  • 论文地址:https://www.php.cn/link/3e33f40836bd425bbdf92b71cc707cee

研究团队通过分析不同难度级别的数学问题,发现模型在难题上的错误答案往往伴随着更多的思路切换和更长的 token 数量,但准确率并未提升。 他们进一步提出了一种“思考不足”评分机制,定量评估模型在错误回答中推理效率的低下程度。

Reachout.ai Reachout.ai

一个AI驱动的视频开发平台,专为忙碌的企业家和销售团队打造

Reachout.ai 142 查看详情 Reachout.ai

图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片图片

为解决这个问题,研究团队提出了一种名为“思路转换惩罚”(Thought Switching Penalty,TIP)的解码策略,通过惩罚思路切换行为来鼓励模型更深入地思考。实验结果表明,TIP策略能够有效提升模型的准确率并降低“思考不足”现象。 这项研究为改进长推理模型提供了新的思路和方法。

以上就是从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题的详细内容,更多请关注其它相关文章!


# ai  # 户网站建设的不全.  # 如何应对  # 不透  # 开源  # 你该  # 句话  # 网易  # 提出了  # 腾讯  # 太多  # 神技  # deepseek  # switch  # 工程  # 长沙搜狗网站推广技术  # seo顾问相信  # 泉州seo站外优化  # 广东seo全网推广  # 湖南seo软件怎么装  # 学校官网seo优化建议  # 网站建设项目申请  # 凌海家装网站建设  # 十堰酒店推广招聘网站 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 树莓派命令行如何新建文件  双十一的哪一天最优惠呢  酷我音乐怎么改每日推荐 酷我音乐每日推荐修改方法  2026年将会大爆发的15个新科技  交管12123协议头不完整怎么解决  固态硬盘如何下载网页  苹果16有哪些可以设置  如何安装台式机固态硬盘  为什么程序员热爱typescript  固态硬盘如何测试好坏  如何用命令下载服务器网站  hen是什么意思  苹果16更新了哪些软件  平仓是什么意思?  市盈率静是什么意思  春运抢票要用抢票软件吗  单片机怎么进行排序操作  汽车中控导航机power线是什么意思  如何进入cmd命令行  电动车power灯亮是什么意思  电瓶车屏幕上显示power是什么意思  制冰机power1灯亮是什么意思  夸克为什么会变小  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  单片机怎么定义字符长度  联想手机如何输入命令行  如何加装固态硬盘  五十铃x-power是什么意思  命令行下如何导出数据库  i5 6500怎么装win7  新固态硬盘如何装系统  drawing是什么意思  索尼type-c接口是什么  固态硬盘如何查看盘符  固态硬盘4k如何看  如何更新苹果ios16  如何用命令查看本机的操作系统  如何通过命令行聊天  cron表达式在线工具有哪些  什么是域名解析地址  单片机串口接收怎么实现  苹果16配置参数有哪些  play的三人称单数和过去式  如何更新固态硬盘固件  单片机蓝牙怎么开启设备  linux如何用命令修改ip  2025年哪个局域网聊天软件好用  华为5g手机掉了怎么定位找回  类似微信的聊天软件有哪些  苹果16有哪些款式的 

搜索