新闻中心

BBC联合评估多款AI新闻摘要表现,谷歌Gemini错误比例最高!

2025-10-30
浏览次数:
返回列表

生成式ai在信息整合上展现出巨大潜力,其产出的内容常常令人印象深刻。然而,深入探究便会发现,该技术在实际应用中依然存在诸多不足。

近期,欧洲广播联盟(EBU)与英国广播公司(BBC)联手对ChatGPT、Gemini以及Perplexity等主流AI系统在新闻摘要生成方面的能力进行了全面评估。这项研究的背景在于,当前已有约15%的25岁以下年轻人将AI作为获取新闻的主要渠道。

项目初期,BBC通过大规模问卷调查及六场焦点小组访谈,收集了公众对AI新闻工具的实际使用感受和观点,随后EBU将此项研究推广至国际层面。结果显示,大约42%的英国成年人认为AI生成内容具备准确性,而年轻用户群体对此的信任程度更高。但值得注意的是,高达84%的受访者表示,一旦发现事实性错误,他们对AI的信任将大打折扣。

那么,这些系统的“不准确”程度究竟有多高?用户又是否能察觉这些错误?研究揭示,大多数由AI生成的新闻摘要都存在问题。尽管各模型整体表现相近,但谷歌Gemini却成为显著例外——其错误总数最多,且严重错误的比例远超其他平台。

报告指出,Gemini存在的主要缺陷包括:

Mistral AI Mistral AI

Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台

Mistral AI 182 查看详情 Mistral AI
  • 未能提供清晰可靠的资料来源链接
  • 无法有效区分真实信息与讽刺性内容
  • 过度依赖维基百科作为信息源
  • 缺乏必要的上下文支撑
  • 存在原文引用错误的情况

在为期六个月的观察期内,所有参与测试的AI系统均展现出一定程度的进步,新闻摘要的准确率普遍上升,其中Gemini的改进尤为突出。然而,即便如此,其整体表现仍明显逊色于其他竞争者。

报告链接:News Integrity in AI Assistants

以上就是BBC联合评估多款AI新闻摘要表现,谷歌Gemini错误比例最高!的详细内容,更多请关注其它相关文章!


# 谷歌  # gemini  # 英国  # 接棒  # 欧洲  # perplexity  # gpt  # chatgpt  # ai  # 工具  # 缺书网站建设方案小学  # 海南抖音seo品牌排行  # seo关键词优化文档  # 陕西网站建设小程序  # 确山网站推广电话  # 许昌seo营销推广技巧  # 推广营销是什么意思  # 网站优化知识文案  # seo优化推广哪家实惠  # 万科营销推广语  # 相关文章  # 暗讽  # 最多  # 又是  # 明年  # 的是  # 多款 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 虽千万人吾往矣什么意思  征信不好如何快速恢复 征信不好快速恢复的方法  怎么下载360桌面壁纸  j*a数组求和怎么算  光刻机分类有哪些品牌的  solidworks打开IGS文件作图教程  8英寸等于多少厘米  如何选择启用固态硬盘  单片机*计步器怎么用  苹果手机16系统有哪些  typescript怎么使用map  阿里云手机云盘怎么用_阿里云盘苹果手机怎么用教程  春运预约抢票能抢到吗  苹果16主打颜色有哪些  镜像ao3链接入口  苹果16充电方式有哪些  爱玛电动车power模式是什么意思  三星固态硬盘如何保修  市盈率为负值是什么意思  如何看固态硬盘型号  记录仪power灯亮是什么意思  vue项目如何用typescript  三菱变频器POWER是什么意思  命令行如何打开文件  typescript哪个最好  typescript全局配置放哪里  市盈率负值是什么意思  如何利用固态硬盘  苹果16更新了哪些软件  夸克网盘是什么都有吗  安全的ao3镜像网站链接入口  typescript解决了什么  春运抢票还用取票吗  如何用chown命令  征信不好如何恢复信誉度 ‌征信不好恢复信誉度的方法  通配符的用法  哪些明星在用苹果16  苹果16更新了哪些版本  juice是什么意思  苹果16更新了哪些功能  如何选购ssd固态硬盘  如何进入cmd命令行  ospf中交换机命令如何设置  电动车power灯亮是什么意思  华为使用nfc功能是什么意思  typescript能开发什么  typescript如何开发  kingston是什么_kingston是什么意思  固态硬盘如何4k对其  反向春运抢票方式 

搜索