新闻中心

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

2023-10-31
浏览次数:
返回列表

阿里云于10月31日正式发布了千亿级参数大模型通义千问2.0。根据10个权威测评结果显示,通义千问2.0的综合性能超过了GPT-3.5,并且正在快速迎头赶上GPT-4。当天,通义千问APP在各大手机应用市场上线,任何人都可以通过该APP直接体验最新模型的能力

过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 gpt-3.5,加速追赶 gpt-4。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小

中英文理解能力是大语言模型的基本功。英语任务方面,通义千问 2.0 在 MMLU 基准的得分是 82.5,仅次于 GPT-4,通过大幅增加参数量,通义千问 2.0 能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问 2.0 以明显优势在 C-Eval 基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域,通义千问 2.0 进步明显。在推理基准测试 GSM8K 中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在 HumanEval 测试中,通义千问得分紧跟 GPT-4 和 GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

通义千问 2.0 发布

通义千问更成熟了,也更好用了。通义千问 2.0 在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。

短影AI 短影AI

长视频一键生成精彩短视频

短影AI 170 查看详情 短影AI

与此同时,基于通义大模型训练的 8 大行业模型组团上线,他们分别是通义灵码 - 智能编码助手、通义智文 - AI 阅读助手、通义听悟 - 工作学习 AI 助手、通义星尘 - 个性化角色创作平台、通义点金 - 智能投研助手、通义晓蜜 - 智能客服、通义仁心 - 个人专属健康助手、通义法睿 - AI 法律顾问。8 大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK 调用等方式,将模型能力集成到自己的大模型应用和服务中。

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

通义大模型家族全面升级,8 大行业模型组团上线

截至到10月份,阿里云已经与60多个行业的领军伙伴开展了深度合作,推动通用千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的实际应用

周靖人表示,阿里云计划在不久的将来开源通义千问的72B版本。此前,阿里云已经先后开源了7B和14B版本的模型,这些模型的累计下载量已经超过100万。阿里云将继续支持各行业的开发者利用通义千问开源模型进行模型和应用的创新

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

通义千问 72B 即将开源

以上就是千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4的详细内容,更多请关注其它相关文章!


# 最好用  # 招商网站推广欢迎咨询  # 企业小程序正品网站推广  # 浙江短视频营销推广公司  # 台州抖音营销推广地址  # 鹏飞seo博客  # 长治网站推广优化公司  # 寿光网站建设方式优化  # 广州外包seo公司  # 杭州优化seo公司排名  # 徐汇区推广网站优化价格  # 或将  # 欧盟  # 入门  # 官网  # 免费试用  # 仁心  # 新能源  # 多个  # 自然语言  # 开源  # llama  # 通义灵码  # 通义千问  # 通义千问2.0  # 千亿参数 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 咋免费领取爱奇艺会员 如何免费领取爱奇艺会员步骤  光刻机分类有哪些品牌的  如何拍屏幕不出条纹详细方法  如何以管理员身份打开cmd命令行窗口  电脑5G怎么上传手机  typescript需要学多久  type-c接口接地是什么意思  光刻机是干什么用的  ping命令如何看问题  春运抢票准备什么  固态硬盘如何区分好坏  小屏折叠屏手机有哪些  春运提前抢票攻略  j*a map数组怎么取值  如何利用运行命令查看声音启动  如何用命令打开光驱  软件命令行参数如何设置  苹果16颜色有哪些  固态硬盘如何接主机  win7如何打开命令行窗口  oracle中datediff函数怎么用 Oracle中DATEDIFF函数详解  春运高速高铁抢票攻略  自己如何加装固态硬盘  爱奇艺视频怎么下载到手机u盘怎么转换格式方法  折叠屏有哪些手机  台达变频器power灯是什么意思  双十一的哪一天最优惠呢  typescript和es6先学哪个  按键精灵datediff函数怎么用 如何使用按键精灵中的Datediff函数教程  新找到ao3镜像网站链接入口  没网环境如何安装typescript  闪光灯power闪烁是什么意思  react怎么用typescript  苹果16有哪些不同  春运哪天抢票最好  linux如何查看命令的参数  有什么基础可以学typescript  单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐  台机如何安装固态硬盘  linux如何打开命令窗口  折叠屏手机为什么这么小  市盈率动亏损是什么意思  51单片机怎么用flash  哪些编程软件需用typescript  ai文件里无法找到链接文件怎么解决  免费恢复删除的微信聊天记录软件有哪些  固态硬盘如何外接  一秒是多少毫秒  春运抢票用不用取票码  为什么夸克流畅播失败 

搜索