新闻中心

阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4

2023-10-31
浏览次数:
返回列表

10月31日,阿里云正式发布千亿级参数大模型通义千问2.010个权威测评中,通义千问2.0综合性能超过gpt-3.5,正在加速追赶gpt-4。当天,通义千问app在各大手机应用市场正式上线,所有人都可通过app直接体验最新模型能力。

过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4

图:通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4


短影AI 短影AI

长视频一键生成精彩短视频

短影AI 170 查看详情 短影AI

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。

中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4

图:通义千问2.0发布


通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。

与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手通义星尘-个性化角色创作平台通义点金-智能投研助手通义晓蜜-智能客服通义仁心-个人专属健康助手通义法睿-AI法律顾问8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4

图:通义大模型家族全面升级,8大行业模型组团上线


截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。

阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4

图:通义千问72B即将开源

以上就是阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4的详细内容,更多请关注其它相关文章!


# 通义千问  # 通义灵码  # llama  # 官网  # 阿里云  # 官网seo企业  # 江门外贸营销推广公司招聘  # 陈村南庄网站建设公司  # 网站推广软件免费版大全  # 看书网站建设美丽文案  # 开封市重大项目网站建设  # 东莞网捷网站建设技术  # 巴盟网站优化公司  # 桂林网站推广 嶶欣hfqjwl广告稳定  # 新乡网站推广厂家有哪些  # 这是  # 榜单  # 自己的  # 下载量  # 仁心  # 将于  # 多个  # 十大  # 开源 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 对应市盈率是30X是什么意思  typescript怎么设置滚动条  j*a数组对象怎么取  虽千万人吾往矣什么意思  如何查看固态硬盘速度  苹果16颜色有哪些  双十一的哪一天最优惠呢  sofa是什么意思  苹果16配置参数有哪些  春运抢票可以抢几张  typescript 如何使用  165开头的是什么电话号码  typescript干什么的  单片机速度怎么看  1s等于多少ms  ftp$如何执行宏命令  苹果16自带配件有哪些  交管12123协议头不完整是啥意思  抖音GMV是什么_抖音GMV是什么意思  苹果16有哪些亮点功能  春运抢票软件哪个最好用  夸克网盘是什么都有吗  如何安装大华固态硬盘  小屏折叠屏手机有哪些  固态硬盘如何检查  光刻机的分类及其优缺点  阿里云盘的会员怎么用  数组和J*A怎么打  单身交友必备软件  苹果16改掉了哪些  vivo手机nfc功能是什么意思  夸克缺什么登录不了  单片机.lib文件怎么打开  typescript文件怎么打开  春运抢票哪个平台好一点  怎么在typescript定义集合  如何去掉拍电脑的纹路详细教程  空调power灯一直闪是什么意思  电脑命令如何删除账号  折叠屏有哪些手机  三星 nfc什么功能是什么意思  hp固态硬盘如何安装  手机拍显示屏有条纹怎么去除  春运抢票用不用取票码  如何使用net命令  春运抢票技巧攻略  华为交换机 配置 如何复制命令行  如何设置从固态硬盘启动  ssd固态硬盘如何安装  春运哪天抢票最好预约 

搜索