新闻中心
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
在openai发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃起来:yi大模型家族新成员,“yi-1.5”模型正式开源。这一举措将进一步推动开源大模型社区的发展,为人工智能技术的普及和应用创造更多机会。
在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GitHub 地址:https://github.com/01-ai/Yi-1.5
Hugging Face 模型下载地址:https://huggingface.co/01-ai
已理解,下面是对原内容的微调重写: 我理解了,Yi-1.5是Yi-1.0的持续预训练版本,使用500B个token来提高编码、推理和指令执行能力,并在300万个指令调优样本上进行了精细调整。
刚一发布,就已经有开发者跃跃欲试:

并收获了好评:

与前序模型相比,Yi-1.5 系列模型进一步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出,Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B,几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。




重磅消息当然不止这一个。
在成立一周年之际,零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。

Yi 大模型 API 开放平台 (https://platform.lingyiwanwu.com/)
其中,千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景,每百万 token 的价格是 20 元,是 GPT-4-turbo 的三分之一。
易标AI
告别低效手工,迎接AI标书新时代!3分钟智能生成,行业唯一具备查重功能,自动避雷废标项
135
查看详情

Yi-Large-Turbo API 则根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景。Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读 20 万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。
其中特别要提到的是发布会现场正式亮相的千亿参数 Yi-Large 闭源大模型。Yi-Large 面世的同时即正式进军全球 SOTA 顶级大模型之首。可以看到,与 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等当前顶级模型的较量中,Yi-Large 在绝大多数情况下取得了优势。

同时,在斯坦福大模型排行榜 AlpacaEval 的英语评测中,Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中,Yi-Large 一跃成为国产大模型 No. 1。

中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 也位列国产大模型之首,Yi-Large 的综合中英双语能力皆展现了卓越的性能。
在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4-0409 等国际厂商的最新旗舰模型互有胜负。

Yi-XLarge 初期训练中评测(2025 年 5 月 12 日)。
至此,零一万物已经建立了「双轨模型策略」。

近期上线的一站式 AI 工作站「万知」(wanzhi.com/ 微信小程序「万知 AI」)则是零一万物基于世界领先的闭源模型 Yi-Large 所做出的「模应一体」生产力应用。

而对于大众和行业最关心的「大模型落地如何产生价值」的命题,李开复指出,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到「TC-PMF」(Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度)。大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的 ofo 式流血烧钱打法,让大模型能够用健康良性的 ROI 蓄能长跑。
在李开复博士看来,自研 AI Infra 是零一万物必然要走的路,零一万物也自成立起便将 AI Infra 设立为重要方向,着力于实现计算效率的优化。AI Infra(AI Infrastructure 人工智能基础架构技术)主要涵盖大模型训练和部署提供各种底层技术设施。这也基于一个既定事实,很多大模型公司没有美国大厂的 GPU 数量,因此要采取更务实的战术和战略。
零一万物着力于实现计算效率的优化,经过多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。
以上就是零一万物Yi-1.5来了,国产开源
大模型排行榜再次刷新的详细内容,更多请关注其它相关文章!
# 零一万物
# 产业
# 都能
# 适用于
# 开源
# 来了
# ll
# qwen
# claude
# gemini
# hugging face
# apache
# git
# yi-1.5
# 沈阳网站建设排名推广
# 餐饮加盟网站优化传播
# 萧县seo优化推广价格
# 泰州郑州网站优化
# 天津招商网站推广怎么样
# 推广字样的网站叫什么
# 苏州营销推广中心电话
# 400网站建设
# 广东网站建设渠道是什么
# 九龙坡seo优化关键词排名推广
# 五大
# 可以看到
# 李开复
# 这一
# 华纳
# 南极
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
typescript是什么类型的语言
春运抢票需要什么软件抢
windows 如何连接ftp命令行
kingston是什么_kingston是什么意思
征信不好如何恢复正常 征信不好要怎么样才能恢复正常教程
夸克加载什么要会员
sausage是什么意思
阿里云盘扩容是什么_扩容阿里云盘方法是什么教程
折叠屏手机哪款最好
单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐
树莓派命令行如何新建文件
单片机面包板怎么插
typescript是做什么用的
单片机串口接收怎么实现
怎么看手机是不是双模5g手机
哪些编程软件需要typescript
cron表达式在线工具有哪些
智能锁type-c接口是什么
估值水平比较中市盈率E是什么意思
j*a数组逆序怎么写
苹果16更新了哪些功能
typescript变量是什么
1kb等于多少字节
电焊机power灯亮是什么意思
推特是什么软件国内可以使用吗
金色cmyk色值是多少
苹果16有哪些黑科技
如何进入 dos 命令行
8寸照片尺寸多少厘米
软件命令行参数如何设置
统计学中power值是什么意思
md5解密是什么意思
url解码什么意思
考勤机power红灯是什么意思
typescript全局配置放哪里
dos命令如何复制目录结构
域名解析后为什么要进行域名备案
三星固态硬盘如何保修
typescript哪个最好
vivo怎么投屏到电视看爱奇艺教程
市盈率回落是什么意思
solo交友软件怎么恢复聊天记录
typescript怎么用
typescript如何开发
联想的固态硬盘如何
一年多少周
导航power在汽车上是什么意思
为什么夸克网盘下载不了
电脑如何查看固态硬盘
typescript怎么判断单选按钮


2024-05-14
浏览次数:次
返回列表