新闻中心
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(teleai)成功完成国内首个基于全国产化万卡集群训练
的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 telechat2-115b。这是由中国电信集团 cto、首席科学家、中国电信人工智能研究院(teleai)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。telechat2-115b 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 ai 平台”训练完成,在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性,实现了 gpu 同等算力计算效率的 93% 以上,同时模型有效训练时长占比达到 98% 以上。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

在今年5月的OpenCampass测试榜单中,TeleChat系列模型的逻辑推理能力名列开源大模型榜单第一。
TeleChat2-115B在C-Eval评测中排名第一
易标AI
告别低效手工,迎接AI标书新时代!3分钟智能生成,行业唯一具备查重功能,自动避雷废标项
135
查看详情
作为新一代版本,TeleChat2-115B在9月最新公布的C-Eval评测Open Access模型综合榜单中,以86.9分的成绩排名第一。其通用能力较TeleChat系列模型提升近30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。

TeleChat2-115B在C-Eval Open Access模型综合榜单中排名第一
TeleChat2在模型训练与数据构建方面的研究经验
针对超大参数模型训练,TeleAI采用大量小模型进行Scaling,验证不同模型结构的有效性。同时,基于小模型实验结果反馈,采用回归预测模型,得到较优数据配比。
上述策略大幅提升了大参数模型最优方案的搜寻效率。此外,TeleAI通过实验验证探索了退火最佳数据量、最佳配比和学习率变化方式,进一步提升了模型训练效果。
在Post-Training(后训练)方面,TeleAI针对数学、代码和逻辑推理等内容合成了大量问答数据,用于SFT(监督式微调)第一阶段模型训练。其次,采用迭代式更新策略,使用模型对Prompt(提示词)数据进行指令复杂性提升与多样性扩充,通过模型合成和人工标注提升答案质量,利用拒绝采样获取优质SFT数据及RM(奖励模型)代表性数据,用于SFT训练和DPO(偏好对齐)训练,以及模型效果迭代。
TeleAI自研语义大模型获多项权威赛事第一名
连获中国计算语言学大会(CCL2025)挑战赛两项冠军:TeleAI在CCL2025大会获得中文空间语义理解评测和古文历史事件类型抽取评测两项第一名。在古文历史事件类型抽取评测任务挑战赛中,在所有子任务均取得第一名的情况下,获得了综合排名第一。
NLPCC2025中文议论文挖掘(Shared Task5)挑战赛冠军:TeleAI语义团队优化了大模型的上下文学习策略,通过Prompt设计、多模型投票机制等手段,提高了模型准确率和鲁棒性,最终排名第一。
开源共享,引领创新
TeleChat2-115B的开源标志着大模型国产化迈进了新征程。TeleAI积极通过开源推动大模型技术的进步,引领技术创新向产业落地快速跃迁。
开源地址:
GitHub:https://github.com/Tele-AI/TeleChat2Gitee:https://gitee.com/Tele-AI/tele-chat2Modescope:https://modelscope.cn/models/TeleAI/TeleChat2-115BModelers:https://modelers.cn/models/TeleAI/TeleChat2-115B
以上就是重磅!TeleAI 完成首个全国产化万卡万参大模型训练的详细内容,更多请关注其它相关文章!
# 产业
# 句话
# 微网站建设与设计论文
# 石碣服装网站推广企业
# seo是怎么挖掘的
# 临汾关键词排名厂家
# 聊城抖音关键词排名推荐
# 唐山营销推广工厂招聘
# 桂林智能网站建设项目
# 浙江关键词排名没有了
# seo是个啥
# 网站推广排名首推金苹果
# 之争
# 五大
# 华纳
# 南极
# 榜单
# 神技
# 开源
# 中国电信
# 首个
# access
# git
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
苹果16日发售哪些机型
市盈率ttm是什么意思
虚拟机服务器如何关机命令
系统如何装在固态硬盘
市盈率ttm市盈动静是什么意思
微波炉power中文是什么意思
课程伴侣电脑怎么登录
营收和gmv区别_营收和gmv有什么区别
excel中datediff函数怎么用
typescript卸载不掉怎么办
苹果16哪些型号好
typescript怎么理解的
5g手机怎么没视频通话功能
固态硬盘 如何分区
金色cmyk色值是多少
a股等权平均市盈率是什么意思
vs怎么编写typescript
8800日元等于多少人民币
固态硬盘如何外接
put linux命令如何书写
汽车上power是什么意思
vue组件typescript怎么用
2025年哪个局域网聊天软件好用
学typescript需要多久
j*a怎么创建json数组
单片机学习视频怎么调色
typescript如何遍历map
angluar如何命令删除dist
typescript为什么现在才火
一帧是多少秒
手机如何ip绑定域名解析
苹果16有哪些改善
春运抢票哪个城市好抢
如何以命令符运行程序
如何去除计算器的命令
如何管理员打开cmd命令行窗口
多少毫安的充电宝可以带上飞机
怎么在项目中使用typescript
摩托车上power是什么意思
喇叭上POWER4欧是什么意思
如何开发typescript
typescript解决了什么
如何给电脑加装固态硬盘
智能锁type-c接口是什么
linux如何合并分区命令
苹果16要升级哪些功能
折叠屏手机共有哪些
j*a怎么求数组均值
得物上怎么样申请退换货 得物上退换货详细指南(包含海外)
新的固态硬盘如何分区


2024-09-29
浏览次数:次
返回列表