新闻中心
面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络
aigc的爆发除了带来算力上的挑战,对网络的要求也达到了前所未有的高度。
6月26日,腾讯云首次对外完整披露自研星脉高性能计算网络:星脉网络具备业界最高的3.2T通信带宽,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升。腾讯云的新一代算力集群HCC可以支持超过10万卡的巨大计算规模。
腾讯云副总裁王亚晨表示:“星脉网络是为大模型而生。它所提供的大带宽、高利用率以及零丢包的高性能网络服务,将助力算力瓶颈的突破,进一步释放AI潜能,全面提升企业大模型的训练效率,在云上加速大模型技术的迭代升级和落地应用。”
构建大模型专属高性能网络,提升40%GPU利用率
AIGC的火爆带来AI大模型参数量从亿级到万亿级的飙升。为支撑海量数据的大规模训练,大量服务器通过高速网络组成算力集群,互联互通,共同完成训练任务。
相反,GPU集群越大,额外通信损耗越多,大集群并不意味着大算力。AI大模型时代给网络带来了重大的挑战,包括高带宽要求、高利用率和信息无损。
传统低速网络带宽无法满足千亿、万亿参数规模的大模型,在训练过程中,通信占比可高达50%。同时,传统网络协议容易导致网络拥塞、高延时和丢包,而仅0.1%的网络丢包就可能导致50%的算力损失,最终造成算力资源的严重浪费。
基于全面自研能力,腾讯云在交换机、通信协议、通信库以及运营系统等方面,进行了软硬一体的升级和创新,率先推出业界领先的大模型专属高性能网络——星脉网络。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
在硬件方面,星脉网络基于腾讯的网络研发平台,采用全自研设备构建互联底座,实现自动化部署和配置。
在软件方面,腾讯云自研的TiTa网络协议,采用先进的拥塞控制和管理技术,能够实时监测并调整网络拥塞,满足大量服务器节点之间的通信需求,确保数据交换流畅、延时低,实现高负载下的零丢包,使集群通信效率达90%以上。
此外,腾讯云还为星脉网络设计了高性能集合通信库TCCL,融入定制化解决方案,使系统实现了微秒级感知网络质量。通过使用动态调度机制来合理分配通信通道,可以有效避免由于网络问题导致的训练中断等情况,并将通信时延降低40%。
Pippit AI
CapCut推出的AI创意内容生成工具
133
查看详情
网络的可用性,也决定了整个集群的计算稳定性。为确保星脉网络的高可用,腾讯云自研了端到端的全栈网络运营系统,通过端网立体化监控与智能定位系统,将端网问题自动定界分析,让整体故障的排查时间由天级降低至分钟级。经过改进,大型模型训练系统的整体部署时间已缩短为4.5天,保证了基础配置的100%准确性。
历经三代技术演进,软硬一体深耕自研
星脉网络全方位的升级背后,是
腾讯数据中心网络历经三代技术演进的成果。

在腾讯发展初期,数据中心网络流量主要由用户访问数据中心服务器的南北向流量构成,网络架构以接入、汇聚、出口为主。这一阶段主要使用了商用网络设备,搭建标准化数据中心网络,支撑QQ在线人数增长超过1亿,服务器规模增长超10万。
随着大数据和云计算的兴起,服务器之间的东西向流量逐渐增多,云租户对网络产生了虚拟化和隔离的要求。数据中心网络架构逐渐演变为同时承载南北向和东西向流量的云网络架构,腾讯云构建了全自研网络设备与管理系统,打造超大规模数据中心网络,服务器规模近200万台。
腾讯云在国内先行推出了高性能计算网络,以满足AI大模型的需求,并采用了东西向和南北向流量的分离架构。构建了独立的超大带宽、符合AI训练流量特征的网络架构,并配合自研软硬件设施,实现整套系统的自主可控,满足超强算力对网络性能的新需求。
日前,腾讯云发布的新一代HCC高性能计算集群,正是基于星脉高性能网络打造,可以实现3.2T超高互联带宽,算力性能较前代提升3倍,为AI大模型训练构筑可靠的高性能网络底座。
未来,腾讯云还将持续投入基础技术的研发,为各行各业的数智化转型提供有力的技术支撑。
以上就是面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络的详细内容,更多请关注其它相关文章!
# AI大模型
# 高性能计算
# 如何评估一个网站优化
# 骏域网站建设专家广州
# 佳木斯网站推广代运营
# 桐乡批发网站建设
# 商城网站如何优化首页
# 模板搭建网站seo
# 邯郸集团网站建设价格
# 路桥网站建设制作
# 这一
# 三代
# 最全
# 前代
# 互联
# 下载量
# 东西向
# 首次
# 高性能
# 腾讯
# 自研网络
# 淮北seo优化关键词排名费用
# 晋宁区快消品营销推广
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
eraser是什么意思
进口超级维特拉三门版power是什么意思
苹果16有哪些可以设置
openwrt有什么用
安装固态硬盘如何设置
夸克文字口令是什么意思
51单片机怎么连接端口
咋免费领取爱奇艺会员 如何免费领取爱奇艺会员步骤
单片机怎么计算0xf0
typescript掌握哪些可以做项目
1s等于多少ms
市盈率tt的扣非是什么意思
虚拟机服务器如何关机命令
空调控制面板power灯一直亮是什么意思
video是什么意思
5g手机4g卡怎么没有网络
夸克还原排版是什么意思
如何ping测试命令
type-c全能接口是什么意思
怎么用typescript 写js
如何正确使用固态硬盘
导航power在汽车上是什么意思
dos命令 如何将变量 作为路径的一部分
春运抢票如何抢连坐的票
typescript什么意思
学typescript需要多久
命令控制台如何执行sql文件
今天是农历多少号
三星相机里power是什么意思
为什么有的夸克带电
春运抢票哪里最火热
如何通过命令行聊天
如何区别固态硬盘
ai文件在线打开工具有哪些
电动车eco和power是什么意思
比亚迪秦nfc功能是什么意思
交管12123协议头是什么
win10如何开启命令行
充电器上的power是什么意思
显示器的power是什么意思
vfp 命令窗口如何实现换行
iphone拍电子屏有横条如何解决
j*a整形怎么转数组
如何修改cad中的命令
联想的固态硬盘如何
typescript怎么理解的
市盈率亏损是什么意思
春运抢票哪个城市好抢
市盈率中1stdv是什么意思
苹果16会有哪些更新


2023-06-28
浏览次数:次
返回列表