新闻中心

545%! DeepSeek首披露成本利润率 专家:若在美国已是一家价值逾百亿美元公司

2025-03-04
浏览次数:
返回列表

中国ai新创公司deepseek近来「开源」一波波,上周六 (1日) 又有更大惊喜,全面揭秘deepseek-v3/r1推理系统,不仅公开其推理系统的核心优化方案,更首次披露成本获利率等关键数据,引发产业震动。

DeepSeek上周六在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本获利率关键资讯,若所有tokens全按DeepSeek-R1的定价计算,理论上一天的总收入为56万2027美元,成本获利率为545%,这一数字刷新全球AI大模型领域的获利天花板。

根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

在最近24小时 (2025年2月27日12:00至28日12:00) 的统计周期,若 GPU租赁成本按2美元 / 小时计算,日均成本为8万7072美元,而若所有输入 / 输出token按R1定价 (输入1元 / 百万token、输出16元 / 百万 token) 计算,单日收入可达56万2027美元(约1865万新台币),成本获利率高达545%。

MenloVentures投资人Deedy在看完上述数据后指出,获利率超过500%这一商业效率在美国将是一家价值逾百亿美元的公司。

中国硅基流动创办人袁进辉也在第一时间发表了自己的感受说:「DeepSeek官方披露大规模部署成本和收益,又一次颠覆了很多人认知。」

DeepSeek的高获利率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱。 EP提升吞吐与回应速度,针对模型稀疏性(每层仅启动8/256个专家),采用EP 策略扩展总体批处理规模,确保每个专家获得足够的计算负载,显著提升GPU利用率,部署单元动态调整 (如Prefill阶段4节点、Decode阶段18 节点),平衡资源分配与任务需求。

简言之,EP就像是「多人协作」,把模型中的「专家」分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低存储器压力,更快回应。

Zyro AI Background Remover Zyro AI Background Remover

Zyro推出的AI图片背景移除工具

Zyro AI Background Remover 145 查看详情 Zyro AI Background Remover

DeepSeek在工程层面进一步压缩成本,加上昼夜资源调配,白天高峰时段全力支援推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率,缓存命中率达56.3%,通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

有分析称DeepSeek此次披露的数据,不仅验证其技术路线的商业可行性,更为行业树立高效获利标竿,模型训练成本仅为同类产品的1%至5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头。在推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的七分之一到一半左右,低成本策略加速市场渗透。

还有分析指出,DeepSeek此次「透明化」披露不仅展示其技术实力与商业潜力,更向行业传递明确信号,也就是AI大模型的获利循环已从理想照进现实,代表AI技术从实验室迈向产业化的关键转折。

不过,DeepSeek官方坦言实际上没有这么多收入,因V3定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更经济方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。演算法训练带来的规模报酬递增效应,以及单位算力成本降低对应的杰文斯悖论等,均代表中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定*件。

以上就是545%! DeepSeek首披露成本利润率 专家:若在美国已是一家价值逾百亿美元公司的详细内容,更多请关注其它相关文章!


# ai  # deepseek  # 在美国  # 负载均衡  # 已是  # 仅为  # 将是  # 这一  # 官网  # 2025  # 2025年  # 营销推广岗位任职条件  # 大溪沟网站建设  # 肇庆专业网站优化推广  # 黑龙江网络营销推广  # 开源首页seo优化  # 潍坊平原网站建设  # 市场营销推广案例分享  # 化妆品网站营销推广  # 常州优秀网站建设商铺  # 廉政网站建设  # 来袭  # 一键  # 中国 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 对应市盈率是30X是什么意思  typescript怎么写react  安装固态硬盘如何设置  j*a数组怎么放字符  划水是什么意思  typescript怎么写多个构造方法  如何找出命令行  苹果16系统有哪些缺陷  汽车上power是什么意思  mac如何使用vi命令  闪光灯power闪烁是什么意思  夸克搜题的原理是什么  360n6锁屏壁纸怎么设置  忐忑不安是什么意思  单片机怎么读取电流值  市盈率百分位roe是什么意思  微信最多可以加多少好友  一帧是多少秒  点焊机接触器上power是什么意思  小屏折叠屏手机有哪些  电脑type-c接口是什么意思  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  固态硬盘如何4k对其  折叠屏手机选择哪个好  j*a数组怎么保存类  如何看固态硬盘信息  手机拍电脑屏幕有条纹怎么解决  j*a数组对象怎么取  春运预约抢票能抢到吗  宝马x5仪表盘上边有power是什么意思  typescript和es6先学哪个  51单片机怎么连接端口  五十铃x-power是什么意思  如何查看硬盘是固态硬盘  solo交友软件怎么恢复聊天记录  苹果16有哪些变化尺寸  单片机软件keil怎么运行  如何用dos命令启动u盘  为什么夸克流畅播失败  i5 6500怎么装win7  营收和gmv区别_营收和gmv有什么区别  得物怎样不扣手续费 如何通过得物不支付手续费  苹果16粉色还有哪些机型  萝卜快跑的收费标准是什么  5g手机怎么没视频通话功能  如何显示固态硬盘  怎么在typescript写原型链  typescript如何使用viewer  红米手机怎么设置变成5G手机  intel固态硬盘如何安装 

搜索