moe_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

01-24

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义千问团队在最新论文中揭示了混合专家模型(MoE)训练中的一个关键问题，并提出了一种创新的解决方案。该问题在于现有MoE训练框架普遍采用局部负载均衡损失...
08-08

PRO | 为什么基于 MoE 的大模型更值得关注？

2023年，几乎AI的每个领域都在以前所未有的速度进化，同时，AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。多模态趋势下，Transformer作...
08-06

算法、系统和应用，三个视角全面读懂混合专家（MoE）

LLM很强，而为了实现LLM的可持续扩展，有必要找到并实现能提升其效率的方法，混合专家（MoE）就是这类方法的一大重要成员。最近，各家科技公司提出的新一代大模型...
05-07

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

最新国产开源MoE大模型，刚刚亮相就火了。DeepSeek-V2性能达GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。因此一...
05-07

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源MoE模型来了。...
01-16

利用PyTorch实现混合专家模型(MoE)

Mixtral8x7B的推出在开放AI领域引起了广泛关注，特别是混合专家（Mixture-of-Experts：MoEs）这一概念被大家所熟知。混合专家（MoE...

1

6

: 电话

: 客服

: 地图

: 搜索