新闻中心
-
03-18总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述大语言模型(LargeLanguageModels,LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如GPT-4、Gemini、Claude等,但...
-
03-15LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力合成数据持续解锁大模型的数学推理潜力!数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在...
-
03-15专为训练Llama 3,Meta 4.9万张H100集群细节公布生成式大模型已经在人工智能领域引发了重大变革,尽管人们对实现通用人工智能(AGI)的希望日益增加,但是训练和部署大模型所需的算力也愈发庞大。刚刚,Meta宣布推...
-
03-15Meta新增两大万卡集群,投入近50000块英伟达H100 GPUMeta日前推出两个功能强大的GPU集群,用于支持下一代生成式AI模型的训练,包括即将推出的Llama3。据报道,这两个数据中心都配备了高达24,576块GPU...
-
03-13350亿参数、开放权重,Transformer作者创业后推出新大模型今天,由Transformer作者之一AidanGomez参与创立的人工智能初创公司Cohere迎来了自家大模型的发布。Cohere最新发布的模型被命名为「Co...
-
03-12被误解的「中文版Sora」背后,字节跳动有哪些技术?2024开年,OpenAI就在生成式AI领域扔下了重磅炸弹:Sora。这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关技术进展和落地成果。在此之...

