新闻中心
-
07-22权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了小模型成趋势?本周,OpenAI上线小模型GPT-4o-mini,小模型赛道正式开卷。近期加入这一赛道的还有苹果。最近,苹果公司作为DataComp-LM(DC...
-
06-29谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!性能翻倍的Gemma2,让同量级的Llama3怎么玩?AI赛道上,科技巨头们激烈角逐。前脚有GPT-4o问世,后脚就出现了Claude3.5Sonnet。如此激...
-
06-29Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-24涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型作者|香港中文大学白帆编辑|ScienceAI近日,香港中文大学和智源联合提出的M3D系列工作,包括M3D-Data,M3D-LaMed和M3D-Bench,从...
-
06-17英伟达开源最强通用模型Nemotron-4 340B性能超越Llama-3,主要用于合成数据。英伟达的通用大模型Nemotron,开源了最新的3400亿参数版本。本周五,英伟达宣布推出Nemotron-4340B...
-
06-12Yandex 开源 LLM 训练工具节省高达 20% 的 GPU 资源Yandex跨国科技公司最近推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强GPU通信并减...

