新闻中心
-
09-25LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和实验证明,大模型的System2能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对LLM是否...
-
09-23首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗AGI和多模态学习;博士生陈...
-
09-20o1带火的CoT到底行不行?新论文引发了论战ToCoTornottoCoT?OpenAIο1的诞生极大地提升了人们对LLM推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有LLM的标配...
-
09-20阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o人工智能领域再度迎来重磅消息!2023年8月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。在9月19日的云栖大会...
-
09-12Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB*训练完就直接上模型。我们都知道,Mistral团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接,可以看到大小共23...
-
09-10还在死磕AI咒语?北大-百川搞了个自动提示工程系统PASAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

