新闻中心
-
06-24为什么都放弃了LangChain?或许从诞生那天起,LangChain就注定是一个口碑两极分化的产品。看好LangChain的人欣赏它丰富的工具和组建和易于集成等特点,不看好LangChain的...
-
06-18答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-18大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17岁中专生姜萍在2024阿里巴巴全球数学竞赛预选赛中取得全球第12名的新闻刷了屏。而同时...
-
06-17英伟达开源最强通用模型Nemotron-4 340B性能超越Llama-3,主要用于合成数据。英伟达的通用大模型Nemotron,开源了最新的3400亿参数版本。本周五,英伟达宣布推出Nemotron-4340B...
-
06-14ACL 2025|PsySafe:跨学科视角下的Agent系统安全性研究AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-12Yandex 开源 LLM 训练工具节省高达 20% 的 GPU 资源Yandex跨国科技公司最近推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强GPU通信并减...

