新闻中心
-
09-02鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-18给RAG系统做一次全面「体检」,亚马逊开源RAGChecker诊断工具AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-16两个小模型互相验证,直接比肩大模型?微软的rStar甚至没用CoT和微调互相检查,让小模型也能解决大问题。众所周知,LLM很强大,但执行复杂推理的能力还不够强。举个例子,在GSM8K数据集上,Mistral-7B即使使用思维链(Co...
-
08-15李沐:创业一年,人间三年给小伙伴汇报一下LLM创业第一年的进展、纠结和反思。在Amazon呆到第五年的时候就想着创业了,但被疫情耽搁了。到第7年半的时候,觉得太痒了,就提了离职。现在想...
-
08-14非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1Mamba架构的大模型又一次向Transformer发起了挑战。Mamba架构模型这次终于要「站」起来了?自2023年12月首次推出以来,Mamba便成为了Tr...
-
08-09通义千问开源Qwen2-Math,成为最先进的数学专项模型8月9日消息,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开...

