新闻中心
-
03-19MV-MATH— 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力MV-MATH:一个用于评估多模态大语言模型数学推理能力的新基准数据集MV-MATH是由中国科学院自动化研究所推出的一套全新基准数据集,旨在评估多模态大语言模型...
-
03-11大模型全军覆没,中科院自动化所推出多图数学推理新基准近日,中国科学院自动化研究所推出多图数学推理全新基准MV-MATH(该工作已被CVPR2025录用),这是一个精心策划的多图数学推理数据集,旨在全面评估MLLM...
-
10-04码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成对于大模型来说,擅长的是本地化编码任务。如果任务涉及多个相互依赖的文件,LLM无法解决这个问题微软研究人员为此设计了一个名为CodePlan的任务无关的神经网络...
-
共1页 3条

