新闻中心
-
07-31【视觉常识推理】基于paddle复现r2c本项目基于Paddle框架复现From Recognition to Cognition: Visual Commonsense Reasoning中的R2C模...
-
07-16『2025语言与智能技术竞赛』- 情感可解释性评测该模块聚焦NLP模型可解释性评估,提供3个任务的评测数据与指标,含3种证据抽取方法,在多种模型结构上验证了模型复杂度和参数规模的影响。平台需Linux等环境及相...
-
11-03GPT-4 做「世界模型」,让LLM从「错题」中学习,推理能力显著提升近期来,大型语言模型在各种自然语言处理任务中取得了显著的突破,特别是在需要进行复杂思维链(CoT)推理的数学问题上比如在GSM8K、MATH这样的高难度数学任务...
-
10-077.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2025大型语言模型在性能方面表现出色,能够通过零样本或少样本提示来解决新任务。然而,在实际应用部署中,LLM却不太实用,因为它的内存利用效率低,同时需要大量的计算资源...
-
共1页 4条

