新闻中心
-
03-11清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!大型模型仅能记忆和理解有限的上下文,这已成为它们在实际应用中的一大制约。例如,对话型人工智能系统常常无法持久记忆前一天的对话内容,这导致利用大型模型构建的智能体...
-
03-11我们一起聊聊大模型的模型融合方法在以前的实践中,模型融合被广泛运用,尤其在判别模型中,它被认为是一种能够稳定提升性能的方法。然而,对于生成语言模型而言,由于其涉及解码过程,其运作方式并不像判别...
-
03-11用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理...
-
03-11LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?在人工智能领域,很少有像YannLeCun这样的学者,在65岁的年龄还能高度活跃于社交媒体。YannLeCun在人工智能领域以直率的批评者形象为人所知。他一直积...
-
03-11让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。不过,这个极限究竟有多大?清华大学和哈工大的一项联合研究给出的答案是:90%。他们提出了大模型1b...
-
03-08田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型MetaFAIR田渊栋参与的研究项目在上个月获得了广泛好评。在他们的论文《MobileLLM:OptimizingSub-billionParameterLan...

