新闻中心
-
03-12被误解的「中文版Sora」背后,字节跳动有哪些技术?2024开年,OpenAI就在生成式AI领域扔下了重磅炸弹:Sora。这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关技术进展和落地成果。在此之...
-
03-11清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!大型模型仅能记忆和理解有限的上下文,这已成为它们在实际应用中的一大制约。例如,对话型人工智能系统常常无法持久记忆前一天的对话内容,这导致利用大型模型构建的智能体...
-
03-11我们一起聊聊大模型的模型融合方法在以前的实践中,模型融合被广泛运用,尤其在判别模型中,它被认为是一种能够稳定提升性能的方法。然而,对于生成语言模型而言,由于其涉及解码过程,其运作方式并不像判别...
-
03-11扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。最新研究指出,利用扩散模型的规划模块可以同时生...
-
03-11让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。不过,这个极限究竟有多大?清华大学和哈工大的一项联合研究给出的答案是:90%。他们提出了大模型1b...
-
03-0840%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果大模型竞赛,又杀出一匹黑马——Inflection-2.5,由DeepMind联创MustafaSuleyman的大模型初创公司打造。只用40%的计算资源训练,...

