模型_第19页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

03-12

被误解的「中文版Sora」背后，字节跳动有哪些技术？

2024开年，OpenAI就在生成式AI领域扔下了重磅炸弹：Sora。这几年，视频生成领域的技术迭代持续加速，很多科技公司也公布了相关技术进展和落地成果。在此之...
03-11

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

大型模型仅能记忆和理解有限的上下文，这已成为它们在实际应用中的一大制约。例如，对话型人工智能系统常常无法持久记忆前一天的对话内容，这导致利用大型模型构建的智能体...
03-11

我们一起聊聊大模型的模型融合方法

在以前的实践中，模型融合被广泛运用，尤其在判别模型中，它被认为是一种能够稳定提升性能的方法。然而，对于生成语言模型而言，由于其涉及解码过程，其运作方式并不像判别...
03-11

扩散模型如何构建新一代决策智能体？超越自回归，同时生成长序列规划轨迹

设想一下，当你站在房间内，准备向门口走去，你是通过自回归的方式逐步规划路径吗？实际上，你的路径是一次性整体生成的。最新研究指出，利用扩散模型的规划模块可以同时生...
03-11

让大模型“瘦身”90%！清华&哈工大提出极限压缩方案：1bit量化，能力同时保留83%

对大模型进行量化、剪枝等压缩操作，是部署时最常见不过的一环了。不过，这个极限究竟有多大？清华大学和哈工大的一项联合研究给出的答案是：90%。他们提出了大模型1b...
03-08

40%算力训练效果比肩GPT-4，实测DeepMind联创大模型创业新成果

大模型竞赛，又杀出一匹黑马——Inflection-2.5，由DeepMind联创MustafaSuleyman的大模型初创公司打造。只用40%的计算资源训练，...

: 电话

: 客服

: 地图

: 搜索