llama_第66页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

03-11

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

大型模型仅能记忆和理解有限的上下文，这已成为它们在实际应用中的一大制约。例如，对话型人工智能系统常常无法持久记忆前一天的对话内容，这导致利用大型模型构建的智能体...
03-11

我们一起聊聊大模型的模型融合方法

在以前的实践中，模型融合被广泛运用，尤其在判别模型中，它被认为是一种能够稳定提升性能的方法。然而，对于生成语言模型而言，由于其涉及解码过程，其运作方式并不像判别...
03-11

用AI短视频「反哺」长视频理解，腾讯MovieLLM框架瞄准电影级连续帧生成

在视频理解这一领域，尽管多模态模型在短视频分析上取得了突破性进展，展现出了较强的理解能力，但当它们面对电影级别的长视频时，却显得力不从心。因而，长视频的分析与理...
03-11

LeCun最新专访：为什么物理世界终将成为LLM的「死穴」？

在人工智能领域，很少有像YannLeCun这样的学者，在65岁的年龄还能高度活跃于社交媒体。YannLeCun在人工智能领域以直率的批评者形象为人所知。他一直积...
03-11

让大模型“瘦身”90%！清华&哈工大提出极限压缩方案：1bit量化，能力同时保留83%

对大模型进行量化、剪枝等压缩操作，是部署时最常见不过的一环了。不过，这个极限究竟有多大？清华大学和哈工大的一项联合研究给出的答案是：90%。他们提出了大模型1b...
03-08

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

MetaFAIR田渊栋参与的研究项目在上个月获得了广泛好评。在他们的论文《MobileLLM:OptimizingSub-billionParameterLan...

: 电话

: 客服

: 地图

: 搜索