采用了_第50页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

08-14

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba架构的大模型又一次向Transformer发起了挑战。Mamba架构模型这次终于要「站」起来了？自2023年12月首次推出以来，Mamba便成为了Tr...
08-11

混合专家更有主见了，能感知多模态分情况行事，Meta提出模态感知型专家混合

混合专家，也得术业有专攻。对于目前的混合模态基础模型，常用的架构设计是融合特定模态的编码器或解码器，但这种方法存在局限：无法整合不同模态的信息，也难以输出包含多...
08-06

算法、系统和应用，三个视角全面读懂混合专家（MoE）

LLM很强，而为了实现LLM的可持续扩展，有必要找到并实现能提升其效率的方法，混合专家（MoE）就是这类方法的一大重要成员。最近，各家科技公司提出的新一代大模型...
08-01

CMU&清华新作：让LLM自己合成数据来学习，特定任务性能同样大幅提升

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
07-30

只要一张图就能「还原」绘画过程，这篇论文比爆火的Paints-UNDO实现得更早

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传...
07-17

快手开源LivePortrait，GitHub 6.6K Star，实现表情姿态极速迁移

近日，快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架，该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上，生成极...

: 电话

: 客服

: 地图

: 搜索