新闻中心
-
08-14非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1Mamba架构的大模型又一次向Transformer发起了挑战。Mamba架构模型这次终于要「站」起来了?自2023年12月首次推出以来,Mamba便成为了Tr...
-
08-11混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合混合专家,也得术业有专攻。对于目前的混合模态基础模型,常用的架构设计是融合特定模态的编码器或解码器,但这种方法存在局限:无法整合不同模态的信息,也难以输出包含多...
-
08-06算法、系统和应用,三个视角全面读懂混合专家(MoE)LLM很强,而为了实现LLM的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型...
-
08-01CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-30只要一张图就能「还原」绘画过程,这篇论文比爆火的Paints-UNDO实现得更早AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-17快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极...

