新闻中心
-
02-26国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2025接收2月16日,OpenAISora的发布无疑标志着视频生成领域的一次重大突破。Sora基于DiffusionTransformer架构,和市面上大部分主流方法(由...
-
02-23目标检测新SOTA:YOLOv9问世,新架构让传统卷积重焕生机在目标检测领域,YOLOv9在实现过程中不断进步,通过采用新架构和方法,有效提高了传统卷积的参数利用率,这使得其性能远超前代产品。继2023年1月YOLOv8正...
-
02-20GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况众所周知,大型语言模型(LLM)的推理通常需要使用自回归采样,这个推理过程相当缓慢。为了解决这个问题,推测解码(SpeculativeDecoding)已经成为...
-
02-19后Sora时代,CV从业者如何选择模型?卷积还是ViT,监督学习还是CLIP范式ImageNet准确率曾是评估模型性能的主要指标,但在当今计算视觉领域,这一指标逐渐显得不够完善。随着计算机视觉模型变得更加复杂,可用模型种类已显著增加,从Co...
-
02-16陪跑又快又稳,机器人跑步搭子来了这个机器人名叫Cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它掌握了急转弯等技能,还能对抗各种干扰...
-
02-16谷歌Gemini1.5火速上线:MoE架构,100万上下文今天,谷歌宣布推出Gemini1.5。Gemini1.5是在谷歌基础模型和基础设施的研究与工程创新基础上开发的。这个版本引入了新的专家混合(MoE)架构,以提高...

