新闻中心
-
01-15华硕无畏Pro15 2025:大屏RTX轻薄本与AI创新相融合的重磅新品问世1月10日,华硕在CES2024展览会上举行了一场以“追寻无与伦比”为主题的线上发布会,推出了多款旗舰笔记本新品。其中,华硕无畏Pro152024是专为Z世代青...
-
01-14模型推理加速:CPU性能提升5倍,苹果采用闪存进行大规模推理加速,Siri 2.0即将亮相?苹果这项新工作将为未来iPhone加入大模型的能力带来无限想象力。近年来,GPT-3、OPT和PaLM等大型语言模型(LLM)在广泛的自然语言处理(NLP)任务...
-
01-14用PyTorch实现噪声去除扩散模型在详细了解去噪扩散概率模型(DDPM)的工作原理之前,我们先来了解一下生成式人工智能的一些发展情况,这也是DDPM的基础研究之一。VAEVAE使用编码器、概率潜...
-
01-14CVPR 2025|美图&国科大联合提出DropKey正则化方法:用两行代码高效避免视觉Transformer过拟合问题近期,基于Transformer的算法被广泛应用于计算机视觉的各类任务中,但该类算法在训练数据量较小时容易产生过拟合问题。现有VisionTransformer...
-
01-14网友盛赞:Transformer引领年度论文的简化版本来了从大模型的根源开始优化。Transformer架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度Transformer架构的一种简单方法是将多个相同...
-
01-13减少Transformer秩数以提高性能,同时保持移除特定层90%以上组件LLM不减少麻省理工学院和微软进行了联合研究,发现不需要额外的训练即可提升大型语言模型的任务性能,并减小其大小在大型模型时代,Transformer以其独特的能力支撑起整个...

