新闻中心
-
07-11首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-18答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-13苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo在刚刚结束的全球开发者大会上,苹果宣布了Appleintelligence,这是一款深度集成于iOS18、iPadOS18和macOSSequoia的全新个性化...
-
06-06LLM | Yuan 2.0-M32:带注意力路由的专家混合模型图片一、结论写在前面Yuan+2.0-M32是一种基础架构,与Yuan-2.0+2B相似,采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
-
06-06首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著进展。这些成果使得AI领域的主导技术成为了深...
-
06-06快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模什么?疯狂动物城被国产AI搬进现实了?与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。Sora利用了相似的技术路线,结合多项自研技术创新,生产的视频...

