新闻中心
-
03-06谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA每个人想要的大模型,是真·智能的那种......这不,谷歌团队就做出来了一个强大的「读屏」AI。研究人员将其称为ScreenAI,是一种理解用户界面和信息图表的...
-
03-06Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引...
-
03-06Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?StabilityAI在发布了StableDiffusion3之后,今天公布了详细的技术报告。论文深入分析了StableDiffusion3的核心技术——改进版...
-
03-047B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力图神经网络(GNNs)善于利用图的结构信息进行推断,但通常需要进行特定领域的调优,以实现最佳性能,这使得它们在不同任务之间的泛化能力受到限制。大型语言模型(LL...
-
03-02VPR 2025 满分论文!Meta提出EfficientSAM:快速分割一切!EfficientSAM这篇工作以5/5/5满分收录于CVPR2024!作者在某社交媒体上分享了该结果,如下图所示:LeCun图灵奖得主也强烈推荐了该工作!在近...
-
03-01为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用在当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑...

