新闻中心
-
02-19让视觉语言模型搞空间推理,谷歌又整新活了尽管视觉语言模型(VLM)在许多任务上取得了显著进展,包括图像描述、视觉问答、具身规划和动作识别等,但在空间推理方面仍然存在挑战。许多模型在理解目标在三维空间中...
-
02-19LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPASora一经面世,瞬间成为顶流,话题热度只增不减。强大的逼真视频生成能力,让许多人纷纷惊呼「现实不存在了」。甚至,OpenAI技术报告中透露,Sora能够深刻地...
-
02-19以自监督方式去除荧光图像中的噪声,清华团队开发空间冗余去噪Transformer方法荧光成像的高信噪比对于生物现象的准确可视化至关重要,然而,噪声问题仍然是成像灵敏度面临的主要挑战之一。清华大学的研究团队提供了空间冗余去噪Transformer...
-
02-19文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题近日,北大、斯坦福、以及爆火的PikaLabs联合发表了一项研究,将大模型文生图的能力提升到了新的高度。论文地址:https://arxiv.org/pdf/2...
-
02-07无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式背景大语言模型(LLMs)虽展现出了强大的能力,但也可能产生不可预测和有害的输出,例如冒犯性回应、虚假信息和泄露隐私数据,给用户和社会造成伤害。确保这些模型的行...
-
02-07谷歌官宣TensorFlow-GNN 1.0发布!动态和交互采样,大规模构建图神经网络2005年,划时代之作「TheGraphNeuralNetworkModel」的问世,将图神经网络带到每个人面前。在此之前,科学家处理图数据的方式是,在数据预处...

