新闻中心

耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

2025-03-04
浏览次数:
返回列表

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑 | 萝卜皮

将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。

针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)的研究人员提出了 MindLLM,一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。

此外,研究人员提出了一种新方法——大脑指令调整 (BIT),可增强模型从 fMRI 信号中捕获不同语义表示的能力,从而促进更通用的解码。

在全面的 fMRI 到文本基准上的评估中, MindLLM 优于基线,下游任务提高了 12.0%,未知主题泛化提高了 16.4%,新任务适应提高了 25.0%。此外,MindLLM 中的注意力模式为其决策过程提供了可解释的见解。

该研究以「MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding」为题,于 2025 年 2 月 18 日发布在 arXiv 预印平台。

图片

解码人类大脑活动(fMRI)为文本在神经科学领域引起了广泛关注。这一技术不仅为认知、行为和意识研究提供了新视角,还具有重要的社会应用价值。

例如,它可以帮助语言障碍者恢复沟通能力,使他们能够轻松表达思想;同时,它还能实现健康人群对数字设备(如具身 AI 或假肢)的神经控制,使操作更加直观和精确。

然而,该技术仍面临重大挑战:一是需要针对不同应用场景开发多功能解码模型,现有方法如 UMBRAE 虽能映射 fMRI 数据到刺激图像,但无法处理更广泛的任务(如记忆检索);二是缺乏统一且不依赖个体的解码架构,当前方法依赖预处理选择响应体素,导致输入维度不一致和空间信息丢失,影响性能。

研究人员提出了 MindLLM,一种用于 fMRI 到文本解码的主题无关且通用的模型。该方法包括一个主题无关的 fMRI 编码器和一个现成的 LLM。

Zyro AI Background Remover Zyro AI Background Remover

Zyro推出的AI图片背景移除工具

Zyro AI Background Remover 145 查看详情 Zyro AI Background Remover
图片

图示:MindLLM 概述。(来源:论文)

主题无关的 fMRI 编码器将神经科学信息注意层与可学习查询相结合,通过利用体素的空间信息和神经科学先验来实现动态特征提取,从而显著提高预测准确性。值和键的设计将体素的功能信息(在个体之间基本一致)与其 fMRI 值分开,从而使模型能够受益于跨主体共享的先验,并增强对新主体的概括性。

为了应对多功能解码的挑战,研究人员提出了脑指令调整(BIT)。BIT 使用以图像为中介的多样化数据集来训练模型,涵盖旨在捕获 fMRI 数据中编码的语义信息的不同方面的任务,包括感知和场景理解、记忆和知识检索、语言和符号处理以及复杂推理。

图片

图示:我们的模型与之前的统一模型的比较。(来源:论文)

研究人员在综合基准上评估了 MindLLM。结果表明,它的表现优于基线,在各种下游任务中平均提高了 12.0%,在未见过的主题上的泛化提高了 16.4%。

MindLLM 能够有效地适应新任务,在实际应用中表现出很高的可定制性和灵活性。此外,对注意力权重的分析为该团队 fMRI 编码器的工作机制提供了宝贵的见解。

论文链接:https://arxiv.org/abs/2502.15786

相关报道:https://medicalxpress.com/news/2025-02-brain-imaging-text-mindllm.html

以上就是耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本的详细内容,更多请关注其它相关文章!


# 人工智能  # 理论  # 这一  # 剑桥  # 耶鲁  # 提高了  # 提出了  # Type  # 2025  # ai  # 神经科学  # 大脑  # 科学  # 湖北快手营销推广中心  # 文案翻译网站建设  # 互联网seo优化公司  # 华为营销推广费用  # 惠州仓储seo公司  # 营销文案推广文案怎么写  # 高仿seo风险  # 微博营销推广  # 乌兰察布网络营销的推广  # 沈阳seo服务必选公司  # 官网  # 剑桥大学  # 转换为  # 耶鲁大学  # 多功能 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 春运抢票需要什么软件抢  市盈率20a21e是什么意思  光刻机的分类及特点  折叠屏手机信号哪个最强  如何固态硬盘4k对齐  广东春运抢票怎么抢的  折叠屏手机好不好,耐不耐用  为什么进行域名解析  typescript 如何解决 null  360n7lite怎么设置动态壁纸  单片机引脚怎么改成上拉  树莓派命令行如何新建文件  vs如何输入命令行参数  春运高速高铁抢票攻略  如何进入cmd命令行  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  typescript的语法格式是什么  tft单片机怎么写彩屏  苹果16有哪些变化尺寸  分享一个稳定的ao3镜像网址  如何查看邮件域名解析  如何使用net命令  单片机加热片怎么制作  typescript如何使用  300秒等于多少分钟  交管12123协议头不完整怎么弄  为什么youtube音乐打不开  市盈率动亏损是什么意思  power在录音笔上是什么意思  固态硬盘如何4k对其  市盈率百分位roe是什么意思  如何以管理员身份打开命令提示符  新网站如何填写域名解析  ai怎么找链接文件位置教程  命令控制台如何执行sql文件  平仓是什么意思?  征信不好如何短期恢复  如何正确使用固态硬盘  免费恢复删除的微信聊天记录软件有哪些  问一下市盈率是什么意思  j*a map数组怎么用  j*a数组对象怎么取  春运抢票如何快速抢到票  市盈率市净率是什么意思  焊机上power灯闪是什么意思  typescript 如何使用  driver是什么意思  typescript中怎么引用js文件  vue项目如何用typescript  苹果16日发售哪些机型 

搜索