数据导入
西门子、飞利浦、联影、GE…发布:2025-06-04 浏览:24 次
简要总结:
该研究介绍了一种新的计算框架,利用扩散磁共振成像(dMRI)纤维束追踪数据来预测任务功能性磁共振成像(fMRI)激活的空间范围,无需预先划分大脑区域。通过三种不同的特征表示方法(基于聚类的词袋模型、高斯混合模型和Fisher向量),该方法能够捕捉大脑结构与功能之间的关系,并在四种不同的fMRI任务中验证了其有效性。研究结果表明,该方法在预测fMRI激活方面具有统计显著性,并且在大多数情况下优于传统的基于划分和组平均的方法。此外,该研究还提出了一种可视化算法,用于从解剖学角度解释特征表示,从而增强对结构-功能关系的理解。
摘要:大脑结构和功能之间的关系在认知和临床神经科学中发挥着至关重要的作用。我们提出了一种基于监督机器学习的方法,该方法通过预测基于任务的功能性磁共振成像(fMRI)从局部白质连接性观察到的激活的空间范围来捕捉这种关系,正如扩散MRI(dMRI)纤维束成像所反映的那样。特别是,我们探索了局部连接模式的三种不同特征表示,这些特征不需要预定义的皮质和皮质下结构的分区。相反,他们采用基于集群的特征袋、高斯混合模型和Fisher载体。我们证明,我们的框架可以用来测试的统计意义的结构-功能关系,比较它的包裹为基础的和组平均基准,并提出了一个算法可视化我们选择的功能表示,允许我们的结果的神经解剖学解释。
1、引言
神经科学中的一个常见假设认为,每个皮层区域都具有独特的“连接指纹”,这些指纹决定了其功能。扩散磁共振成像(dMRI)和功能磁共振成像(fMRI)是两种广泛应用于研究人脑结构连接与功能的神经影像技术。该研究提出了一种新颖的计算框架,通过从dMRI中提取连接指纹并将其编码为特征向量,进而预测fMRI任务激活的空间范围。
扩散磁共振成像通过测量水分子在不同方向上的表观扩散率,反映了连接不同皮层区域的白质纤维束的走向。纤维追踪技术从这些影像数据中重建白质通路。功能磁共振成像则记录由血氧水平依赖(BOLD)对比引起的MR信号强度变化。由于神经元活动与血流之间存在耦合关系,通过观察受试者在扫描仪中执行特定任务与fMRI信号区域时间序列之间的相关性,可以检测到与任务显著相关的活动区域。
结合fMRI和dMRI数据的研究由来已久。根据相关综述,这种结合主要有三个目的:一是辅助并简化结构连接的检测;二是研究结构与功能之间的关系;三是支持神经外科治疗。该研究的核心动机是第二个目的。这些综述还总结了整合多模态信息的三种主要策略:基于定性比较的收敛证据、基于空间配准的结果叠加,以及模态间关系的统计建模。该研究属于第三类,旨在开发更先进的定量模型,超越简单的相关性度量。
具体而言,该研究的目标是基于仅从dMRI数据中提取的连接指纹,预测功能(即特定任务引起的fMRI响应的空间范围)。此前的研究采用了类似的目标,但依赖于预先定义的皮层和皮层下结构分区。为了避免分区的繁琐操作,并考虑到分区选择对结构-功能关系估计的显著影响,该研究提出了一种无需分区的替代方法,转而基于dMRI纤维追踪的几何特征对纤维束进行聚类。此外,先前的研究仅针对单一fMRI任务展示结果,且仅对23名受试者进行了交叉验证。该研究则在四种不同任务上评估了所提出的方法,并与分区方法进行了对比,测试集包含64名独立受试者,这些受试者在方法开发过程中未被使用。
另一项研究也利用dMRI纤维追踪预测了从任务fMRI中提取的功能感兴趣区域(ROI)的位置,但其方法仅以单一坐标预测位置。类似地,还有研究通过dMRI纤维追踪预测了358个皮层标志点的位置,并通过证明这些标志点与fMRI检测到的功能网络在空间上的一致性,确认了其功能相关性。然而,这些研究并未试图预测激活的确切空间范围。其他研究观察到某些任务fMRI激活与dMRI衍生的连接模式簇之间存在对齐关系,但未深入探讨两者之间的预测能力。该研究为这种关系的预测建模、量化和统计检验提供了一种新的计算工具。
许多先前的研究结合dMRI与静息态fMRI,探究了结构与功能连接之间的非平凡依赖关系,通常使用图来表示脑网络。另一些研究则试图利用dMRI数据辅助功能连接的估计。这些研究关注的是结构-功能关系的不同方面,而该研究聚焦于特定脑区域的连接指纹及其与特定任务的关系。
该研究框架注重可解释性,并包含一种可视化机制,用于展示不同纤维束对预测任务fMRI激活的贡献程度。此前的研究提出了一种基于dMRI和静息态fMRI的轨迹加权功能连接图,用于突出与特定功能网络相关的白质连接。然而,该方法并非基于预测模型,且与研究的可视化不同,未涉及纤维束群的几何代表性计算。
该研究基于团队此前的工作,即从dMRI纤维追踪预测经颅磁刺激(TMS)的效果。将研究对象从TMS转向fMRI需要对原有方法进行重大调整。此外,该研究探索了两种新的特征表示方法,并引入了一种新颖的可视化机制。
图1研究方法概述。
我们提出的框架的视觉总结。基于标准任务fMRI分析,我们识别出一个感兴趣区域,该区域被细分为感兴趣的超体素(SOIs),我们希望根据其结构连接性来预测其在fMRI任务中的激活。扩散MR纤维束成像的简化线(其中自动去除某些异常值)被分配给每个绝缘体并形成其连接指纹,该指纹被编码为特征载体,我们基于该特征载体训练监督分类器。此外,我们提出了一种可视化结果的方法,以促进解释。
该研究基于团队此前的工作,即从dMRI纤维追踪预测经颅磁刺激(TMS)的效果。将研究对象从TMS转向fMRI需要对原有方法进行重大调整。此外,该研究探索了两种新的特征表示方法,并引入了一种新颖的可视化机制。
2、材料方法
该研究的目标是基于特定脑区域的连接指纹,预测其在特定fMRI任务中是否会被激活。这一目标通过机器学习方法实现,其训练过程基于对受试者队列中结构-功能关系的观察。该研究的主要技术贡献在于探索并比较了三种无需预定义脑分区的dMRI纤维束特征表示方法,同时确保这些方法保留一定的解剖学可解释性。
研究方法的整体流程可概括为以下步骤:数据预处理完成后,进行一级fMRI分析以检测任务与BOLD信号之间的相关性。基于分析结果,定义感兴趣超体素(SOI)并将其标记为“激活”或“非激活”。随后,通过自动种子扩散MRI纤维追踪获取SOI的连接指纹,去除异常纤维束,将单个纤维束与SOI关联,并从中计算特征空间表示。这些特征作为分类和统计检验的输入。最后,该研究描述了一种用于可视化特征及其在分类中作用的算法。
2.1 数据
该研究使用人类连接组计划(HCP)的数据进行方法开发与评估。从可用的功能MRI数据中,选择了四种不同的任务范式,具体描述如下:
1. 运动任务:受试者需交替执行舌头运动、手指敲击(左右手各两次)和脚趾挤压(左右脚各两次)动作,每个任务块之间穿插固定注视块。
2. 语言理解任务:包括故事任务和数学任务。故事任务中,受试者听取短篇故事并回答选择题;数学任务中,受试者需解决加减法算术问题。
3. 社会认知任务:受试者观看几何物体互动的视频片段,判断其运动是否具有意图或情感。
4. 情绪任务:受试者需将屏幕上显示的愤怒或恐惧表情图片与底部图片匹配,或在控制条件下匹配中性形状图片。
功能MRI数据的空间分辨率为2毫米各向同性,扩散MRI数据的空间分辨率为1.25毫米各向同性。扩散MRI数据包含18张b=0参考图像和270张扩散加权图像(b值分别为1000、2000和3000 s/mm²)。
对于每名受试者,该研究使用FSL的FLIRT工具对b=0图像与代表性fMRI图像进行基于强度的线性配准。此外,为满足不同受试者空间对齐的需求,基于扩散MRI数据估计的分数各向异性(FA)图,先进行仿射配准,再进行非线性配准至MNI空间。非线性配准使用FSL的FNIRT工具完成。由于目标是为大规模队列构建自动化计算流程,因此未对配准结果进行手动调整。
为确保方法评估的独立性,该研究将数据分为开发集和测试集。开发阶段使用145名受试者(年龄26-30岁,女性86名,男性59名)进行交叉验证。最终评估阶段,模型在开发集的所有受试者上训练,并在64名未参与开发的独立受试者(年龄22-25岁,女性28名,男性32名)上测试。
2.2 一级功能MRI分析
该研究采用FSL FEAT工具实现的标准fMRI处理流程,从功能MRI时间序列中获取受试者和任务特定的z分数图。预处理包括运动校正、脑提取、空间平滑和时间高通滤波。随后,通过广义线性模型生成z分数图,模型包含以下解释变量及其对比:
1. 运动任务:左右手指敲击(对比“右>左”)。
2. 语言任务:故事呈现与数学任务(对比“故事>数学”)。
3. 社会认知任务:“心理”与“随机”条件(对比“心理>随机”)。
4. 情绪任务:“情绪”与“控制”条件(对比“情绪>控制”)。
所有任务中,刺激波形与双伽马血流动力学响应函数卷积,并将响应函数的一阶导数加入设计矩阵以吸收微小的时间偏移。
2.3 区域与感兴趣超体素
由于fMRI与dMRI数据之间的配准不可避免存在误差,该研究在超体素水平上聚合两种模态的信息。超体素是体积为6.25×6.25×6.25立方毫米的区域。研究目标变为基于超体素的结构连接预测其是否在特定任务中显示fMRI激活。超体素的标签通过其内部所有z分数的最大值z_max确定,阈值设为z_max≥3.1。若超体素内至少有一个体素超过该阈值,则标记为“激活”。
该研究将预测范围限制在任务特定的感兴趣区域(ROI)内,该区域包含预期激活的核心区域及其周围边缘。ROI通过组水平平均激活图确定,提取最大激活簇(单侧任务)或两个最大簇(双侧任务),并膨胀10个体素以平衡“激活”与“非激活”超体素的数量。
超体素定义为个体受试者空间中5×5×5体素的块,分辨率为dMRI数据的分辨率。超体素需满足两个条件才能被纳入SOI:一是与ROI的重叠度至少为50%;二是包含足够的灰质(平均灰质部分体积分数≥80%)。
2.4 扩散MRI纤维追踪
该研究使用MRtrix3工具的多壳多组织约束球面反卷积(MSMT-CSD)方法估计纤维取向分布函数(fODF),并进行概率纤维追踪。追踪参数包括:种子密度250 cm⁻³、最小纤维长度15毫米、最大纤维长度250毫米、纤维终止的峰值振幅阈值0.07。
为去除低概率纤维束,该研究采用基于无监督异常检测的过滤器,使用单类支持向量机(RBF核,参数ν=0.1)剔除与其他纤维束差异较大的曲线。
2.5 特征表示
该研究比较了三种纤维束集合的特征表示方法:词袋表示、高斯混合模型和Fisher向量。
2.5.1 纤维束与SOI的关联
若纤维束顶点与SOI内任一5×5×5体素中心的欧氏距离小于3毫米,则将其与该SOI关联。每个SOI至少需关联50条纤维束,不足时补充距离最近的纤维束。
2.5.2 词袋表示
类似于文本检索中的词袋模型,该研究将所有与SOI关联的纤维束聚类为k=50个簇,使用k均值算法。SOI的特征向量为归一化的簇分布直方图,并通过词频-逆文档频率加权。
2.5.3 高斯混合模型
该方法假设纤维束特征服从高斯混合分布,通过后验概率表示SOI与各簇的关联强度,避免了词袋模型中硬分配的局限性。
2.5.4 Fisher向量
该方法通过描述如何调整高斯混合模型参数以最大化特定SOI的纤维束对数似然,生成高维特征向量。Fisher向量经过归一化处理以提高分类性能。
2.6 分类与评估
该研究使用支持向量机(SVM)基于特征向量预测SOI的“激活”或“非激活”标签。对于词袋和高斯混合模型特征,比较了线性SVM与χ²核SVM的性能。Fisher向量则使用线性SVM。分类器通过随机下采样平衡训练集中的类别分布,测试集不做平衡。
研究通过置换检验评估分类结果的统计显著性,随机打乱标签500次并计算p值。
2.7 可视化代表性纤维束
为增强可解释性,该研究提出了一种基于中值曲线的纤维束簇可视化方法。首先通过BundleMAP算法对纤维束进行参数化,随后按参数区间计算顶点坐标的中值,生成平滑的曲线表示。
本文涉及到的部分算法,在脑海科技多模态脑影像分析云平台可一键分析。平台内置一键式分析700+算法(包括fMRI、T1、DTI、MRS、QSM、机器学习等),用户无需学习代码,几天就可以掌握脑影像数据分析,欢迎添加微信号19906719439(樊老师)咨询产品相关
3 结果
3.1 定量结果
条形图汇总了该研究通过在独立测试集上训练支持向量机(SVM)分类器所获得的定量结果,该测试集包含64名受试者,这些受试者在该研究方法开发过程中未被使用。评估指标包括准确率(ACC)、接收者操作特征曲线下面积(AUC)、精确率、召回率以及F1分数,即精确率和召回率的调和平均值。图5的列对应于在第2.1节中介绍的四种fMRI任务。作为额外的参考,交叉表示在训练数据上进行交叉验证所获得的相应值。
图5。通过我们的方法实现的定量结果概述,按fMRI任务(列)和评估指标(行)分组。每个子图比较不同特征表示和核心(颜色)的结果。竖线显示独立测试集的结果,叉指示训练集交叉验证的结果。
点击下方链接了解平台更多算法:
3.2 可视化
图7使用第2.7节中描述的算法来可视化在分析语言任务数据时形成的50个聚类中心,并根据它们对分类的贡献进行着色。
特别是,该研究中使用的线性支持向量机为每个特征分配了一个权重,该权重在图7(右)中以颜色编码。特征权重的符号表明,一个区域与相应纤维束簇之间的高相似性会增加(红色)或减少(蓝色)该区域被分类为“激活”的概率。支持向量机在预测fMRI激活的空间范围方面远远超过了随机机会。通过可视化权重来展示每个聚类在该决策中的贡献。
然而,线性分类器权重的解释较为复杂,因为它们可能会通过依赖与标签在统计上独立的特征来补偿特征之间的依赖关系。即使特征权重的符号与其与标签的相关性也不一定一致。因此,图7将支持向量机权重的可视化与皮尔逊相关系数(左)一起展示,以提供更全面的图景。
图7。语言任务中的50个集群中心的可视化,在使用基于高斯混合模型(顶部)或特征袋表示(底部)时,根据Pearson相关性(左)或线性SV系数(右)进行着色。红色表示正相关或对“激活”分类的贡献,蓝色表示负相关。
3.3 对超参数的敏感性
在第2.3节中用于标记一个超体素为“激活”的特定阈值z_max≥3.1是从文献中选取的,但具有一定的任意性。因此,该研究尝试了在其他合理选择下结果的稳健性,特别是z_max≥{2,2.6,3.1,3.6,4}。图8展示了在四种不同任务中,使用不同特征表示和分类器时,随着激活阈值的变化,接收者操作特征曲线下面积的变化情况。同样,图9展示了在许多数量级范围内变化支持向量机正则化超参数C时,接收者操作特征曲线下面积的变化情况,C∈[2^-9,2^9],这在第2.6节中描述的自动化参数调整过程中发生。
图8。基于阈值zmax,感兴趣的超像素被标记为“激活”。图显示了使用不同特征表示和分类器获得的曲线下面积(AUC)如何取决于阈值。
图9。我们使用交叉验证来调整支持者超参数C。图显示了曲线下面积(UC)在C edo [2 - 9,29]范围内的变化情况
3.4 与两种基线方法的比较
该研究将该研究的无划分方法的功效与两种基线方法进行了比较,这些方法应用于相同的分类任务,并基于相同的数据。第一种方法使用基于划分的特征表示相同的纤维。它类似于Saygin等人(2011)之前提出的用于研究结构-功能关系的方法。这种替代描述符通过概率编码连接指纹,连接到预定义的皮层或皮下区域,这些区域在共注册的T1加权图像中使用FreeSurfer进行分割。具体来说,该研究使用了人类连接组项目提供的预计算划分,这导致在排除属于白质或脑室的区域后,共有75个目标区域。该研究通过直方图表征每个超体素,捕捉与该超体素相关联的纤维结束在每个目标区域的频率。为了与该研究自己的结果进行直接比较,该研究将这些直方图转换为第2.5.2节中的基于词袋的特征描述符。第二种基线类似于Saygin等人(2011)用于比较其自身结果的组平均基准。它在每个训练受试者中检测激活(z≥3.1),将其转换到MNI空间,并在模板空间的每个体素中从训练队列中估计激活概率p。测试受试者中的超体素然后通过将它们的个体体素转换到MNI空间,并对最大p≥0.5进行阈值处理来进行分类。为了测试该研究的方法与两种基线之间的准确性差异的统计显著性,该研究对每个fMRI任务的每个受试者的准确性进行了非参数检验。为了限制检验的数量,该研究只包括使用Fisher向量(FV)的该研究方法的变体,这导致了三种成对比较,总共十二种。该研究使用了Wilcoxon符号秩检验,并进行了Bonferroni校正(显著性水平p<0.004),以考虑重复比较。结果总结在图10中。括号表示显著差异。方框表示测试受试者准确性分布的四分位数。须线显示了分布的其余范围,但须线的长度在各自的四分位间距的1.5倍处被截断。超出该范围的个体以点标记。
图10。将我们提出的无分组技术与基于皮质分组和基于组平均概率的替代方案所实现的准确性进行比较。箱形图显示测试对象的分布,括号表示显着差异。
3.5 不同fMRI任务之间的比较
为了测试在图10中观察到的任务相关准确性差异是否具有统计学意义,该研究对Fisher向量基于分类器的准确性应用了非参数Friedman检验。该检验表明,fMRI任务对准确性具有高度显著的影响(p<10^-13)。根据Nemenyi事后检验,除了语言和运动任务之间,以及社交和情感任务之间的差异外,所有成对差异均具有显著性。
4、讨论
在本节中,该研究认为技术选择与特征表示、核函数以及正则化相关(第4.1节),以及激活阈值的确切选择(第4.2节)对结果的影响较小。另一方面,不同fMRI任务之间的准确性差异显著,表明某些任务的结构-功能关系更强(第4.3节)。通过该研究的方法创建的可视化允许以单个纤维束为单位进行解释,并与文献中的先前发现进行比较(第4.4节)。最后,该研究的无划分方法比基于划分的替代方法或组平均基准更准确地预测了结果(第4.5节)。
4.1 特征表示、核函数和正则化的影响
图5中的结果表明,与不同fMRI任务之间的差异相比,特征表示之间的差异较小。该研究原本预期Fisher向量表示会表现最佳,而它在所有情况下都获得了比基于词袋更高的AUC值。然而,它仅在20个子图中的8个中获得了最佳结果,并且在4个任务中的3个中与基于高斯混合模型(GMM)的特征在AUC方面打成平手(差异小于0.01)。卡方核函数始终比相应的线性支持向量机(SVM)获得更高的准确率,但有时差异很小。当同时考虑其他指标时,这种优势更为一致,使用基于GMM的特征时,在20种情况中有16种卡方核函数优于线性SVM,而基于词袋的情况只有11种。为了确保泛化能力和公平比较,第2.6节中的交叉验证会自动为每个任务、特征表示和核函数确定合适的支持向量机正则化超参数C的值。然而,图9表明,当在许多数量级范围内变化C时,该研究方法的性能保持稳定。
4.2 激活阈值的影响
图8显示,改变激活阈值对语言和社交任务中获得的AUC值影响非常有限。在情感和运动任务中,使用更严格的激活阈值可以获得略高的AUC值。然而,上述得出的结论并不依赖于激活阈值的确切值。特别是,在所有情况下,该研究都观察到了显著的结构-功能关系,并且表示和核函数之间的差异与阈值没有明显的相互作用。
4.3 不同fMRI任务之间的差异
考虑到该研究结果相对于技术选择和激活阈值的确切值具有相对稳定性,以及该研究模型在不同fMRI任务中获得的AUC值存在显著差异(第3.5节),该研究提出AUC值可以作为特定任务中结构-功能关系强度的稳健指标。在语言和运动任务中,从局部结构连接性预测fMRI激活的空间范围比情感任务更容易,尤其是比社交认知任务更容易。社交和情感范式的更分散性质也反映在测试队列中SOI的总体数量上,范围从运动任务的3889到语言任务的5868、社交任务的13361和情感任务的23399。
4.4 解释特征表示
该研究认为,特征表示和核函数的选择应考虑模型的可解释性,尤其是鉴于在定量结果方面的差异相对较小。Fisher向量是高维且抽象的,使其更难以解释。此外,使用非线性核函数会阻碍直接从原始特征解释支持向量机权重。当使用线性支持向量机时,基于词袋和基于GMM的特征之间的差异微不足道。为了进一步解释,该研究使用了GMM特征,这在四个任务中的三个中略微提高了准确率。为了举例说明如何解释第3.2节中描述的可视化,该研究将其与文献中的发现联系起来。特别是,该研究调查了该研究的直观印象,即在语言任务中支持“激活”分类的纤维束簇(在图7中以红色显示)与Weiner等人(2017)定义的后部弓状束(pAF)相关。该路径段之前被认为与听觉语义理解有关,这与第2.1节中描述的接受性语言理解任务的性质相吻合。该研究将自动化纤维束量化(AFQ)应用于该研究的数据,包括Weiner等人(2017)为分割pAF的扩展。结果如图11左侧所示,代表绿色的pAF、蓝色的其余弓状束(AF)和红色的垂直枕叶束(VOF),有研究表明VOF在识字和算术方面发挥作用。右侧子图显示了基于最近匹配将这种分割转移到该研究的聚类代表上的结果。为了进一步支持该研究的直观印象,即pAF(图11中的绿色)对应于被突出显示为与“在听觉语义理解期间激活”正相关的聚类(图7中的红色),图12展示了三个组内皮尔逊相关系数分布的箱线图。显然,大多数正相关都落在pAF内。
4.5 与基线的性能比较
根据图10,该研究提出的无划分描述符在四个fMRI任务中的三个任务中比基于划分的替代方法和组平均基准获得了显著更高的准确率。在任何一种情况下,剩余任务上都没有显著差异。基于划分的基线也比组平均基准更准确,但仅在两个任务中如此。该研究方法相对于基于划分的方法的改进可能归因于它能够区分通过不同路径或在不同位置到达相同目标区域的纤维束亚组。部分原因可能是使用了Fisher向量,由于不涉及基于高斯混合模型的聚类,因此无法将其应用于基于划分的方法。所有方法都导致了广泛的准确率范围,包括一些非常低的值。这部分是由于即使该研究如第2.6节所述排除了某些训练受试者,该研究也没有排除任何测试数据中的受试者,即使是那些对给定任务的fMRI反应异常低的受试者。该研究的方法与组平均基准之间的差异进一步在图13中说明。它展示了在语言任务中一个切片的结果,该受试者被选为最具代表性,因为该研究的方法在该任务上对该受试者实现了中位数准确率。组平均仅捕获激活核心处的共识区域,而该研究基于纤维束追踪的方法更完整地捕获了受试者特定的空间范围,尽管以引入更多假阳性为代价。该研究在其他受试者中也确认了类似的行为。该研究指出,即使组平均基准也可以被认为考虑了结构-功能关系,因为它依赖于用于归一化的结构对应关系。实际上,通过空间归一化实现的整体白质解剖对齐,应该在一定程度上隐含地对齐连接指纹。在该研究的实验中,该研究通过基于从非线性FA图注册中得出的相同变换来计算组平均,使这两种方法相互匹配。因此,这两种方法之间剩下的主要区别是该研究方法使用了基于纤维束追踪的描述符。在未来,探索利用额外的纤维束测量学信息是否可以进一步增加预测能力将是很有趣的。
5、总结
该研究提出了一种计算方法,可以根据从扩散磁共振成像(dMRI)纤维束追踪形成的连接指纹预测任务功能性磁共振成像(fMRI)激活的空间范围,而无需预先定义皮层和皮下结构的划分。该研究证明了该研究的方法在四种不同的fMRI任务中捕获了统计显著的结构-功能关系,独立于几个设计选择和超参数设置,在测试数据上没有在方法开发的任何形式中使用。在三个任务中,该研究获得了比基于划分和组平均基准更高的准确率。该研究还提供了一种特征可视化算法,可用于从解剖学角度解释所学模型。例如,该研究证明了其在语言fMRI任务中的结果与文献一致。
在未来,该研究希望使用该研究的方法来调查结构-功能关系在多大程度上可能受到年龄、性别或疾病等因素的调节,并在语言优势不同的亚组中进行分析。
在技术方面,该研究在当前工作中探索的特征表示可以被通过深度神经网络以端到端的方式学习的表示所取代。然而,该研究预计在这样的设置中保留该研究当前方法的几个好处将是一个挑战,例如训练的计算速度,这是排列测试的要求,适用于中等大小的训练样本,以及所使用特征的可解释性。
精读分享
研究背景
本文的研究背景主要聚焦于探索大脑结构与功能之间的关系,这是认知和临床神经科学中的一个关键领域。研究者们普遍认为,大脑的每个皮层区域都具有独特的“连接指纹”,这些指纹对其功能有着重要的影响。为了深入理解这种结构与功能的联系,研究者们通常会结合使用两种神经影像技术:扩散磁共振成像(dMRI)和功能性磁共振成像(fMRI)。dMRI能够测量水分子在不同方向上的扩散情况,从而反映出连接不同皮层区域的白质纤维的方向;而fMRI则通过记录与血液氧水平相关的信号变化来检测大脑活动。尽管已有研究尝试将这两种影像数据结合起来以探索结构与功能的关系,但这些研究大多依赖于预先定义好的大脑皮层和皮下结构的划分(即脑区划分)。然而,这种划分方式不仅耗时费力,而且不同的划分方法会对结构-功能关系的估计产生显著影响。因此,该研究提出了一种无需预先划分的新型计算框架,旨在通过机器学习方法直接从dMRI数据中提取连接指纹,并利用这些指纹来预测特定任务下fMRI激活的空间范围,从而为理解大脑的结构-功能关系提供了一种新的、更为灵活和客观的研究途径。
研究方法
该研究提出了一种基于监督机器学习的无划分(parcellation-free)方法,用于从扩散磁共振成像(dMRI)纤维束追踪数据中预测任务功能性磁共振成像(fMRI)激活的空间范围。研究的核心在于探索大脑结构与功能之间的关系,而不依赖于预先定义的皮层和皮下结构划分。具体方法如下:
1. 数据预处理与对齐:使用人类连接组项目(HCP)的数据,包括四种不同的fMRI任务范式和相应的dMRI数据。对fMRI和dMRI数据进行空间对齐,包括运动校正、脑提取、空间平滑和时间高通滤波等步骤。
2. 第一级fMRI分析:通过标准的fMRI处理流程,使用一般线性模型分析fMRI时间序列,得到与任务相关的z分数图,用于识别激活区域。
3. 定义感兴趣区域(ROI)和超体素兴趣点(SOIs):基于组平均z分数图定义任务特定的ROI,并将其扩展以包含预期激活区域及其周围一定范围。将ROI划分为大小为6.25×6.25×6.25 mm³的超体素,标记为“激活”或“非激活”,用于训练和测试机器学习模型。
4. dMRI纤维束追踪:使用MRtrix3软件包进行纤维束追踪,生成白质纤维的流线表示,并通过异常检测算法去除低概率的流线。
5. 特征表示:探索了三种不同的特征表示方法,用于将与SOI相关的流线集合编码为特征向量,包括基于聚类的词袋模型、高斯混合模型(GMM)和Fisher向量。这些方法均不依赖于预先定义的大脑划分,而是基于流线的几何形状进行聚类。
6. 分类与统计测试:使用支持向量机(SVM)对SOI进行分类,预测其是否会在特定fMRI任务中被激活。通过交叉验证调整SVM的超参数,并使用置换测试评估分类结果的统计显著性。
7. 可视化:提出了一种算法,用于可视化所选择的特征表示,通过计算每个聚类的中位数曲线来代表纤维束,并根据特征重要性对这些曲线进行着色,以便于从解剖学角度解释结果。
该研究的方法框架旨在提供一种无需预先划分大脑结构的、可解释的结构-功能关系预测模型,同时通过可视化工具支持对模型结果的神经解剖学解释。
批判性思考与展望
该研究提出了一种无划分的监督机器学习方法,用于从扩散磁共振成像(dMRI)纤维束追踪数据中预测任务功能性磁共振成像(fMRI)激活的空间范围。通过探索三种不同的特征表示方法(基于聚类的词袋模型、高斯混合模型和Fisher向量),该研究在四种不同的fMRI任务中验证了其方法的有效性,并展示了统计显著的结构-功能关系。尽管该方法在不同任务中表现出一定的准确性差异,但总体上优于基于划分和组平均的基准方法。该研究还提供了一种可视化算法,用于从解剖学角度解释特征表示。未来的研究可以进一步优化特征表示的可解释性,探索深度学习和多模态数据融合的应用,并在临床和跨物种研究中验证其方法的普适性和应用价值。
结论
该研究提出了一种无需预先划分大脑区域的机器学习方法,通过分析扩散磁共振成像(dMRI)纤维束追踪数据来预测任务功能性磁共振成像(fMRI)激活的空间范围,旨在探索大脑结构与功能之间的关系。研究者们开发了一种计算框架,使用三种不同的特征表示方法(基于聚类的词袋模型、高斯混合模型和Fisher向量)来编码纤维束信息,并通过支持向量机(SVM)进行分类,以预测特定任务下的fMRI激活。该方法在四种不同的fMRI任务中表现出统计显著的预测能力,并在大多数任务中优于基于划分和组平均的基准方法。此外,研究还提供了一种可视化算法,用于从解剖学角度解释特征表示,从而支持对结构-功能关系的直观理解。未来的研究可以进一步优化特征表示的可解释性,探索深度学习和多模态数据融合的应用,并在临床和跨物种研究中验证其方法的普适性和应用价值。
参考文献:
Khatami M, Wehler R, Schultz T. Parcellation-Free prediction of task fMRI activations from dMRI tractography. Medical Image Analysis 2022;76:102317; doi: 10.1016/j.media.2021.102317.
解读成员 | 曹修齐
审核成员 | 林增臻
排版成员 | 张菲
本公众号的文章旨在促进学术交流,如有侵权,请联系我们删除! 开放转载,欢迎大家转发到朋友圈和微信群 获取本篇文献原文,请添加微信号:18067956299(张老师)获取。 加入【脑海科技实验室文献分享群】,每日分享文献精读! 脑海科技产品介绍 目前公司销售的产品包括:1)多模态脑影像一键式数据分析平台,2)多模态脑影像数据库系统,3)磁共振数据管理及质量控制系统,4)数据分析工作站及服务器,5)脑科学设备,如:脑电、近红外、经颅磁刺激及相应导航系统等设备。 多模态脑影像一站式科研平台 目前我们的产品,已与国内200余家医院/科研单位合作,有兴趣欢迎添加微信号:19906719439(樊老师),了解产品详情。 多模态脑影像数据库 规范化管理脑影像数据:从混乱到体系的全流程数据库解决方案 点击下方链接了解平台更多算法:(1)基于Fixel分析太难?脑海科技多模态脑影像云平台一键解锁白质纤维束全分析流程!