数据导入
西门子、飞利浦、联影、GE…发布:2025-12-31 浏览:5 次
简要总结
这篇文章的核心内容是利用监督机器学习技术构建了一个基于全脑功能连接的模型(PATH-fc),用于预测阿尔茨海默病(AD)的病理特征。研究使用了来自阿尔茨海默病神经影像学倡议(ADNI)数据库的289名老年人的静息态功能磁共振成像(fMRI)数据,以及他们的脑脊液(CSF)p-tau/Aβ42比值作为目标变量。结果显示,该模型能够成功预测p-tau/Aβ42比值以及认知功能,但样本内拟合度较低,表明需要进一步开发模型。研究还发现,高病理模型主要包含大脑不同网络之间的连接(即网络间的连接),而低病理模型则更多地包含网络内的连接。
阿尔茨海默病(AD)的特征是存在两种蛋白质疾病:淀粉样蛋白和tau,这对大脑的功能和结构组织产生连锁影响。在这项研究中,使用监督机器学习技术来构建一个功能连接模型,该模型预测脑脊髓液(CSF)p-tau/Aβ42(PATH-FC模型)。该研究使用了阿尔茨海默病神经成像倡议(ADNI)中289名老年人的静息状态功能性磁共振成像(fMRI)数据。研究成功推导出PATH-FC模型来预测健康和病理衰老范围内老年人的p-tau/Aβ42比率以及认知功能。然而,样本内匹配幅度较低,表明需要进一步的模型开发。研究基于病理学的功能连接性模型包括来自大脑的多个典型网络的表示,其中网络内连接性与低病理学相关,网络间连接性与高病理学水平相关。
关键字:认知、基于连接体的预测建模、分布式网络、功能连接、静止状态
亮点:
全脑功能连接模型(PATH-fc)与AD病理生理学相关。
PATH-fc模型预测认知功能多个领域的表现。
PATH-FC模型是一个分布式模型,包括所有规范网络的表示。
1 引言
目前,超过670万美国人患有阿尔茨海默病(AD),预计到2050年这一数字将翻倍。影像学和尸检研究为AD的神经退行性过程提供了明确的证据,表明基于体液和影像学的生物标志物的变化通常在已知认知症状出现之前就开始了,有时甚至在没有认知症状的情况下就已发生。在AD中,两种经过深入研究的生物标志物是脑脊液(CSF)中的Aβ42水平(Aβ的一种最可靠的诊断性亚型)和CSF中的过度磷酸化tau(p-tau)水平,后者被认为比总tau蛋白更具有AD病理特异性。p-tau/Aβ42的比值测量方法能够捕捉到淀粉样蛋白病和tau蛋白病这两种关键蛋白病理的变异,越来越被认为具有最佳的诊断准确性之一。例如,Hansson等人的研究表明,基于Elecsys的免疫测定法测量的t-tau/Aβ42和p-tau/Aβ42与淀粉样蛋白正电子发射断层扫描(PET)的一致性比单独的CSF Aβ42更强。此外,阿尔茨海默病协会工作组最近也证实了p-tau/Aβ42在AD的诊断和预后中的应用,包括将这一比值用作研究生物治疗效果的生物标志物。鉴于淀粉样蛋白斑块和神经原纤维缠结在时空上的差异,这种比值测量方法可能能够简洁地捕捉到AD大脑的病理状态,从而提供高特异性。
除了淀粉样蛋白和tau蛋白的病理积累外,越来越多的证据表明,功能连接的变化(即空间上相邻和远处脑区之间的通信指标)在临床症状出现之前就已经发生,并且与淀粉样蛋白和tau病理的测量值相关。以往关于阿尔茨海默病(AD)中功能连接变化的研究大多集中在理解默认模式网络(DMN)的中断上,DMN是一组在疾病早期就出现代谢和组织病理学变化的中线皮质区域。然而,目前对其他关键典型网络内的变化也越来越感兴趣。研究一致表明,大规模网络(如前顶叶网络、显著性网络和背侧注意网络)的内部连接出现了中断。尽管如此,关于AD中出现中断的网络,各研究之间存在显著差异。一些研究表明网络之间的负相关性降低,而其他研究则将网络间的功能障碍归因于衰老而非AD。
此外,以往的大多数研究都采用相关性分析来研究阿尔茨海默病(AD)病理生理学与网络内和网络间功能连接中断之间的联系。近年来,监督机器学习技术取得了进展,这种技术通过将数据映射到目标变量上进行个体水平的预测,相比传统的单变量方法具有显著优势。在本研究中,采用了一种这样的技术——基于连接组的预测建模(CPM),利用脑脊液(CSF)中的p-tau/Aβ42比值生成一个全脑功能连接模型,该模型可用于预测新个体的AD病理。CPM是一种数据驱动的方法,通过识别个体整个连接组中的连接模式来预测疾病状态、症状严重程度或认知功能。
在阿尔茨海默病神经影像学倡议(ADNI)中,已有两项研究将分布式网络与认知功能联系起来,但据研究所知,还没有研究利用基于连接组的预测建模(CPM)来探索阿尔茨海默病(AD)中全脑功能连接模式与潜在生物学测量之间的联系。在本研究中,采用CPM方法开发了一个代表基于脑脊液(CSF)的AD病理生理学的功能连接的全脑特征。这一模型被称为PATH-fc模型,包括与高水平p-tau/Aβ42病理相关的功能连接(高病理模型)以及与低水平p-tau/Aβ42病理相关的连接(低病理模型)。研究还分别使用CSF Aβ42和CSF p-tau作为目标变量生成了额外的模型(结果见补充材料)。最后,为了将PATH-fc模型的临床应用扩展到AD病理生理学之外,还检验了该模型是否能够预测受AD显著影响的三个认知领域(即整体认知、情景记忆和执行功能)的表现。
2 方法
2.1 参与者和实验设计
本研究是对阿尔茨海默病神经影像学倡议(ADNI)公开数据的二次分析。要纳入ADNI,参与者需要年龄在55至90岁之间,总体健康状况良好,能够流利使用英语或西班牙语,并且老年抑郁量表(GDS)得分低于6分。研究招募的参与者包括认知功能未受损(CU)的老年人、轻度认知障碍(MCI)患者以及阿尔茨海默病(AD)患者。诊断标准包括主观报告、神经心理评估和医生评估。
为了确保阿尔茨海默病(AD)病理生理学的多样性,本研究的参与者涵盖了从健康到病理性衰老的整个范围。由于ADNI-1阶段未包含功能磁共振成像(fMRI)数据,因此本分析使用了来自ADNI-GO、ADNI-2和ADNI-3的数据。参与者被纳入研究的条件是同时具备fMRI扫描、腰椎穿刺数据以及同一时间点的认知数据。在三个数据发布阶段中,共识别出164名认知功能未受损(CU)的老年人、126名轻度认知障碍(MCI)患者和34名阿尔茨海默病(AD)患者,他们均具备完整的影像学、脑脊液(CSF)和认知测量数据。最初样本量为324名参与者,但因头部运动过度(定义为平均帧间位移(FD)>0.15毫米,n=30)、全脑覆盖不足(n=3)或全局信号不佳(n=2)而排除了35名参与者。最终样本量包括289名个体(149名CU成年人、109名MCI患者和31名AD患者),平均年龄为72.3岁(标准差7.2岁),其中女性150名(占比51.9%)。
2.2 CSF生物标志物评估和分类
脑脊液(CSF)生物标志物浓度数据来源于嵌套在ADNIMERGE R软件包中的upennbiomk9.rdata和upennbiomk10r.data文件,这些文件包含了来自ADNI四个阶段(ADNI1、ADNI-GO、ADNI-2和ADNI-3)的CSF生物标志物浓度数据。p-tau181(磷酸化的中部片段)和Aβ42的浓度是通过高度自动化的罗氏(Roche)Elecsys免疫分析法在Cobas e601自动化系统上测量的,单位为每毫升皮克数(pg/mL)。在本研究中,使用罗氏Elecsys分析法测量的浓度数据,而不是传统的AlzBio3免疫分析平台测量的数据,因为罗氏Elecsys系统是ADNI最新招募阶段(ADNI-3)的主要分析方法。目前,ADNI正在进行第四阶段(ADNI-4)的招募。
基于Elecsys的检测方法对Aβ42浓度有一个较低和较高的测量限制,即200-1700皮克/毫升(pg/mL)。在当前分析中,使用了基于校准曲线并由ADNI团队提供的上限外推值。在289名参与者中,有65名参与者的Aβ42浓度超过了上限。为所有参与者计算了p-tau/Aβ42的比值,较高的比值表示两种蛋白病理状态更为严重。
点击下方链接了解平台更多算法:
2.3 神经心理学指标和复合材料
ADNI研究的参与者接受了详细的心理测评。在本研究中,专注于分析三个在阿尔茨海默病(AD)中常受影响的认知领域:整体认知、情景记忆和执行功能。这一决定是预先做出的,是基于这三个认知领域有经过验证的综合评分工具,这些工具可以汇总多个指标的表现,得出一个总分。
评估整体认知变化的指标是预测向阿尔茨海默病(AD)转化的强有力指标,并且与痴呆的临床症状显著相关。因此,研究采用了临床前期阿尔茨海默病认知综合评分(PACC)来评估整体认知。PACC汇总了情景记忆、执行功能和整体认知等领域的表现,包括以下指标:简易精神状态检查(MMSE)总分、连线测试B、逻辑记忆II子量表的延迟回忆得分以及阿尔茨海默病评估量表——认知分量表(ADAS-COG)的延迟词汇回忆。
为了评估情景记忆,研究使用了ADNI-MEM综合评分。它包括逻辑记忆I和II任务的表现、Rey听觉言语学习测试的若干项目得分、阿尔茨海默病评估量表的认知分量表,以及简易精神状态检查中的三词回忆项目。对于执行功能,研究使用了ADNI-EF综合评分。ADNI-EF综合评分包括来自韦氏成人智力量表修订版的数字符号替换测试、数字广度倒背测试、连线测试A和B、类别流畅性测试以及钟表绘制测试。研究表明,ADNI-EF综合评分比其各个组成部分更能预测阿尔茨海默病的转化,并且与脑脊液浓度的二分化有关。
2.4 磁共振成像(MRI)数据采集
本研究中包含的结构和功能fMRI数据是使用3T飞利浦医疗系统MRI扫描仪在ADNIGO和ADNI2中采集的。ADNI3的数据是从飞利浦、西门子或GE的3T MRI扫描仪中收集的。每位参与者的T1加权3D图像(重复时间(TR)=6.7毫秒,回波时间(TE)=3.1毫秒,翻转角=9°,视野=256×256×170毫米³,切片厚度=1.20毫米,体素大小标准=1.0毫米³,加速体素大小=1.11毫米³,170个矢状切片)被纳入研究。对于ADNIGO和ADNI2的参与者,使用以下采集参数获取了140个体积的静息态fMRI数据:TR=3000毫秒,TE=30毫秒,翻转角=80°,视野=212×212毫米²,切片厚度=3.13毫米,体素大小=3.125毫米³,48个矢状切片。有五名参与者的TR为2.25毫秒。然而,研究通过在所有需要指定TR的数据预处理和后处理步骤中使用特定受试者的TR来解决这一差异。对于ADNI3的参与者,使用以下采集参数获取了200个体积的静息态fMRI数据:TR=3000毫秒,TE=30毫秒,翻转角=90°,几何尺寸=220×220×163毫米,切片厚度=3.13毫米,体素大小=3.125毫米³。所有从ADNI下载的结构和功能MRI数据首先从DICOM格式转换为NIFTI格式,并通过经过验证的质量控制流程,以初步评估信噪比(SNR)、FD和信号的整体漂移率。
2.5 磁共振成像(MRI)数据预处理
在数据预处理之前,排除了功能数据的前三个体积,以允许基于血液氧合水平依赖(BOLD)的信号稳定。当需要时,将ADNI提供的切片时间信息插入到DICOM文件头中。使用fMRIPrep v1.4.1对解剖和功能数据进行预处理。每个参与者的T1加权(T1w)图像通过N4BiasFieldCorrection进行了强度非均匀性校正,并使用Nipype实现的antsBrainExtraction.sh进行了去颅骨处理。然后使用FreeSurfer v6.0.1中的recon-all重建大脑表面,并通过antsRegistration工具进行非线性配准,将大脑空间标准化到蒙特利尔神经研究所(MNI)空间。使用FMRIB软件库(FSL)v5.0.9中的fast软件对去颅骨后的T1w图像进行脑组织分割,以区分脑脊液(CSF)、白质(WM)和灰质(GM)。
功能数据使用来自功能性神经影像分析软件(AFNI)的3dTshift进行了切片时间校正,使用mcflirt进行了运动校正,并使用基于边界配准(使用FreeSurfer v6.0.1中的bbregister)的九自由度方法与相应的T1加权(T1w)图像进行了共配准。运动校正变换、BOLD到T1w的变换以及T1w到模板(MNI)的变形被串联起来,并使用ANTs v2.1.0中的antsApplyTransforms通过Lanczos插值在单一步骤中应用。基于CompCor程序提取了生理噪声回归因子。使用Nipype的实现,基于功能数据计算了包括FD和全局信号在内的多个混杂时间序列。fMRIPrep的许多内部操作使用了Nilearn,主要在BOLD处理工作流中。更多详细信息请参见:
(https://fmriprep.readthedocs.io/en/latest/workflows.html。)
随后,使用Nilearn中的signal.clean来移除以下可能导致信号方差的潜在混杂因素:脑脊液(CSF)信号的平均值、白质(WM)信号的平均值、全局信号的平均值,以及一个包含24个参数的运动模型(即六个刚体运动参数、六个时间导数及其平方)和线性趋势。为了进一步减少头部运动相关混杂因素的潜在影响,将FD值≥0.5毫米的异常体积作为回归因子纳入到干扰回归模型中。功能数据在时间域上进行了高通滤波,以去除频率低于0.01赫兹的信号。功能数据未进行空间平滑处理。
2.6 全脑分组和功能连接性估计
使用Shen脑区划分方案,将每个参与者的预处理静息态数据划分为268个连续的功能定义区域。功能图谱从MNI空间转换到每个参与者的原始空间。通过计算每个区域内所有体素的平均值来提取每个区域的BOLD信号时间序列。通过计算所有节点对之间平均活动时间序列的皮尔逊相关系数,得出每对脑区(或节点)之间的连接,即边。在对功能连接矩阵应用费舍尔z变换之前,排除了所有受试者中缺失的六个节点(这些节点在三个或更多受试者中缺失),从而为每个参与者生成了一个262×262的功能连接矩阵,矩阵中的单元格代表这些边或相关性的强度。
2.7 CPM
2.7.1 PATH-fc功能连接模型的推导
图1展示了基于连接组的预测建模(CPM)各个步骤的示意图。首先,为了构建PATH-fc模型,采用了一种留一法交叉验证(LOOCV)程序,将数据分为一个训练集(n-1名参与者)和一个测试集。这个过程不断重复,直到每个参与者都作为测试参与者(见图1A)。在选择边的过程中,训练集中所有参与者的功能连接矩阵的每条边都与脑脊液(CSF)中的p-tau/Aβ42进行了相关性分析(见图1B)。为了进一步减少运动的影响,在这一阶段使用了偏相关分析,以排除每个参与者的平均FD值。
图1.CPM模型的示意图。该图有助于说明构建CPM模型的过程。CPM,基于连接体的预测建模。
为了定义高病理模型,将功能连接矩阵中与脑脊液(CSF)p-tau/Aβ42呈正相关的每条边进行选择,并设定阈值为p < 0.01,从而得到一组每条剩余边都与CSF病理呈正相关的边。所有剩余边的权重被提取并平均,以计算高病理模型的网络强度。同样地,只有那些在功能连接与CSF p-tau/Aβ42之间显示出显著负相关的边被保留在低病理模型中。这些经过阈值处理且呈负相关的边被平均,以计算低病理模型的网络强度。
PATH-FC模型是一个组合模型,可以考虑与p-tau/Aβ42的正相关和负相关。从高病理模型的网络强度中减去低病理模型的网络强度,以计算PATH-FC模型的网络强度,PATH-FC模型是本研究中用于预测AD病理和认知功能的主要模型。
然后,研究使用稳健回归计算了以下三者之间的匹配:(1)在高Ptu/Aβ42模型中观察到的p-tau/A β 42评分和网络强度,(2)在低p-tau/Aβ42模型中观察到的p-tau/Aβ42评分和网络强度,(3)在PATH-FC模型中观察到的p-tau/Aβ42评分和网络强度(图1C)。这些模型的Beta系数分别提供了高病理学模型、低病理学模型和PATH-FC模型中观察到的分数和网络强度之间的匹配估计。
在预测阶段,研究使用训练模型中获得的回归系数来预测被遗漏参与者的p-tau/Aβ42(图1D)。整个过程反复重复,直到每个参与者都成为测试参与者。因此,这种CPM技术为每个参与者产生了预测的AD病理评分,然后使用Spearman的等级相关性(rs)将其与观察到的评分进行关联,以生成模型性能的衡量标准(图1 E)。采用排列测试(涉及对观察到的AD病理评分进行洗牌并实施1000次CPM LOCOG以建立零分布)来评估PATH-FC模型的预测性能是否显着优于机会。
2.7.2 PATH-FC模型预测认知功能的应用
为了确定PATH-fc模型是否能够预测未见个体的认知表现,研究使用PATH-fc模型中的平均连接强度来训练针对PACC、ADNI-MEM和ADNI-EF的认知表现的三个预测模型,每个模型都使用留一法交叉验证(LOOCV)方法进行评估。具体来说,重复图1中C到E的步骤来得出预测的认知分数。
首先,使用稳健回归,生成了代表PATH-FC模型的网络强度与观察到的认知分数之间的匹配度的Beta系数。对PACC、ADNI-EM和ADNI-EF运行了三个独立的模型。然后,使用这些适合性估计,迭代预测被遗漏的参与者的认知评分,直到每个参与者都成为测试参与者。与病理评分预测类似,该过程为每个参与者的每个认知领域生成了预测评分。然后使用Spearman的等级相关性(rs)将这些预测分数与观察到的认知分数进行关联,以生成模型性能的测量。采用排列测试来评估PATH-FC模型对认知功能的预测性能是否显着优于偶然性。
2.7.3 PATH-FC模型的解剖和网络定位
如果一条边在所有受试者的每次留一法交叉验证(LOOCV)迭代中都出现,则认为它是可靠的。最终的掩膜包含了每次LOOCV迭代中都出现的边,分别代表高PATH-fc网络中的333条边和低PATH-fc网络中的344条边。为了总结宏观区域和典型网络的参与情况,将Shen图谱的全部268个节点根据其与Finn等人(图1)确定的10个宏观区域和Noble等人(图2)确定的10个典型网络的空间重叠情况进行分组。对于宏观区域,研究使用了以下解剖学标签:前额叶、运动区、岛叶、顶叶、颞叶、枕叶、边缘系统、小脑、脑干和皮下组织。典型网络包括内侧前额叶、前顶叶、默认模式、运动、视觉I、视觉II、视觉联合、显著性、皮下和小脑网络。接下来,计算了网络内和网络间的边的数量。为了考虑每个网络的相对参与度,通过在网络大小(节点数量)的基础上对每个网络内部和每对可能的网络之间的边数进行归一化处理,以调整网络大小。研究使用Flourish数据可视化工具(https://flourish.studio/)创建了环形图,并使用BrainNet Viewer对PATH-fc模型中的边进行了可视化。
2.8控制分析
为了确保研究结果对所选择的交叉验证技术(留一法交叉验证,LOOCV)具有鲁棒性,研究还使用10折交叉验证法进行了主要分析,以预测p-tau/Aβ42。为此,数据被随机分成大约10个相等的部分。每一部分都作为测试集使用一次,而剩余的九部分则用于训练模型。随后,10折交叉验证重复进行了1000次,每次迭代中p-tau/Aβ42都被随机打乱,以构建一个零分布模型。通过比较预测真实p-tau/Aβ42的模型数量与零分布模型的数量,计算出置换检验的p值。额外的控制分析包括在选择边的步骤中控制年龄,除了控制运动外。
3 结果
3.1 AD病理和认知复合物的分布
研究在最终样本中纳入了149名CU参与者、109名患有菊苣的参与者和31名患有AD的参与者。如表1所示,参与者主要是白人(92.04%),平均年龄为72岁,受教育程度为17年。33.8%的CU个体、45%的MCB个体和83.9%的AD个体载脂蛋白E(APOE)e4阳性。(缩写:AD,阿尔茨海默病;ADNI,阿尔茨海默病神经影像学倡议;CU,认知功能未受损;MCI,轻度认知障碍;PACC,临床前期阿尔茨海默病认知综合评分;SD,标准差。)
表1 参与者的基线特征
3.2 静息状态连接模式预测AD病理
研究采用基于连接组的预测建模(CPM,见图1)来开发一个全脑功能连接的阿尔茨海默病(AD)病理标志物,称为PATH-fc模型。整体PATH-fc模型成功预测了AD病理评分(rs = 0.25,p = 0.001,1000次迭代置换检验)。此外,高病理模型和低病理模型分别包含333条和344条边(见图2A、B),也成功预测了AD病理(高病理模型:rs = 0.28,p = 0.001;低病理模型:rs = 0.22,p = 0.002,1000次迭代置换检验;见图2C)。研究进行了两项控制分析以确保模型的稳健性。首先,使用10折交叉验证构建了一个CPM,以检验交叉验证方法的选择是否影响结果。其次,在特征选择步骤中控制了年龄的影响。当使用10折交叉验证时(rs = 0.22,p = 0.0001,1000次迭代置换检验),以及在特征选择步骤中考虑年龄因素后(rs = 0.19,p = 0.005,1000次迭代置换检验),PATH-fc模型的预测结果仍然保持高度一致。
图2.展示了高(红色)和低(蓝色)PATH-fc模型的可视化,以及两个模型和组合模型(绿色)的样本内拟合情况。(A)部分展示了高和低PATH-fc模型的解剖分布。677条边涵盖了所有宏观区域的节点。(B)部分展示了高、低和组合PATH-fc模型与ADNI病理数据的内部模型拟合情况。(C)部分展示了组合PATH-fc模型对PACC、ADNI-MEM和ADNI-EF的认知功能预测的内部模型拟合情况。散点图表示观察到的评分(AD病理、PACC、ADNI-MEM和ADNI-EF)与通过交叉验证得出的相同指标的预测评分之间的斯皮尔曼相关性。直方图表示在1000次迭代中随机打乱的连接矩阵和相应的指标配对,以计算最终的显著性p值。缩写:AD,阿尔茨海默病;ADNI,阿尔茨海默病神经影像学倡议;ADNI-EF,阿尔茨海默病神经影像学倡议执行功能;ADNI-MEM,阿尔茨海默病神经影像学倡议执行记忆;CU,认知功能未受损;MCI,轻度认知障碍;PACC,临床前期阿尔茨海默病认知综合评分。
3.3 PATH-FC模型预测认知功能
在确定静息态功能连接能够预测阿尔茨海默病(AD)病理之后,研究考察了结合高模型和低模型网络强度的PATH-fc模型是否能够预测认知功能未受损(CU)、轻度认知障碍(MCI)和阿尔茨海默病(AD)个体的认知功能。研究发现,基于PATH-fc强度训练的模型能够显著预测PACC评分(rs = 0.46,p = 0.001,1000次迭代置换检验)、ADNI-MEM评分(rs = 0.37,p = 0.002,1000次迭代置换检验)以及ADNI-EF评分(rs = 0.34,p = 0.003,1000次迭代置换检验)。图2C展示了预测认知评分与实际认知评分之间的拟合相关图。
3.4 PATH-fc是一个高度分布式的模型,高病理模型以网络间的边为特征,而低病理模型以网络内的边为特征
PATH-fc模型代表了高病理模型和低病理模型之间网络强度的差异,总共包含677条边。高病理模型总共包含333条边。其中,左半球有85条同侧连接,右半球有71条同侧连接,还有177条对侧连接。此外,高病理模型的333条边还包括了所有10个典型网络的网络间和网络内的边(见图3A)。在功能网络层面考察了这些边的分布情况,并根据10个典型网络对它们进行了分组。通过基于网络大小对边数进行归一化处理,以考虑Shen网络大小的差异,具体方法如前所述。
在进行归一化处理后,发现相对贡献最大的三个网络是前顶叶网络(平均贡献值 = 1.89)、默认模式网络(平均贡献值 = 1.50)和视觉II网络(平均贡献值 = 1.40)(见图3)。此外,还对高病理模型是否主要包含网络内连接还是网络间连接进行了分析。在333条边中,有6条是网络内连接,327条是网络间连接。根据归一化公式计算,这些边显示出网络间连接的相对贡献显著高于网络内连接(网络间平均贡献值:1.13,网络内平均贡献值:0.19)。在视觉II与前顶叶网络、视觉联合与前顶叶网络以及视觉II与默认模式网络之间,发现了最高的归一化贡献值。
接下来,对低病理模型中边的分布进行了描述,共发现了344条边。具体而言,低病理模型包括198条同侧连接(右侧 = 101条,左侧 = 97条)和146条对侧连接。研究还从网络层面评估了边的分布情况,并识别出相对贡献最高的网络如下:默认模式网络(DMN,平均贡献值 = 1.8)、小脑网络(平均贡献值 = 1.6)以及前顶叶网络和视觉II网络(每个网络的平均贡献值 = 1.2)。有趣的是,在低病理模型的344条边中,有82条是网络内连接,262条是网络间连接。应用相同的贡献公式计算这些边的贡献值,结果显示网络内连接的相对贡献高于网络间连接(网络内平均贡献值:2.53,网络间平均贡献值:0.89)。
图3 展示了基于Noble等人(2017)的划分方法对节点进行划分的10个典型网络在高(A)和低(B)PATH-fc模型中的参与情况。环形图可视化中的带状图与每个网络在PATH-fc模型中的代表性成比例。顶部和底部面板中展示的矩阵分别显示了每个网络对高和低PATH-fc模型的相对贡献。这些网络贡献已经使用Greene等人(2018)中描述的公式进行了调整。
4 讨论
本研究的目标是利用监督机器学习,通过基于脑脊液(CSF)的阿尔茨海默病(AD)病理生物标志物,推导出全脑同步神经活动的特征。利用基于连接组的预测建模(CPM),该方法能够识别整个大脑中与目标变量相匹配的功能性边的网络,研究成功地推导出了PATH-fc模型,以预测p-tau/Aβ42的比值以及在健康和病理性衰老范围内老年人的认知功能。然而,样本内拟合度较低,这表明未来模型开发需要纳入PET或基于血浆的AD病理生物标志物。
最终得到的PATH-fc模型涵盖了所有宏观区域和10个典型网络的代表性。研究结果与体内和体外研究一致,这些研究表明即使在疾病的早期阶段,大脑皮层的广泛区域也参与了阿尔茨海默病(AD)的发病机制。PATH-fc模型包含了677条边,其中前顶叶网络、默认模式网络、运动网络、视觉I和II网络、视觉联合网络以及小脑网络在整体模型中相对于其网络大小表现出较大的贡献。
默认模式网络(DMN)和前顶叶网络在PATH-fc模型中发挥节点作用。具体来说,DMN的网络间连接预测了较高的p-tau/Aβ42比值,而网络内的连接性则预测了较低的阿尔茨海默病(AD)病理生理学。这一结果与研究脑脊液(CSF)中AD病理测量值与功能连接之间关联的研究一致,其中较低水平的Aβ42和p-tau与DMN节点内连接性的降低有关。此外,研究将这些发现扩展到包括DMN与显著性网络、前顶叶网络和语言网络之间的相互作用。
PATH-fc模型还包括来自前顶叶网络区域的功能连接。与默认模式网络(DMN)类似,前顶叶网络与VI、VII、视觉联合和运动网络之间的网络间连接与高病理水平相关。相比之下,前顶叶网络内的网络内连接与较低的病理水平相关。实际上,低病理模型包括了来自10个典型网络中的6个网络的网络内连接,这些连接展示了特定网络内的功能通信,而中断的网络间连接则与高水平的阿尔茨海默病(AD)病理相关。
阿尔茨海默病(AD)与大脑中特定典型网络的系统性分离减少有关,最近的研究指出,随着痴呆严重程度的增加,特定网络的分离减少。具体来说,更高的痴呆严重程度与默认模式网络和前顶叶网络与多个感觉运动网络和视觉网络之间的网络间连接性增加有关,同时也与体感运动网络和扣带回-岛盖网络的网络内连接性减少有关。超越这些大脑行为相关性研究,使用基于连接组的预测建模(CPM)开发了一个预测模型,该模型涵盖了整个连接组的网络间连接和网络内连接,以预测新个体的AD病理。尽管未来的研究需要评估PATH-fc模型在独立数据集中的普适性,但将CPM应用于AD病理生理学的这一概念验证代表了朝着更简洁地理解AD病理的功能连接相关性迈出了重要的第一步。
在本研究中,扩展了当前支持阿尔茨海默病(AD)病理学和临床指标之间关联的文献,展示了用于预测p-tau/Aβ42比值的PATH-fc模型,也能成功预测整体认知、情景记忆和执行功能等重要的临床指标。因此,尽管以往的研究已经证明了功能连接中断与认知功能之间的关联,以及基于病理学的AD病理和认知的生物标志物之间的关联,但研究直接支持了在健康和病理性衰老中,AD病理依赖的功能连接障碍在大规模功能网络中对认知功能的影响。
在考虑研究的结果和解释时,必须将其放在某些局限性的背景下。首先,尽管该模型对多种潜在的混杂因素具有鲁棒性,例如不同的交叉验证技术(留一法交叉验证与10折交叉验证)以及像年龄和运动这样的协变量,但综合模型的预测精度仍然较低(相关系数r = 0.25)。即使分别使用p-tau和Aβ42构建模型,模型拟合度仍然很低。这表明未来模型开发需要更具体的病理生理学目标变量。
此外,基于脑脊液(CSF)p-tau/Aβ42比值推导出的PATH-fc模型缺乏PET(正电子发射断层扫描)基础的AD病理标志物所能提供的空间特异性。在数据分析时选择使用基于CSF的AD病理生理学测量值,因为当时ADNI数据集中没有PET值。此外,该项目未来的一个目标是在独立数据集中对外部验证PATH-fc模型,而基于CSF的标志物目前在公开的纵向数据集中比PET或基于血液的生物标志物更容易获得。鉴于PATH-fc模型的预测精度较低,未来的研究还可以通过整合PET和fMRI来创建联合连接组模型,将匹兹堡化合物B(PiB)和tau示踪剂的区域更新与功能连接估计相结合,以构建具有空间特异性和更准确的基于病理的模型。此外,鉴于检测血浆基础生物标志物的方法学迅速发展,这些生物标志物是测量淀粉样蛋白和tau负荷的相对低成本的替代品,未来的研究还可以通过实施这种方法来推导与血浆基础的淀粉样蛋白和tau指标相关联的功能连接模式,这也有助于提高使用AD病理生理学构建的这些模型的预测精度。
最后,必须指出,本研究中用于构建阿尔茨海默病(AD)病理模型的ADNI样本中,92%的参与者是非西班牙裔白人。尽管ADNI数据库显著推进了研究对AD病理生理学和进展的理解,但公开数据集中少数族裔参与者的代表性不足是一个重大限制,影响了研究研究结果的外部有效性。以往使用机器学习的研究表明,主要由白人参与者构建的大脑行为模型在预测少数族裔参与者的结局时可能会引入显著偏差。为了应对这一问题,已经成立了ADNI多样性工作组,以改善ADNI数据库中少数族裔参与者的招募和保留。未来的发布预计将包括更成比例的种族和民族群体的代表性,这对于开发稳健且可推广的大脑基础模型至关重要。
在本研究中,使用了一种基于脑脊液(CSF)的阿尔茨海默病(AD)病理学指标,该指标整合了AD报告中最常见的两种病理生理学特征,以开发一个能够预测新个体病理的功能连接网络。由于收集脑脊液和基于PET的测量方法可能具有侵入性,基于fMRI的生物标志物提供了一种较为不侵入性的方法,用于监测和预测临床结果。然而,由于样本内拟合度较低,进一步的模型开发至关重要。此外,还需要使用外部数据集进行验证研究,以评估该模型在预测病理和诊断转化方面的实用性。
精读分享
1 研究背景
阿尔茨海默病(AD)是一种神经退行性疾病,其特征是大脑中淀粉样蛋白(Aβ)和tau蛋白的异常积累。这两种蛋白病理对大脑的功能和结构组织产生级联效应。目前,AD的诊断主要依赖于脑脊液(CSF)中Aβ42和p-tau水平的检测,其中p-tau/Aβ42比值被认为具有较高的诊断准确性。此外,越来越多的研究表明,大脑功能连接的变化在AD的临床症状出现之前就已经发生,并且与Aβ和tau病理相关。因此,本研究旨在利用监督机器学习技术构建一个基于全脑功能连接的模型,以预测AD的病理状态。
2 研究方法
2.1 数据来源与参与者
本研究数据来自阿尔茨海默病神经影像学倡议(ADNI)数据库,包含认知功能未受损(CU)的老年人、轻度认知障碍(MCI)患者及阿尔茨海默病(AD)患者。最终纳入289名参与者,平均年龄72.3岁,女性占比51.9%。参与者需在55至90岁之间,健康状况良好,能流利使用英语或西班牙语,且老年抑郁量表得分低于6分。研究排除了因头部运动过度、全脑覆盖不足或全局信号不佳的参与者。
2.2 神经影像分析流程
研究使用3T飞利浦医疗系统MRI扫描仪在ADNIGO和ADNI2中采集结构和功能fMRI数据,而ADNI3的数据则来自飞利浦、西门子或GE的3T MRI扫描仪。每位参与者的T1加权3D图像被纳入研究,同时采集了140个体积(ADNIGO和ADNI2)或200个体积(ADNI3)的静息态fMRI数据。
研究依次使用N4BiasFieldCorrection对T1加权图像进行强度非均匀性校正,使用antsBrainExtraction.sh去除颅骨,利用FreeSurfer v6.0.1的recon-all重建大脑表面,并通过antsRegistration工具将大脑空间标准化到蒙特利尔神经研究所(MNI)空间。使用FSL v5.0.9的fast软件对去颅骨后的T1加权图像进行脑组织分割,区分脑脊液(CSF)、白质(WM)和灰质(GM)。研究使用AFNI的3dTshift对功能数据进行切片时间校正,使用FSL的mcflirt进行运动校正,并将功能数据与相应的T1加权图像进行共配准。基于CompCor程序提取生理噪声回归因子,同时研究使用Nilearn的signal.clean去除潜在的信号方差混杂源,包括平均CSF信号、平均WM信号、平均全局信号和24参数运动模型,并进行线性趋势校正。功能数据在时间域上进行了高通滤波,去除频率低于0.01 Hz的信号。将FD值≥0.5 mm的异常体积作为回归因子纳入干扰回归模型,以进一步减轻头部运动相关混杂因素的影响。
使用Shen脑区划分方案将预处理后的静息态数据划分为268个连续的功能定义区域。通过计算每个区域内所有体素的平均值提取BOLD信号时间序列。利用皮尔逊相关系数计算每对脑区(节点)之间的平均活动时间序列的相关性,从而定义节点之间的连接(边)。在对功能连接矩阵应用费舍尔z变换之前,排除了在三个或更多受试者中缺失的六个节点,最终得到每个参与者的262×262功能连接矩阵,矩阵中的单元格代表这些边或相关性的强度。
2.3 统计方法与模型
研究采用基于连接组的预测建模(Connectome-based Predictive Modeling, CPM)技术来构建和验证一个能够预测阿尔茨海默病(AD)病理状态的功能连接模型(PATH-fc模型)。使用留一法交叉验证划分数据集。在训练集中,计算功能连接矩阵的每条边(即每对脑区之间的连接)与脑脊液(CSF)中p-tau/Aβ42比值的相关性。使用偏相关分析,控制每个参与者的平均帧间位移(FD)值,以减少头部运动对结果的影响。选择与CSF p-tau/Aβ42呈正相关的边,设定阈值为p < 0.01。这些边代表与高病理状态相关的功能连接。选择与CSF p-tau/Aβ42呈负相关的边,同样设定阈值为p < 0.01。这些边代表与低病理状态相关的功能连接。计算高病理模型和低病理模型的网络强度,分别通过平均所有相关边的权重来实现。PATH-fc模型是高病理模型和低病理模型的组合模型,通过从高病理模型的网络强度中减去低病理模型的网络强度来计算最终的网络强度。使用稳健回归(robust regression)计算观察到的p-tau/Aβ42分数与高病理模型、低病理模型和PATH-fc模型的网络强度之间的拟合度。使用训练模型中得到的回归系数预测留出参与者的p-tau/Aβ42分数,并通过与观察到的分数进行斯皮尔曼秩相关分析(Spearman's rank correlation)来评估模型性能。通过1000次迭代置换检验(permutation testing)来评估PATH-fc模型的预测性能是否显著优于随机水平。
3 研究结果
本研究成功构建了一个基于全脑功能连接的模型(PATH-fc模型),用于预测阿尔茨海默病(AD)的病理状态和认知功能。研究纳入了289名参与者,包括认知功能未受损(CU)的老年人、轻度认知障碍(MCI)患者和AD患者。这些参与者的平均年龄为72.3岁,教育年限为17年,大多数为白人(92.04%)。在这些参与者中,CU个体中33.8%、MCI个体中45%和AD个体中83.9%为载脂蛋白E(APOE)e4阳性。CSF p-tau/Aβ42比值在CU、MCI和AD组中分别为0.02、0.04和0.06,显示出随着病理状态的加重,p-tau/Aβ42比值显著增加。
PATH-fc模型在预测AD病理方面表现出良好的性能。整体模型成功预测了p-tau/Aβ42比值(斯皮尔曼相关系数 rs=0.25,p = 0.001,1000次迭代置换检验)。高病理模型(包含333条边)和低病理模型(包含344条边)也分别成功预测了AD病理,高病理模型的 rs =0.28,p = 0.001,低病理模型的 rs =0.22,p = 0.002。此外,控制分析表明,使用10折交叉验证(r s =0.22,p = 0.0001,1000次迭代置换检验)和在特征选择步骤中控制年龄(rs =0.19,p = 0.005,1000次迭代置换检验)时,PATH-fc模型的预测结果仍然一致。
PATH-fc模型不仅能够预测AD病理,还能显著预测认知功能。具体来说,该模型能够显著预测临床前期阿尔茨海默病认知综合评分(PACC,rs =0.46,p = 0.001,1000次迭代置换检验)、ADNI情景记忆评分(ADNI-MEM,rs =0.37,p = 0.002,1000次迭代置换检验)和ADNI执行功能评分(ADNI-EF,rs =0.34,p = 0.003,1000次迭代置换检验)。这些结果表明,基于功能连接的模型不仅能够反映病理状态,还能预测与AD相关的认知功能变化。
PATH-fc模型是一个高度分布式的模型,涵盖了所有宏观区域和10个典型网络。高病理模型主要包含网络间连接,而低病理模型主要包含网络内连接。具体来说,高病理模型中的333条边中,有85条同侧连接(左半球51条,右半球34条)和177条对侧连接。这些边涉及了前顶叶网络、默认模式网络、运动网络、视觉I和II网络、视觉联合网络和小脑网络等。低病理模型中的344条边中,有198条同侧连接(右半球101条,左半球97条)和146条对侧连接。这些边主要涉及默认模式网络、小脑网络、前顶叶网络和视觉II网络等。
尽管PATH-fc模型在预测AD病理和认知功能方面表现出一定的有效性,但样本内拟合度较低,表明需要进一步开发模型。未来的研究可以考虑整合PET或基于血浆的生物标志物,以提高模型的预测准确性。此外,未来的研究需要在独立数据集中验证PATH-fc模型的普适性,并考虑纳入更多样化的样本,以提高模型的外部有效性。
4 讨论与结论
本研究利用监督机器学习技术构建了一个基于全脑功能连接的模型(PATH-fc模型),用于预测阿尔茨海默病(AD)的病理状态和认知功能。研究结果表明,该模型能够成功预测脑脊液(CSF)中p-tau/Aβ42比值以及认知功能,但样本内拟合度较低,提示需要进一步模型开发。
PATH-fc模型涵盖了所有宏观区域和10个典型网络,表明阿尔茨海默病的发病机制涉及大脑皮层的广泛区域,即便是在疾病的早期阶段。高病理模型主要包含网络间连接,而低病理模型主要包含网络内连接。这一发现与现有文献一致,强调了默认模式网络(DMN)和前顶叶网络在AD病理中的重要作用。具体而言,DMN的网络间连接与高p-tau/Aβ42比值相关,而网络内连接则与低病理状态相关。这与先前研究结果相符,即较低水平的Aβ42和p-tau与DMN节点内连接性的降低有关。此外,本研究还将这些发现扩展到包括DMN与显著性网络、前顶叶网络和语言网络之间的相互作用。
PATH-fc模型的构建不仅基于网络间连接,还涵盖了网络内连接,这使得该模型能够预测新个体的AD病理状态。尽管未来研究需要评估PATH-fc模型在独立数据集中的普适性,但本研究将CPM应用于AD病理生理学的这一概念验证,代表了朝着更简洁地理解AD病理的功能连接相关性迈出了重要的第一步。
然而,本研究也存在一些局限性。首先,尽管模型对多种潜在混杂因素(如不同的交叉验证技术、年龄和运动)具有鲁棒性,但综合模型的预测精度仍然较低(相关系数r = 0.25)。即使分别使用p-tau和Aβ42构建模型,模型拟合度依然较低。这表明未来模型开发需要更具体的病理生理学目标变量。其次,基于CSF的p-tau/Aβ42比值的PATH-fc模型缺乏PET基础标志物所能提供的空间特异性。由于在数据分析时ADNI数据集中没有PET值,因此本研究选择了基于CSF的测量方法。此外,鉴于未来项目的一个目标是在独立数据集中对外部验证PATH-fc模型,而基于CSF的标志物在公开的纵向数据集中比PET或基于血液的生物标志物更容易获得,因此这一选择具有一定的合理性。鉴于PATH-fc模型的低预测精度,未来的研究可以通过整合PET和fMRI来创建联合连接组模型,将匹兹堡化合物B(PiB)和tau示踪剂的区域更新与功能连接估计相结合,以构建具有空间特异性和更准确的基于病理的模型。此外,鉴于检测血浆基础生物标志物的方法学迅速发展,这些生物标志物是测量淀粉样蛋白和tau负荷的相对低成本的替代品,未来的研究还可以通过实施这种方法来推导与血浆基础的淀粉样蛋白和tau指标相关联的功能连接模式,这也有助于提高使用AD病理生理学构建的这些模型的预测精度。
5 批判性思考
本研究中用于构建AD病理模型的ADNI样本中,92%的参与者是非西班牙裔白人。尽管ADNI数据库显著推进了研究对AD病理生理学和进展的理解,但公开数据集中少数族裔参与者的代表性不足是一个重大限制,影响了研究结果的外部有效性。以往使用机器学习的研究表明,主要由白人参与者构建的大脑行为模型在预测少数族裔参与者的结局时可能会引入显著偏差。为了解决这一问题,已经成立了ADNI多样性工作组,以改善ADNI数据库中少数族裔参与者的招募和保留。未来的研究预计将包括更成比例的种族和民族群体的代表性,这对于开发稳健且可推广的大脑基础模型至关重要。
参考文献:
Prakash RS, McKenna MR, Gbadeyan O, Shankar AR, Pugh EA, Teng J, Andridge R, Berry A, Scharre DW. A whole-brain functional connectivity model of Alzheimer's disease pathology. Alzheimers Dement. 2025 Jan;21(1):e14349. doi: 10.1002/alz.14349. Epub 2024 Dec 23. PMID: 39711458; PMCID: PMC11781256.
解读成员|王淳 审核成员|宋佳颖