2022国际数维杯C题题解:利用大脑结构特征和认知行为特征诊断阿尔茨海默病

原创:CSDN/知乎:川川菜鸟

问题描述

阿尔茨海默病的临床前阶段,也称为轻度认知障碍(MCI),是正常和严重之间的过渡状态。由于患者及家属对疾病的认知有限,67%的患者被诊断为中重度,已错过最佳干预阶段。因此,早期准确诊断阿尔茨海默病和轻度认知障碍具有重要意义

所附数据包含在不同时间点(一个时间点为一个量)收集的 4850 名认知正常老年人(CN)、1416 名主观记忆主诉患者(SMC)、2968 名早期轻度认知障碍患者(EMCI)、5236 名晚期轻度认知障碍患者(LMCI)和 1738 名阿尔茨海默病患者(AD)的具体信息特征。请利用附录中提供的不同类别人群的大脑结构特征和认知行为特征,构建阿尔茨海默病识别模型,设计智能诊断方法,准确诊断阿尔茨海
默病。

说明文档原文:

https://adni.loni.usc.edu/wp-content/uploads/2013/09/DOD-ADNI-PM-12.7.12-FINAL.pdf

任务

  1. 对所附数据的特征指标进行预处理,考察数据特征与阿尔茨海默病诊断的相关性。
  2. 利用附带的结构脑特征和认知行为特征,设计阿尔茨海默病的智能诊断。
  3. 首先,将 CN、MCI 和 AD 分成三大类。然后,对于 MCI 中包含的三个子类(SMC、EMCI 和 LMCI ),聚类继续细化为三个子类。
  4. 附件中的相同样本包含在不同时间点收集的特征,请分析它们与时间点的关系,以揭示不同类别疾病随时间演变的模式。
  5. 请参考相关文献来描述 CN、SMC、EMCI、LMCI 和 AD 五种类型的早期干预和诊断标准

数据说明

  • DX_b:类型。CN表示正常老年人,SMC表示主观记忆主诉患者,EMCI表示早期轻度认知障碍患者,LMCI表示晚期轻度认知障碍患者,AD表示阿尔茨海默病患者。
  • AGE:年龄
  • PTGENDER:性别
    。。。。。

不用太关心这些变量的含义,只要把目标变量确定出来就行。

思路

目标变量:DX_b
其它变量:相关特征

第一问:空缺部分可填充为0,缺失多的直接删除;缺失值少的用平均值填充。剔除一些不重要的特征。相关性可以用热力图,估计用处不大;还可以用特征重要性的排名来看,越重要则越相关,从而还能用于筛选特征。

第二问:五分类问题。建议算法:XGBoost 模型、 支持向量机 (SVM)模型、随机森林(RF)模型。建议至少使用两个算法,从而有对比性。

第三问:把三个大类分开筛选,其中单独提取H列中SMC、EMCI 和 LMCI 这三个类型的数据,然后使用无监督学习的聚类算法。例如使用:手肘法+Kmeans,这样的做法在高教杯就能国二水平。

第四问:关键在“时间点”,描述统计一些关于时间的量,可视化能说明出来更好。

第五问:这方面资料很多,晚点我再发出来。

思路如果有错误,后续我再更新。

代码

点击查看:C题

视频讲解:C题

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2023年8月17日
下一篇 2023年8月17日

相关推荐

此站出售,如需请站内私信或者邮箱!