玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集

文章目录

数据集介绍

Lung-PET-CT-Dx是一个公开肺癌目标检测数据集,该公共数据集源自 The Cancer Imaging Archive(TCIA)。TCIA是肿瘤研究方面的著名的医学影像公开数据库。大部分数据以 DICOM 格式存储,所有数据都经过去隐私处理。

该数据集由肺癌受试者的 CT 和 PET-CT DICOM 图像组成,带有 XML 注释文件(xml文件中用边界框标识了肿瘤位置和分类)。 这些PET/CT影像是从肺癌患者中回顾性获得的,患者均经肺活检确诊 。 根据组织病理学诊断对受试者进行分组,分为4类,“A”诊断为腺癌,“B”为小细胞癌,“E”为大细胞癌,“G”为鳞状细胞癌。

数据集中共有355例次的影像记录,记录了患者的CT或PET-CT的影像资料,CT图像的分辨率是512×512。

下面两张图是下载好的数据集的CT图像部分。其主要是胸部PET-CT的图像,包括了 灰度的CT图像 和 带代谢摄取增高显像的CT图像。

如何从TCIA下载数据集

(该小节可能需要特殊方式访问目标网站)

Lung-PET-CT-Dx数据集源自TCIA。TCIA是肿瘤研究方向的医学影像公开数据库。
我们可以在官网的 Access The Data → Browse Data Collection 浏览所有数据集。

我们可以在Filter table处,输入“lung”等关键词筛选我们需要的数据集。

我们输入Lung-PET-CT-Dx进入我们的目标数据集页面。
找到下面的Data Access界面。

Images 为我们需要下载的影像资料。
Annotation Files是目标检测的标注数据(即XML注释文件,标注了肿瘤位置和分类)。
Clinical Data是患者相关的临床资料。
下面两个可以直接下载。

第一个Image,我们点击Download,会发现下载了一个tcia文件(Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia)。
这是一个下载列表文件,需要使用网站提供的 NBIA Data Retriever 软件进行下载。

单击下面的NBIA Data Retriever,在新页面中选择 Downloading the NBIA Data Retriever,如果你是Windows系统,点击 Windows即可下载安装文件。

下载后打开安装文件完成安装。
安装完后直接打开软件会提示需要tcia文件。

我们把前面下载的 Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia 文件直接和 NBIA Data Retriever 的快捷方式放在一起。

然后打开 tcia文件 即可,单击Agree,即可看到下载页面了。
单击 Start,开始下载数据集(准备好半天的时间下载)。

下载数据集的一部分

如果觉得数据集太大了,我只想要其中的一小部分该怎么做呢?
我们回到数据集页面,在刚才的 Images 处单击 Search 按钮。

我们可以在这里逐条浏览数据集中的各条数据,甚至可以浏览每一张的CT图片。
对于我们想要的条目,可以单击购物车 Cart 按钮。

挑完后,单击Cart进入购物车页面,单击Download即可下载对应的 tcia文件。
我们把这个文件和 NBIA Data Retriever 的快捷方式放在一起,即可打开下载我们想要的数据了。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年6月26日
下一篇 2023年6月26日

相关推荐