【科研01】【代码复现】TransUnet-文件目录安排

发布时间 2023-10-14 19:46:52作者: 安知燕雀?

1. 信息 TransUnet

1.1. 时间 open time

2021

https://github.com/Beckschen/TransUNet

1.3. 应用 Use

  本是应用于医疗影像

使用的若是PNG多波段图像,可以按照以下链接进行修改:TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割

  以下内容是我自己在修改过程中做的笔记。

2. 自用 TransUnet

  因我前期自己调整好了代码,只参考了上述链接的dataset.py文件中的内容,使代码可以应用于3通道彩色影像。但目录的安排与其不同(我是严格按照github上的官方代码设置目录),但也正常运行了起来,故而也做记录。

我认为复现代码最重要的是能少修改就要少修改。

2.1. 目录 Tree

—| D:\T01_transUnet
————| data
————————| Synapse
———————————————| test_vol_h5····(50_0.png.npz, 50_1.png.npz, ...)
———————————————| train_npz······(1_0.png.npz, 1_1.png.npz, ...)
————| model
————————| vit_checkpoint
———————————————| imagenet21k···(R50+ViT-B_16.npz)
————| predictions
————| TransUNet-main(该子文件夹为从github上下载下来的压缩包解压后的文件夹,里面的布局不做调整)

  一些说明:

  • “···”之后跟着的,是文件夹中储存的文件的示例。
  • data->Synapse下的train和test_vol_h5文件夹中存放的数据类型,都会被更改为存放.npz,参考1.3.部分中csdn代码,其对数据读取的方式做了调整。
  • model中存放的是下载下来的预训练权重。
  • predictions中的内容是测试模型时使用的,训练过程不涉及这个文件夹。

2.2. 修改 Change

参考1.3.中的修改即可TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割

  但对于如何预处理数据,我认为还是没有说的特别清楚。主要是因为以下方面:

  • 一些公开的数据集,其内的图像数据的尺寸并不是规整的512 × 512,有时会是1500 × 1500, 10000 × 10000等。如何对它们进行裁剪没有说明。

  • 有些label是3波段的,如何转换成1个波段的label,没有说明(包括将0和255的值转换成0和1的)。

  • 我自己遇到的一些问题,也会详细说明。