1. 信息 TransUnet

1.1. 时间 open time

2021

https://github.com/Beckschen/TransUNet

本是应用于医疗影像

使用的若是PNG多波段图像，可以按照以下链接进行修改：TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割

以下内容是我自己在修改过程中做的笔记。

因我前期自己调整好了代码，只参考了上述链接的dataset.py文件中的内容，使代码可以应用于3通道彩色影像。但目录的安排与其不同（我是严格按照github上的官方代码设置目录），但也正常运行了起来，故而也做记录。

我认为复现代码最重要的是能少修改就要少修改。

一些说明：

“···”之后跟着的，是文件夹中储存的文件的示例。

data->Synapse下的train和test_vol_h5文件夹中存放的数据类型，都会被更改为存放.npz，参考1.3.部分中csdn代码，其对数据读取的方式做了调整。

model中存放的是下载下来的预训练权重。

predictions中的内容是测试模型时使用的，训练过程不涉及这个文件夹。

参考1.3.中的修改即可TransUnet官方代码训练自己数据集-彩色RGB3通道图像的分割。

但对于如何预处理数据，我认为还是没有说的特别清楚。主要是因为以下方面：

一些公开的数据集，其内的图像数据的尺寸并不是规整的512 × 512，有时会是1500 × 1500， 10000 × 10000等。如何对它们进行裁剪没有说明。
有些label是3波段的，如何转换成1个波段的label，没有说明（包括将0和255的值转换成0和1的）。
我自己遇到的一些问题，也会详细说明。