H×W×C Or C×H×W
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| from PIL import Image import numpy as np from torchvision import transforms
image_path = r"path/to/image" mask_path = r"path/to/mask"
img = Image.open(image_path) mask = Image.open(mask_path)
np_img = np.array(img) np_mask = np.array(img)
ts_img = transforms.PILToTensor()(img) ts_mask = transforms.PILToTensor()(mask)
|
在打印上,[C, H, W] 的图像数据要比 [H, W, C] 的图像数据更加直观,一个矩阵表示一个 Channel,三个矩阵分别对应 RGB 三个通道的值。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| print(np_img[0:5, 0:4, :])
print(ts_img[:, 0:4, 0:5])
|