Pytorch入门

约 1065 字大约 4 分钟

2025-03-14

🌟Anaconda

Create start menu shortcuts (supported packages only).
Add Anaconda3 to my PATH environment variable (自动添加环境变量)
Register Anaconda3 as my default Python 3.12 Recommended, Allows other programs, such as VSCode, PyCharm, etc. to automatically detect Anaconda3 as the primary Python 3.12 on the system.

Conda Command

命令的意义	命令
创建新环境	`conda create -n env_name python=3.x`
激活环境	`conda activate env_name`
显示所有环境信息	`conda info -e`
删除环境	`conda env remove --name env_name`

🌟NVIDIA

🌟Pytorch

Pytorch

根据自己的笔记本型号下载并安装pytorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

如下图所示，出现 True，即安装成功

(pytorch-3.12) C:\Users\USER>python
Python 3.12.9 | packaged by conda-forge | (main, Mar  4 2025, 22:37:18) [MSC v.1943 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True

🌟Jupyter

Jupyter

jupyter notebook

PyTorch 加载数据初认识

load_datas.py

import os
from torch.utils.data import Dataset

class MyDataset(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        # 图片所属文件夹路径
        self.path = os.path.join(root_dir, label_dir)
        # 图片所属文件夹路径的图片名列表枚举
        self.img_path = os.listdir(self.path)
    def __getitem__(self, idx):
        img_name= self.img_path[idx]
        img_item_path = os.path.join(self.path, img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label

    def __len__(self):
        return len(self.img_path)

# 数据集所在根目录
root_dir = '../datasets/hymenoptera_data/train'

ants_label_dir = 'ants'
bees_label_dir = 'bees'
ants_dataset = MyDataset(root_dir, ants_label_dir)
bees_dataset = MyDataset(root_dir, bees_label_dir)

img_ant, label_ant = ants_dataset[1]
img_bee, label_bee = bees_dataset[1]

img_ant.show()
img_bee.show()

# 总数据集
train_set = ants_dataset + bees_dataset
len(train_set)

TensorBoard

[!important] > TensorBoard 是 TensorFlow 提供的可视化工具，主要用于深度学习模型的训练过程和结果分析

TensorBoard.py

from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter('logs')

for i in range(100):
    writer.add_scalar('y=2x', 2*i, i)

writer.close()

Transforms

[!important] > Transforms 通常指的是数据变换，在深度学习和数据处理领域，它主要用于对数据进行预处理，以提高模型的训练效果和泛化能力。 torchvision.transforms 是 PyTorch 提供的数据增强和预处理工具，主要用于图像数据处理。
useful_transforms.py

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

img = Image.open('./images/blog.jpg').convert('RGB')
print(img)

writer = SummaryWriter('logs')

# ToSensor
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image('ToSensor', img_tensor)

# Normalize
# output[channel] = (input[channel] - mean[channel]) / std[channel]
print(img_tensor[0][0][0])
trans_normalize = transforms.Normalize(mean=[0.1, 0.1, 0.2], std=[0.1, 0.1, 0.1])
img_normalize = trans_normalize(img_tensor)
print(img_normalize[0][0][0])
writer.add_image('Normalize', img_normalize)

# Resize
print(img.size)
trans_resize = transforms.Resize((512, 512))
img_resize = trans_resize(img)
print(img_resize)

img_resize = trans_totensor(img_resize)
writer.add_image('Resize', img_resize)

# Compose 用于将多个变换操作组合在一起
transform_compose = transforms.Compose([
    transforms.Resize((512, 512)),  # 调整尺寸
    transforms.ToTensor(),  # 转换为张量
    transforms.Normalize(mean=[0.15, 0.1, 0], std=[0.01, 0.01, 0.01])  # 正则化
])
img_compose = transform_compose(img)
writer.add_image('Compose', img_compose)

# RandomCrop 随即裁剪
transform_rand = transforms.RandomCrop(size=(314, 314))
img_rand = transform_rand(img)
img_rand = trans_totensor(img_rand)
writer.add_image('RandomCrop', img_rand, 10)

writer.close()

:::

torchvision 中的数据集的使用

torchvision.py

import torchvision
from torch.utils.tensorboard import SummaryWriter

# train_set = torchvision.datasets.CIFAR10(root='./dataset', train=True, download=True)
# test_set = torchvision.datasets.CIFAR10(root='./dataset', train=False, download=True)
#
# print(test_set[0])
# # 打印类别数
# print(test_set.classes)
#
# img, target = test_set[0]
# print(test_set.classes[target])
# img.show()


dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

train_set = torchvision.datasets.CIFAR10(root='./dataset', train=True, transform=dataset_transform, download=True)
test_set = torchvision.datasets.CIFAR10(root='./dataset', train=False, transform=dataset_transform, download=True)

print(test_set[0])

writer = SummaryWriter('logs')
for i in range(10):
    img, target = test_set[i]
    writer.add_image('test_set', img, i)

writer.close()