PyTorch中的数据集Torchvision和Torchtext-6ren

PyTorch中的数据集Torchvision和Torchtext

In lại Tác giả: qq735679552 Thời gian cập nhật: 29-09-2022 22:32:09

CFSDN nhấn mạnh vào giá trị tạo ra nguồn mở và chúng tôi cam kết xây dựng nền tảng chia sẻ tài nguyên để mọi nhân viên CNTT có thể tìm thấy thế giới tuyệt vời của bạn tại đây.

这篇CFSDN的博客文章PyTorch中的数据集Torchvision和Torchtext由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

PyTorch中的数据集Torchvision和Torchtext

对于PyTorch加载和处理不同类型数据，官方提供了torchvision和torchtext.

之前使用 torchDataLoader类直接加载图像并将其转换为张量。现在结合torchvision和torchtext介绍torch中的内置数据集。

Torchvision 中的数据集

MNIST

MNIST是一个由标准化和中心裁剪的手写图像组成的数据集。它有超过 60,000 张训练图像和 10,000 张测试图像。这是用于学习和实验目的最常用的数据集之一。要加载和使用数据集，使用以下语法导入：torchvision.datasets.MNIST().

Fashion MNIST

Fashion MNIST数据集类似于MNIST，但该数据集包含T恤、裤子、包包等服装项目，而不是手写数字，训练和测试样本数分别为60,000和10,000。要加载和使用数据集，使用以下语法导入：torchvision.datasets.FashionMNIST() 。

CIFAR

CIFAR数据集有两个版本，CIFAR10和CIFAR100。CIFAR10 由 10 个不同标签的图像组成，而 CIFAR100 有 100 个不同的类。这些包括常见的图像，如卡车、青蛙、船、汽车、鹿等.

torchvision.datasets.CIFAR10()
torchvision.datasets.CIFAR100()

COCO

COCO数据集包含超过 100,000 个日常对象，如人、瓶子、文具、书籍等。这个图像数据集广泛用于对象检测和图像字幕应用。下面是可以加载 COCO 的位置：torchvision.datasets.CocoCaptions() 。

EMNIST

EMNIST数据集是 MNIST 数据集的高级版本。它由包括数字和字母的图像组成。如果您正在处理基于从图像中识别文本的问题，EMNIST是一个不错的选择。下面是可以加载 EMNIST的位置：：torchvision.datasets.EMNIST() 。

IMAGE-NET

ImageNet 是用于训练高端神经网络的旗舰数据集之一。它由分布在 10,000 个类别中的超过 120 万张图像组成。通常，这个数据集加载在高端硬件系统上，因为单独的 CPU 无法处理这么大的数据集。下面是加载 ImageNet 数据集的类：torchvision.datasets.ImageNet() 。

Torchtext 中的数据集

IMDB

IMDB是一个用于情感分类的数据集，其中包含一组 25,000 条高度极端的电影评论用于训练，另外 25,000 条用于测试。使用以下类加载这些数据torchtext：torchtext.datasets.IMDB() 。

WikiText2

WikiText2语言建模数据集是一个超过 1 亿个标记的集合。它是从维基百科中提取的，并保留了标点符号和实际的字母大小写。它广泛用于涉及长期依赖的应用程序。可以从torchtext以下位置加载此数据：torchtext.datasets.WikiText2() 。

除了上述两个流行的数据集，torchtext库中还有更多可用的数据集，例如 SST、TREC、SNLI、MultiNLI、WikiText-2、WikiText103、PennTreebank、Multi30k 等.

深入查看 MNIST 数据集

MNIST 是最受欢迎的数据集之一。现在我们将看到 PyTorch 如何从 pytorch/vision 存储库加载 MNIST 数据集。让我们首先下载数据集并将其加载到名为的变量中data_train 。

từ torchvision.datasets import MNIST
# Download MNIST
data_train = MNIST('~/mnist_data', train=ĐÚNG VẬY, download=ĐÚNG VẬY)
import matplotlib.pyplot BẰNG plt
random_image = data_train[0][0]
random_image_label = data_train[0][1]
# In hình ảnh bằng Matplotlib
plt.imshow(hình ảnh ngẫu nhiên)
in("Nhãn của hình ảnh là:", nhãn_hình_ảnh_ngẫu_nhiên)

DataLoader tải MNIST

Tiếp theo, chúng ta sử dụng lớp DataLoader để tải tập dữ liệu, như hiển thị bên dưới.

nhập khẩu ngọn đuốc
từ torchvision nhập khẩu chuyển đổi
data_train = torch.utils.data.DataLoader(
MNIST(
'~/mnist_data', train=ĐÚNG VẬY, download=ĐÚNG VẬY,
biến đổi = biến đổi.Compose([
biến đổi.ToTensor()
])),
kích thước lô = 64,
xáo trộn=ĐÚNG VẬY
)
vì batch_idx, mẫu TRONG liệt kê(dữ liệu_huyền:
in(batch_idx, mẫu)

Đang tải CUDA

Chúng tôi có thể kích hoạt GPU để đào tạo mô hình của mình nhanh hơn. Bây giờ hãy sử dụng cấu hình có thể sử dụng khi tải dữ liệu bằng CUDA (GPU hỗ trợ PyTorch).

thiết bị = "cuda" nếu torch.cuda.is_available() khác "bộ xử lý"
kwargs = {'số_công_nhân': 1, 'pin_memory': ĐÚNG VẬY} nếu thiết bị =='khác biệt' khác {}
train_loader = torch.utils.data.DataLoader(
torchvision.datasets.MNIST('/tập tin/', train=ĐÚNG VẬY, download=ĐÚNG VẬY),
batch_size=batch_size_train, **kwargs)
test_loader = torch.utils.data.DataLoader(
torchvision.datasets.MNIST('tập tin/', train=SAI, download=ĐÚNG VẬY),
batch_size=kích thước_batch, **kwargs)

Thư mục hình ảnh

ImageFolder là một torchvision lớp trình tải dữ liệu chung giúp tải tập dữ liệu hình ảnh của riêng bạn. Giải quyết vấn đề phân loại và xây dựng mạng lưới thần kinh để xác định xem hình ảnh nhất định là quả táo hay quả cam. Để thực hiện việc này trong PyTorch, bước đầu tiên là sắp xếp các hình ảnh theo cấu trúc thư mục mặc định như sau:

gốc rễ
├── màu cam
│ ├── cam_image1.png
│ └── cam_image1.png
├── quả táo
│ └── apple_image1.png
│ └── apple_image2.png
│ └── apple_image3.png

Tất cả những hình ảnh này có thể được tải bằng lớp ImageLoader.

torchvision.datasets.ImageFolder(gốc, biến đổi)

biến đổi

Các phép biến đổi PyTorch xác định các kỹ thuật chuyển đổi hình ảnh đơn giản giúp chuyển đổi toàn bộ tập dữ liệu thành các định dạng duy nhất.

Nếu đó là tập dữ liệu chứa các hình ảnh ô tô khác nhau ở các độ phân giải khác nhau thì trong quá trình đào tạo, tất cả các hình ảnh trong tập dữ liệu huấn luyện của chúng tôi phải có cùng kích thước độ phân giải. Nếu chúng ta chuyển đổi thủ công tất cả hình ảnh sang kích thước đầu vào được yêu cầu thì sẽ tốn thời gian, vì vậy chúng ta có thể sử dụng các phép biến đổi với một vài dòng mã PyTorch, tất cả hình ảnh trong tập dữ liệu của chúng ta có thể được chuyển đổi sang kích thước và độ phân giải đầu vào được yêu cầu.

Bây giờ hãy tải CIFAR10torchvision.datasets và áp dụng các phép biến đổi sau:

Thay đổi kích thước tất cả hình ảnh thành 32 × 32
Áp dụng chuyển đổi cắt trung tâm cho hình ảnh
Chuyển đổi hình ảnh đã cắt thành tensor
hình ảnh chuẩn hóa

nhập khẩu ngọn đuốc
nhập khẩu torchvision
nhập torchvision.transforms BẰNG biến đổi
import matplotlib.pyplot BẰNG plt
nhập numpy BẰNG ví dụ.
biến đổi = biến đổi.Compose([
# thay đổi kích thước 32×32
biến đổi.Thay đổi kích thước(32),
# chuyển đổi cây trồng trung tâm
biến đổi.CenterCrop(32),
# ĐẾN-tenxơ
biến đổi.ToTensor(),
# bình thường hóa bình thường hóa
biến đổi.Chuẩn hóa([0,5, 0,5, 0,5], [0,5, 0,5, 0,5])
])
trainset = torchvision.datasets.CIFAR10(root='./dữ liệu', train=ĐÚNG VẬY,
tải về=ĐÚNG VẬY, biến đổi=biến đổi)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
xáo trộn=SAI)

Tạo bộ dữ liệu tùy chỉnh trong PyTorch

Dưới đây bạn sẽ tạo một tập dữ liệu tùy chỉnh đơn giản bao gồm số và văn bản. Các phương thức __getitem__() và __len__() trong lớp Dataset cần được đóng gói.

Phương thức __getitem__() trả về mẫu đã chọn trong tập dữ liệu theo chỉ mục.
Phương thức __len__() trả về tổng kích thước của tập dữ liệu.

Sau đây là mã đã đóng gói tập dữ liệu FruitImagesDataset. Về cơ bản, đây là một mẫu tốt hơn để tạo các tập dữ liệu tùy chỉnh trong PyTorch.

nhập khẩu chúng
nhập numpy BẰNG ví dụ.
nhập cv2
nhập khẩu ngọn đuốc
nhập matplotlib.patches BẰNG các bản vá
nhập khẩu albumentations BẰNG MỘT
từ albumentations.pytorch.transforms nhập ToTensorV2
từ matplotlib nhập pyplot BẰNG plt
từ torch.utils.data nhập Bộ dữ liệu
từ xml.etree nhập ElementTree BẰNG Và
từ torchvision nhập khẩu chuyển đổi BẰNG ngọn đuốc
lớp FruitImagesDataset(torch.utils.data.Dataset):
def __init__(self, files_dir, width, height, transforms=None):
self.transforms = biến đổi
self.files_dir = thư mục_tệp
self.height = chiều cao
self.width = chiều rộng
self.imgs = [hình ảnh vì hình ảnh TRONG đã sắp xếp(os.listdir(files_dir))
nếu hình ảnh[-4:] == '.jpg']
tự.lớp = ['_','quả táo', 'chuối', 'quả cam']
def __getitem__(self, idx):
img_name = self.imgs[idx]
image_path = os.path.tham gia(self.files_dir, tên_hình_ảnh)
# đọc hình ảnh Và chuyển đổi chúng ĐẾN Chính xác kích cỡ Và màu sắc
img = cv2.imread(đường dẫn hình ảnh)
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB).astype(np.float32)
img_res = cv2.resize(img_rgb, (self.width, self.height), cv2.INTER_AREA)
# lặn qua 255
img_res /= 255.0
# tập tin chú thích
chú thích_tên_tệp = img_name[:-4] + '.xml'
annot_file_path = os.path.tham gia(self.files_dir, chú thích_tên_tệp)
hộp = []
nhãn = []
cây = et.parse(annot_file_path)
root = cây.getroot()
# hình ảnh cv2 cung cấp kích cỡ BẰNG chiều cao x chiều rộng
wt = img.hình dạng[1]
ht = img.hình dạng[0]
# tọa độ hộp vì các tập tin xml được trích xuất Và đã sửa vì hình ảnh kích cỡ được cho
vì thành viên TRONG root.findall('sự vật'):
nhãn.append(self.classes.chỉ số(thành viên.tìm('tên').chữ))
# hộp giới hạn
xmin = số nguyên(thành viên.tìm('bndbox').tìm thấy('xmin').chữ)
xmax = số nguyên(thành viên.tìm('bndbox').tìm thấy('xmax').chữ)
ymin = số nguyên(thành viên.tìm('bndbox').tìm thấy('ymin').chữ)
ymax = số nguyên(thành viên.tìm('bndbox').tìm thấy('ymax').chữ)
xmin_corr = (xmin / wt) * chiều rộng bản thân
xmax_corr = (xmax / wt) * chiều rộng bản thân
ymin_corr = (ymin / ht) * chiều cao của bản thân
ymax_corr = (ymax / ht) * chiều cao của bản thân
hộp.append([xmin_corr, ymin_corr, xmax_corr, ymax_corr])
# chuyển thành hộp vào trong ngọn đuốc.Tensor
hộp = torch.as_tensor(hộp, kiểu dữ liệu = torch.float32)
# lấy các khu vực của các hộp
diện tích = (hộp[:, 3] - hộp[:, 1]) * (hộp[:, 2] - hộp[:, 0])
# giả định tất cả các trường hợp là không đám đông
iscrowd = torch.zeros((boxes.shape[0],), dtype=torch.int64)
nhãn = torch.as_tensor(nhãn, kiểu dữ liệu = torch.int64)
mục tiêu = {}
mục tiêu["hộp"] = hộp
mục tiêu["nhãn"] = nhãn
mục tiêu["khu vực"] = diện tích
mục tiêu["là đám đông"] = là đám đông
# id_hình_ảnh
image_id = torch.tensor([idx])
mục tiêu["id_hình_ảnh"] = id_hình_ảnh
nếu self.transforms:
mẫu = self.transforms(image=img_res,
bboxes=mục tiêu['hộp'],
nhãn=nhãn)
img_res = mẫu['hình ảnh']
mục tiêu['hộp'] = torch.Tensor(mẫu['hộp thư'])
trở lại img_res, mục tiêu
định nghĩa __len__(bản thân):
trở lại len(self.imgs)
def get_transform(tàu hỏa):
nếu tàu hỏa:
trở lại A. Soạn([
A.Lật ngang(0,5),
ToTensorV2(p=1.0)
], bbox_params={'định dạng': 'pascal_voc', 'nhãn_trường': ['nhãn']})
khác:
trở lại A. Soạn([
ToTensorV2(p=1.0)
], bbox_params={'định dạng': 'pascal_voc', 'nhãn_trường': ['nhãn']})
thư mục tập tin = '../input/fruit-images-for-object-detection/train_zip/train'
test_dir = '../input/fruit-images-for-object-detection/test_zip/test'
tập dữ liệu = FruitImagesDataset(train_dir, 480, 480)

Liên kết gốc: https://mp.weixin.qq.com/s/vOO7ZXtfoX11PXfwTSjEdw.

Cuối cùng, bài viết này về bộ dữ liệu Torchvision và Torchtext trong PyTorch kết thúc tại đây. Nếu bạn muốn biết thêm về bộ dữ liệu Torchvision và Torchtext trong PyTorch, vui lòng tìm kiếm bài viết CFSDN hoặc tiếp tục duyệt qua các bài viết liên quan. blog trong tương lai! .

Đề xuất bài viết: Dựa trên thông số kỹ thuật lập trình PHP (giải thích chi tiết)

Đề xuất bài viết: Thực hiện trích xuất và lưu hàng loạt thông tin hình ảnh bằng python

Đề xuất bài viết: Hiểu biết sâu sắc về vòng đời vue

Đề xuất bài viết: Hoạt động cơ sở dữ liệu PHP bốn: phân tích sử dụng mongodb

android - /data/data/ ở đâu?
Câu hỏi dành cho người mới bắt đầu về Android. OK, tôi đã ghi thành công vào tập tin. Ví dụ. //Lấy tên file String filename = getResources().getString(R.string.filename
android/dữ liệu/dữ liệu/mypackage/img
Tôi đã lưu cùng một hình ảnh vào /data/data/mypackage/img/ và bây giờ tôi muốn hiển thị toàn màn hình này, tôi đã thử sử dụng ACTION_VIEW để hiển thị chương trình tiêu chuẩn Android nhưng nó không đến từ /data/dat
Swift 4: Không thể chuyển đổi giá trị của loại 'dữ liệu' thành loại đối số dự kiến 'dữ liệu'
Tôi đang sử dụng Xcode 9, Swift 4. Tôi đang cố gắng hiển thị hình ảnh trong ImageView từ một URL bằng mã sau: func getImageFromUrl(sourceUrl: String) -> UII
android - phong trào gen. Cách trích xuất cơ sở dữ liệu từ thiết bị. Thư mục /data/data/ của tôi dường như trống
Tôi gặp sự cố khi cài đặt genymotion trên Ubuntu của mình. Chủ yếu là tôi không thể gỡ lỗi cơ sở dữ liệu của mình vì tôi không thể xem nội dung của thư mục /data/ thông qua DBMS trong Eclipse và adb trong shell. Không hiển thị
php - Dữ liệu JSON ajax không chính xác Dữ liệu POST
Tôi đang cố gắng đăng một số dữ liệu JSON bằng PHP. Nhưng đã xảy ra sự cố. Đây là html của tôi -- {% for x in sets %}
Sự khác biệt giữa lm(data~time) và tslm(data~trend)
Tôi quan sát thấy kết quả khác nhau giữa hai phương pháp. Tại sao lại thế này? Tôi biết chuyện gì đang xảy ra trên lm nhưng không thể hiểu chuyện gì đang xảy ra trên tslm. > thư viện(dự báo) > set.seed(2) > tts lm(t
Không tìm thấy chỉ mục thuộc tính Spring Data JPA và Spring Data Elaticsearch;
Tôi không chắc tại sao điều này lại xảy ra! Tôi có một lớp được sử dụng bởi spring data elasticsearch và spring data jpa, nhưng khi tôi thử chạy ứng dụng của mình thì tôi gặp lỗi. Đã tạo lỗi
d3.js - bộ lọc dữ liệu hoạt động với dữ liệu json nhưng không hoạt động với dữ liệu csv
Trong sơ đồ thuần chay này, nếu tôi tải xuống và chuyển đổi Flare-dependency.json bằng cách sử dụng lệnh jq thành csv sau, jq -r '(map(keys) | add | Unique) as
php - Gửi dữ liệu mysql/dữ liệu mysql trong tệp .php
Tôi đang gửi một dự án trong đó tôi phải tạo cơ sở dữ liệu mysql bằng các bảng. Mọi thứ đều đang diễn ra từ phía tôi, vì vậy tôi chỉ muốn kiểm tra cách gửi tất cả các tệp zip của mình cho một người nào đó bằng một máy tính khác. Về cơ bản, làm cách nào để tạo tệp cơ sở dữ liệu của tôi cho một máy tính khác,
Cách tìm ứng dụng/dữ liệu/dữ liệu của tôi bằng File Explorer của Android Device Monitor
Tôi có một ứng dụng ghi tệp văn bản vào bộ nhớ trong. Tôi muốn nhìn kỹ hơn vào máy tính của tôi. Tôi đã chạy Toast.makeText để hiển thị đường dẫn và nó báo:/data/data/my-bundles nhưng khi tôi truy cập An của Android Studio
Làm cách nào để truy cập tệp/dữ liệu/dữ liệu từ trình giả lập Android của Genymotion?
Tôi thích tốc độ tải Android bằng trình giả lập Genymotion. Nó có tốc độ rất tốt, nhưng vẫn có một số hiệu suất yếu. Cách truy cập trình giả lập Genymotion từ File Explorer trong Eclipse
Silverlight - Cách làm mới dữ liệu bị ràng buộc nếu tôi thay đổi dữ liệu đó bằng một giá trị khác trong bộ cài đặt
Tôi cần thay đổi định dạng của hộp văn bản trong Silverlight. Dữ liệu được ràng buộc thông qua MVVM. Ví dụ: có thuộc tính int, tôi thêm 1 vào giá trị trong setter và gọi OnPropertyChanged
youtube - Truy cập dữ liệu công khai qua API dữ liệu YouTube mà không cần xác thực.
Tôi muốn gửi yêu cầu tới API dữ liệu Youtube nhưng tôi không cần truy cập bất kỳ thông tin người dùng nào. Tôi chỉ muốn duyệt các video công khai và hiển thị video dựa trên cụm từ tìm kiếm. Tôi có thể làm điều này mà không được phép không? Câu trả lời hay nhất YouTube
Không thể lấy twilio để hiển thị dữ liệu 'từ', nhưng nó hiển thị dữ liệu 'đến'
Tôi đã thiết lập ứng dụng Twilio và tôi muốn gửi thông tin cập nhật cho mọi người nhưng tôi không muốn trả lời từng tin nhắn riêng lẻ. Tôi chỉ muốn họ gọi nếu họ có câu hỏi. Tôi thấy mọi thứ đều hoạt động tốt nhưng tôi muốn hiển thị văn bản đến khi gửi để đảm bảo rằng tôi không bỏ sót bất kỳ câu hỏi nào. Tôi đang sử dụng p
javascript - Gửi dữ liệu JSON cho khách hàng? D3.js hiển thị dữ liệu JSON
Tôi có một trang web có biểu mẫu (hiện tại nó là HTML đơn giản, nhưng chúng tôi đang chuyển sang JQuery). Quá trình này như sau: chấp nhận đầu vào của người dùng --- 5 số nguyên, gọi dịch vụ mạng thông qua REST, chạy một số phép tính ở phía máy chủ... và tạo ra một
Làm cách nào để phát hiện xem tệp JavaScript chỉ chứa dữ liệu JSON hay có ý định chứa dữ liệu JSON?
Giả sử chúng ta có một tệp có tên là configure.js, khi nhìn vào bên trong chúng ta thấy: 'use strict'; var profile = { "project": "%Projec
javascript - Sử dụng dữ liệu JSON bên ngoài lệnh gọi .ajax ban đầu - Truy cập dữ liệu JSON còn lại
Phần này là phần mở rộng của Câu hỏi trước: Bây giờ tôi có thể trả về thành công dữ liệu JSON từ Bộ điều khiển CI của mình, dữ liệu này trả về: {"results":[{"id://1","Sourc
Xóa tất cả dữ liệu/tài liệu Couchbase ios (hoặc xóa tất cả dữ liệu ios?)
Có cách nào hiệu quả để xóa tất cả lưu trữ tài liệu của CBL trong ios không? Tôi có một câu hỏi về vấn đề này hoặc nếu có ai biết cách làm cho ứng dụng hoạt động giống như vừa được cài đặt thì điều đó cũng sẽ thực sự hữu ích. Chúng tôi đang nỗ lực đảm bảo rằng việc đăng xuất của chúng tôi thực sự đặt ứng dụng vào
$.post(url, function(data,status) {alert(data)}); cảnh báo () không hoạt động
Tôi có ứng dụng Rails giao tiếp với các ứng dụng Rails khác để chèn dữ liệu. Tôi đang sử dụng phương thức jQuery $.post để chèn dữ liệu. Để chèn, các ứng dụng Rails khác của tôi hiển thị 200 OK. Nhưng trong
javascript - Lỗi xác nhận: dự kiến { trạng thái: 'THÀNH CÔNG', dữ liệu: [] } bằng { Đối tượng (trạng thái, dữ liệu)}
Tôi đang chạy thử nghiệm đơn vị cho lệnh gọi API phục vụ yêu cầu đăng bài. Tôi đang chuyển nội dung yêu cầu và phải trả lại phản hồi dưới dạng dữ liệu tài khoản. Nhưng tôi chỉ nhận được lỗi xác nhận Lưu ý: Dữ liệu được tìm nạp từ Azure spec.js const accou

qq735679552

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm