Hvordan iterere og visualisere datasettet ved hjelp av PyTorch?

Hvordan Iterere Og Visualisere Datasettet Ved Hjelp Av Pytorch



PyTorch er et rammeverk for dyp læring som gjør det mulig for brukere å lage/bygge og trene nevrale nettverk. Et datasett er en datastruktur som inneholder et sett/samling av dataprøver og etiketter. Det gir en måte å få tilgang til dataene som helhet eller ved å bruke indekserings- og skjæringsoperasjoner. Dessuten kan et datasett også bruke transformasjoner til dataene, for eksempel beskjæring, endring av størrelse osv. Brukere kan enkelt iterere og visualisere datasettet i PyTorch.

Denne oppskriften vil illustrere metoden for å iterere og visualisere et spesifikt datasett ved hjelp av PyTorch.







Hvordan iterere og visualisere datasettet ved hjelp av PyTorch?

For å iterere og visualisere et bestemt datasett ved hjelp av PyTorch, følg trinnene som følger med:



Trinn 1: Importer nødvendig bibliotek



Først importerer du de nødvendige bibliotekene. For eksempel har vi importert følgende biblioteker:





import lommelykt
fra torch.utils.data import Datasett
fra torchvision import datasett
fra torchvision.transforms import ToTensor
importer matplotlib.pyplot som plt


Her:

    • ' import lommelykt ” importerer PyTorch-biblioteket.
    • ' fra torch.utils.data import Datasett ' importerer 'Dataset'-klassen fra PyTorchs 'torch.utils.data'-modul for å lage tilpassede datasett i PyTorch.
    • ' fra torchvision import datasett ' importerer 'datasett'-modulen fra 'torchvision'-biblioteket som gir forhåndsdefinerte datasett for datasynsoppgaver.
    • ' fra torchvision.transforms import ToTensor ' importerer 'ToTensor'-transformasjonen fra 'torchvision.transforms' for å konvertere PIL-bilder eller NumPy-matriser til PyTorch-tensorer.
    • ' importer matplotlib.pyplot som plt ' importerer matplotlib-biblioteket for datavisualisering:


Trinn 2: Last inn datasett



Nå vil vi laste FashionMNIST-datasettet fra torchvision for både trenings- og testformål med følgende parametere:

tr_data = datasett.FashionMNIST ( rot = 'data' , tog =Sant, nedlasting =Sant, forvandle =TilTensor ( )
)

ts_data = datasett.FashionMNIST ( rot = 'data' , tog = Usann, nedlasting =Sant, forvandle =TilTensor ( )
)


Her:

    • ' FashionMNIST ” laster FashionMNIST-datasettet fra torchvision-biblioteket.
    • ' root='data' ” spesifiserer katalogen der datasettet skal lagres eller lastes inn hvis det allerede eksisterer. I vårt tilfelle er det 'data'-katalogen.
    • ' tog ” indikerer trening eller testdatasett.
    • ' nedlasting=Sant ” laster ned datasettet hvis det ikke allerede finnes.
    • ' transform=ToTensor() ” bruker ToTensor-transformasjonen for å konvertere bildene i datasettet til PyTorch-tensorer:


Trinn 3: Merk klasser i datasett

Deretter oppretter du en ordbok som kartlegger klasseindekser til deres tilsvarende klasseetiketter i FashionMNIST-datasettet. Den gir menneskelesbare etiketter for hver klasse. Her har vi laget ' kartlagt_etikett ' ordbok, og vi vil bruke denne til å konvertere klasseindekser til deres tilsvarende klasseetiketter:

mapd_label = {
0 : 'T skjorte' ,
1 : 'Bukse' ,
2 : 'genser' ,
3 : 'Kjole' ,
4 : 'Frakk' ,
5 : 'Sandal' ,
6 : 'Skjorte' ,
7 : 'Joggesko' ,
8 : 'Bag' ,
9 : 'Ankelstøvel' ,
}



Trinn 4: Visualiser datasett

Visualiser til slutt prøvene i treningsdataene ved å bruke 'matplotlib'-biblioteket:

fig = plt.figur ( fikenstørrelse = ( 8 , 8 ) )
kol , rad = 3 , 3
til Jeg i område ( 1 , kol * rad + 1 ) :
sample_index = fakkel.randint ( bare ( tr_dato ) , størrelse = ( 1 , ) ) .punkt ( )
img, label = tr_data [ sample_index ]
fig.add_subplot ( rad, kol , Jeg )
plt.tittel ( kartlagt_etikett [ merkelapp ] )
plt.akse ( 'av' )
plt.imshow ( img.klem ( ) , cmap = 'grå' )
plt.vis ( )





Merk : Du kan få tilgang til Google Colab Notebook på denne link .

Det handlet om å iterere og visualisere ønsket datasett ved hjelp av PyTorch.

Konklusjon

For å iterere og visualisere et bestemt datasett ved hjelp av PyTorch, importer først de nødvendige bibliotekene. Deretter laster du inn ønsket datasett for trening og testing med de nødvendige parameterne. Deretter merker du klasser i datasettet og visualiserer prøver i treningsdataene ved å bruke 'matplotlib'-biblioteket. Denne oppskriften har illustrert metoden for å iterere og visualisere et spesifikt datasett ved hjelp av PyTorch.