Pandaer Qcut

Pandaer Qcut



'Python' inneholder mange biblioteker, og når vi ønsker å analysere eller manipulere data, bruker vi disse 'Pythons' bibliotekene, og 'pandaene' er også biblioteket til det. 'Pandas'-biblioteket brukes innen datavitenskap, og det brukes også i maskinlæringsaktiviteter. 'Pandas' DataFrame hjelper oss med å lagre dataene. I 'pandaer', når vi vil ha databinning, bruker vi 'qcut()'-metoden. 'qcut()'-metoden brukes for å konvertere kontinuerlige funksjoner til kategoriske. Vi kan legge til forskjellige typer parametere i denne 'qcut()'-metoden for å få forskjellige typer resultater. Denne opplæringen handler om 'qcut()'-metoden, og vi vil forklare i full detalj 'qcut()'-metoden her. Vi vil forklare deg hvordan vi gjør datainnsamlingen ved hjelp av 'qcut()'-funksjonen i 'pandas' i denne opplæringen.'

Eksempel # 01

Vi vil bruke 'qcut()'-metoden i disse kodene, og vi vil gjøre disse kodene i 'Spyder'-appen. Når vi må jobbe med 'pandaene', kan vi bare få tilgang til funksjonene når vi importerer 'pandaene'-biblioteket til kodene våre. Først legger vi 'import', og deretter skriver vi 'pandaer som pd'. Nå må vi bruke 'qcut()'-metoden, så for dette lager vi DataFrame her. Vi konstruerer «Random_df» som inneholder «R_ID, R_name og R_age» som kolonnene, og også i «R_ID» plasserer vi «R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55 R_61, R_73 og R_81'. Deretter legger vi til «Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob og Harper» i «R_name»-kolonnen. Etter dette setter vi inn '21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 og 40' i kolonnen 'R_age'. Nå bruker vi 'print()', som inneholder 'Random_df', og det vil hjelpe med å gjengi 'Random_df' DataFrame. Vi har nettopp opprettet DataFrame og bruker ikke 'qcut()'-metoden ennå.








'Kjør'-ikonet hjelper oss med å utføre kodene. Når vi trykker på dette 'kjør'-ikonet, vises resultatet av denne koden på terminalen til 'Spyder'-appen. 'Random_df' DataFarme vises som resultatet av koden som vi har skrevet i dette eksemplet. Nå vil vi bruke 'qcut()'-metoden og vil også vise resultatet.




Vi samler dataene her. Vi samler «R_age»-kolonnen og plasserer «pd.qcut()»-metoden, som er metoden for «pandaer» som hjelper til med datainnsamling. I denne metoden setter vi inn navnet på DataFrame og også kolonnenavnet som vi vil bruke denne 'qcut()'-metoden på. Vi setter også verdien av 'q' til '5', og den brukes til å kutte dataene i 'R_age'-kolonnen i fem like kvantiler. Vi legger til 'qcut()'-metoden i 'print()', slik at den også viser binning-dataene på terminalen.




Her vises dataene etter binning, og den kutter 'R_age' i fem kvantiler. Den viser også kategoriene der 'R_age'-kolonnedataene er lagret. Den kategoriske serien representerer 'R_age'-kassene.






Vi kan også justere etiketten for disse beholderne. Vi legger til disse søppeletikettene for å gjøre dem enkle å tolke. Vi legger til en 'R_age_qcut'-kolonne til 'Random_df' der vi legger til etikettene til disse skuffene. Vi bruker igjen metoden 'pd.qcut()' for å merke dem. Vi legger til etikettene som er 'små, ikke så små, middelmådige, høye og høyeste' i den. Så legger vi igjen 'Random_df' i 'print()'.


Alle søppelkasser er merket og presentert i dette resultatet. Kolonnen 'R_age_qcut' vises i denne DataFrame der merkede kasser vises.



Eksempel # 02

For å lage DataFrame legger vi først til 'karakterer', som er '3, 6, 8, 7, 2, 5, 1, 9, 4, 7 og 8'. Deretter legger vi til navn på elever i 'studenter', som er 'Peter, Bromley, James, David, Allierte, John, James, Samuel, William, Howard og Alexander'. Deretter genererer vi «Grades_df» der vi har lagt til «pd.DataFrame()»-metoden, og i denne metoden legger vi «Std_name», som vil vises som kolonnenavnet, og tilordner verdier til «studenter» til denne. Deretter setter vi 'Students_grades' som kolonnenavnet til DataFrame og tildeler også 'karakterer' her, som vi har laget ovenfor. Etter dette har vi 'print()' der vi legger til 'Grades_df' for utskrift.


DataFrame som inneholder to kolonner vises i resultatet av denne koden. Nå vil vi bruke 'qcut()'-metoden på 'Students_grades'-kolonnen for å samle dataene til denne kolonnens verdier.


Vi legger til en ny kolonne 'karakter' her der vi har brukt 'pd.qcut()' til kolonnen 'Students_grades', og vi har også brukt '4' for verdien av 'q', så den vil kuttes dataene i fire like kvantiler. Etter dette spesifiserer vi disse kvantilene her ved å plassere verdier i 'q', som er '0, .4, .8 og 1'. Da viser vi også dette. Nå merker vi disse innlagte dataene, og etikettene vi legger til her er 'D, C, A og B' og er også lagret i 'karakter'-kolonnen.


Her vises dataene etter binning her i «karakter»-kolonnen, og den kutter «Students_grades»-kolonnens data i fire like kvantiler.


DataFrame som vi får etter å ha brukt 'qcut()'-metoden og spesifisert kvantilene vises i dette resultatet.


Nå, etter å ha lagt til etikettene til disse hyllene blir også gjengitt i dette utfallet i 'karakter'-kolonnen, og du kan se at den tildeler etikettene i henhold til bin-verdiene.

Eksempel # 03

Vi kan også bruke 'qcut()'-metoden på dataene til CSV-filen. For dette leser vi først CSV-filens data ved hjelp av 'read_csv()'-metoden. Vi leser dataene til 'office2.csv'-filen, og deretter blir dataene til denne filen plassert i 'Office_df'. Denne metoden vil konvertere 'office2'-filens data til DataFrame og lagre dem i 'Office_df'. Deretter viser vi også disse dataene ved å sette 'Office_df' i 'print()'. Etter dette legger vi til en ny kolonne kalt 'Units_qcut', som vi bruker funksjonen 'pd.qcut()' på 'Units'-kolonnen.

I tillegg setter vi verdien av 'q'-variabelen til '5', som vil dele dataene i fem like kvantiler. Dataene, etter kutting i 5 like kvantiler, lagres i kolonnen 'Units_qcut', og denne kolonnen legges også til 'Office_df', og 'Office_df' gjengitt her igjen ved å bruke 'print()'. Vi merker nå disse innlagte dataene, legger til etikettene i «qcut()»-metoden, som er «Enhet 1, Enhet 2, Enhet 3, Enhet 4 og Enhet 5» og lagrer dem også i «Etiketter»-kolonnen . Vi gjengir også denne DataFrame der kolonnen 'Etiketter' er lagt til.


Dataene som vi får etter å ha lest 'office2.csv'-filen gjengis her i form av DataFrame. Deretter legges «Units_qcut»-kolonnen til, der de innlagte verdiene til «Units»-kolonnen vises. Etter dette legges også 'Etiketter'-kolonnen til, som tilordner etikettene til disse lagrede verdiene. Alt dette gjøres ved å bruke 'qcut()'-metoden i 'pandas'.

Konklusjon

Vi har forklart 'qcut()'-metoden i detalj i denne opplæringen som hjelper til med å samle dataene i 'pandaer'. Vi har diskutert at dataene lagres i henhold til kvantilen 'q'-verdien som vi har lagt til i 'qcut()'-metoden, og vi har også justert etikettene til disse innlagte dataene. Vi har utforsket 'qcut()'-metoden og har brukt denne metoden på kolonnene i DataFrame, og vi har også brukt denne 'qcut()'-metoden på dataene til CSV-filen etter å ha lest CSV-filene. Vi har presentert resultatet av alle kodene i denne opplæringen for å tydelig forklare og vise resultatet av 'qcut()'-metoden.