Pandaer Fyll Nan med 0

Pandaer Fyll Nan Med 0



Datavitenskap involverer vanligvis manglende data. Enten kan hele raden forkastes eller en verdi kan legges til rad-kolonne-kombinasjonen. Å droppe raden/kolonnen ville være absurd fordi det eliminerer en viss beregning for hver rad. NaN, som står for 'Not a Number', er en av de typiske måtene å vise en verdi som mangler fra et sett med data. For å få de tiltenkte resultatene er håndtering av NaN ganske viktig. Så la oss finne ut hvordan du endrer NaN-verdiene i en rad eller kolonne i en Pandas DataFrame til 0.

Pandaer fyller NaN-verdier

Hvis en kolonne i datarammen din har NaN- eller Ingen-verdier, kan du bruke 'fillna()'- eller 'replace()'-funksjonene for å fylle dem med null (0).

fylle()







NA/NaN-verdiene fylles med den angitte tilnærmingen ved å bruke 'fillna()'-funksjonen. Det kan brukes ved å vurdere følgende syntaks:



Hvis du vil fylle NaN-verdiene for en enkelt kolonne, er syntaksen som følger:




Når du må fylle ut NaN-verdiene for hele DataFrame, er syntaksen som angitt:






Erstatte()

For å erstatte en enkelt kolonne med NaN-verdier, er syntaksen som følger:




For å erstatte hele DataFrames NaN-verdier, må vi bruke følgende syntaks:


I denne teksten vil vi nå utforske og lære den praktiske implementeringen av begge disse metodene for å fylle NaN-verdiene i Pandas DataFrame.

Eksempel 1: Fyll ut NaN-verdier ved å bruke Pandas “Fillna()”-metoden

Denne illustrasjonen demonstrerer bruken av Pandas 'DataFrame.fillna()'-funksjon for å fylle NaN-verdiene i den gitte DataFrame med 0. Du kan enten fylle de manglende verdiene i en enkelt kolonne eller du kan fylle dem for hele DataFrame. Her vil vi se begge disse teknikkene.

For å sette disse strategiene i bruk, må vi få en passende plattform for gjennomføring av programmet. Så vi bestemte oss for å bruke 'Spyder'-verktøyet. Vi startet Python-koden vår ved å importere 'pandas'-verktøysettet inn i programmet fordi vi må bruke Pandas-funksjonen til å konstruere DataFrame samt fylle ut de manglende verdiene i den DataFrame. 'pd' brukes som alias for 'pandaer' gjennom hele programmet.

Nå har vi tilgang til Pandas funksjoner. Vi bruker først funksjonen 'pd.DataFrame()' for å generere vår DataFrame. Vi påkalte denne metoden og initialiserte den med tre kolonner. Titlene på disse kolonnene er 'M1', 'M2' og 'M3'. Verdiene i 'M1'-kolonnen er '1', 'Ingen', '5', '9' og '3'. Oppføringene i 'M2' er 'Ingen', '3', '8', '4' og '6'. Mens 'M3' lagrer dataene som '1', '2', '3', '5' og 'Ingen'. Vi krever et DataFrame-objekt som vi kan lagre denne DataFrame i når 'pd.DataFrame()'-metoden kalles. Vi opprettet et 'manglende' DataFrame-objekt og tilordnet det etter resultatet som vi fikk fra funksjonen 'pd.DataFrame()'. Deretter brukte vi Pythons 'print()'-metode for å vise DataFrame på Python-konsollen.


Når vi kjører denne kodebiten, kan en DataFrame med tre kolonner sees på terminalen. Her kan vi observere at alle de tre kolonnene inneholder nullverdiene i dem.


Vi opprettet en DataFrame med noen nullverdier for å bruke Pandas 'fillna()'-funksjonen for å fylle de manglende verdiene med 0. La oss lære hvordan vi kan gjøre det.

Etter å ha vist DataFrame, påkalte vi Pandas 'fillna()'-funksjonen. Her vil vi lære å fylle de manglende verdiene i en enkelt kolonne. Syntaksen for dette er allerede nevnt i starten av opplæringen. Vi ga navnet på DataFrame og spesifiserte den spesielle kolonnetittelen med '.fillna()'-funksjonen. Mellom parentesene til denne metoden ga vi verdien som vil bli satt i null-plassene. DataFrame-navnet 'mangler' og kolonnen som vi valgte her er 'M2'. Verdien oppgitt mellom klammeparentesene til 'fillna()' er '0'. Til slutt kalte vi 'print()'-funksjonen for å se den oppdaterte DataFrame.


Her kan du se at 'M2'-kolonnen i DataFrame ikke inneholder noen manglende verdier nå fordi NaN-verdien er fylt med 0.


For å fylle NaN-verdiene for en hel DataFrame med samme metode, kalte vi 'fillna()'. Dette er ganske enkelt. Vi ga DataFrame-navnet 'fillna()'-funksjonen og tildelte funksjonsverdien '0' mellom parentesene. Til slutt viste 'print()'-funksjonen oss den fylte DataFrame.


Dette gir oss en DataFrame uten NaN-verdier ettersom alle verdiene er fylt med 0 nå.

Eksempel 2: Fyll ut NaN-verdier ved å bruke Pandas “Replace()”-metoden

Denne delen av artikkelen viser en annen metode for å fylle NaN-verdiene i en DataFrame. Vi vil bruke 'erstatt()'-funksjonen til Pandas for å fylle verdiene i en enkelt kolonne og i en komplett DataFrame.

Vi begynner å skrive koden i 'Spyder'-verktøyet. Først importerte vi de nødvendige bibliotekene. Her lastet vi Pandas-biblioteket for å gjøre det mulig for Python-programmet å bruke Pandas-metodene. Det andre biblioteket vi lastet er NumPy og alias det til 'np'. NumPy håndterer de manglende dataene med 'replace()'-metoden.

Deretter genererte vi en DataFrame med tre kolonner - 'skrue', 'spiker' og 'bor'. Verdiene i hver kolonne er gitt hhv. 'Skrue'-kolonnen har '112', '234', 'Ingen' og '650' verdier. 'Spiker'-kolonnen har '123', '145', 'Ingen' og '711'. Til slutt har 'drill'-kolonnen '312', 'Ingen', '500' og 'Ingen' verdier. DataFrame lagres i 'tool' DataFrame-objektet og vises ved hjelp av 'print()'-metoden.


En DataFrame med fire NaN-verdier i posten kan sees i følgende utdatabilde:


Nå bruker vi Pandas 'replace()'-metoden for å fylle nullverdiene i en enkelt kolonne i DataFrame. For oppgaven påkalte vi funksjonen 'erstatt()'. Vi ga DataFrame-navnet 'verktøy' og kolonne 'skrue' med '.replace()'-metoden. Mellom klammeparentesene setter vi verdien '0' for 'np.nan'-oppføringene i DataFrame. 'print()'-metoden brukes for å vise utdataene.


Den resulterende DataFrame viser oss den første kolonnen med NaN-oppføringer som erstattes med 0 i 'skrue'-kolonnen.


Nå skal vi lære å fylle verdiene i hele DataFrame. Vi kalte 'replace()'-metoden med navnet på DataFrame og ga verdien som vi ønsker å erstatte med np.nan-oppføringer. Til slutt skrev vi ut den oppdaterte DataFrame med 'print()'-funksjonen.


Dette gir oss den resulterende DataFrame uten manglende poster.

Konklusjon

Håndtering av manglende oppføringer i en DataFrame er en grunnleggende og er et nødvendig krav for å redusere kompleksiteten og håndtere dataen trassig i dataanalyseprosessen. Pandas gir oss noen få alternativer for å takle dette problemet. Vi tok inn to nyttige strategier i denne veiledningen. Vi implementerer begge teknikkene ved hjelp av 'Spyder'-verktøyet for å utføre eksempelkodene for å gjøre ting litt forståelig og enklere for deg. Å få kunnskap om disse funksjonene vil skjerpe Pandas-ferdighetene dine.