Pandas Reindex

Pandas Reindex



'I 'pandaer' kan vi lagre mye informasjon i tabellform, som også er kjent som DataFrame. 'Pandaene' letter oss med 'DataFrame()'-metoden for å konstruere DataFrame. DataFrame inneholder indekser, og vi kan også endre indeksene til DataFrame ved å bruke 'pandas'-funksjonene. Metoden vi bruker for å reindeksere DataFrame er 'reindex()'-metoden. Denne metoden hjelper til med å endre radens indeksverdier så vel som indeksverdiene til kolonnene. Ved å bruke denne metoden kan vi endre standardindeksen til DataFrame, og vi kan også endre indeksen som vi satte mens vi opprettet DataFrame. Vi vil bruke 'reindex()'-metoden i våre 'pandaer'-eksempler i denne opplæringen og vil forklare dette konseptet i dybden her.'

Eksempel # 01

«Spyder»-verktøyet hjelper oss med å utvikle «pandas»-koden her i denne opplæringen, og vi starter koden vår med nøkkelordet «import», som vil hjelpe oss med å importere «pandas»-funksjonen. Vi plasserer 'pandaer som pd' etter å ha skrevet inn 'import'. Etter dette lager vi DataFrame ved å skrive 'pd.DataFrame()'. Vi skriver denne 'pd' her fordi 'DataFrame()' er metoden til 'pandaer'. 'value_df' er navnet på variabelen som DataFrame er lagret i. Vi legger til 'RandomName', som er kolonnenavnet, og 'RandomName' inneholder 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander og Samuel'.







Deretter har vi 'Value_1', der vi har satt inn '16, 29, 24, 35, 44, 50, 69, 74 og 88'. Deretter kommer 'Value_2', og vi har lagt til '25, 38, 42, 56, 54, 65, 78, 89 og 99'. Nå kommer 'Value_3' neste, og vi plasserer '36, 48, 52, 69, 74, 75, 87, 91 og 69' i den. 'Value_4'-kolonnen er tilstede etter dette, hvor vi har satt inn '52, 64, 72, 88, 82, 95, 97, 21 og 39'. Den siste kolonnen er «Value_5»-kolonnen her, og i denne kolonnen er verdiene vi har lagt til «66, 78, 82, 99, 34, 45, 57, 61 og 89». Etter dette bruker vi 'print()'-funksjonen der 'Values_df' er lagt til. Den skrives ut på terminalen.




Etter å ha trykket «Shift+Enter» kan vi enkelt få resultatet av kodene våre i «Spyder»-appen. Her returnerer denne koden DataFrame med standardindeksen. Nå vil vi bruke 'reindex()'-metoden for å reindeksere denne DataFrame i 'pandas'.




Funksjonen 'reindex()' brukes her for å reindeksere radens indeksverdi. I DataFrame ovenfor kan du se at standardindeksverdiene for raden vises, og nå bruker vi 'reindex()'-metoden for å reindeksere disse radindeksene. Vi plasserer DataFrames navn og deretter 'reindex()'-metoden der vi plasserer de indeksverdiene som vi ønsker å legge til DataFrame ovenfor. Vi legger 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H og ind_I' i 'reindex()'-funksjonen. Så disse radenes indekser vil bli oppdatert på DataFrame når vi kjører denne koden.






Verdiene til radens indeks vises i dette resultatet, og du kan merke deg at DataFrame-verdiene ikke vises her, og 'NaN'-verdiene har dukket opp. Dette er fordi de nye indeksverdiene ikke samsvarer med de tidligere indeksverdiene til DataFrame. Når den nye indeksen og den gamle indeksen ikke samsvarer, viser den 'Nan' der. Disse 'NaN'-verdiene vises som standard når vi endrer indeksen, og den samsvarer ikke med forrige indeks.



Eksempel # 02

Vi endrer nå kolonneindeksverdiene til 'Value_df', som vi tidligere har opprettet i eksempel 1. Etter å ha skrevet ut 'Value_df', legger vi 'column'-variabelen og la til noen verdier til den. Vi legger til 'a_1, b_1, c_1, d_1 og e_1'. Nå ønsker vi å justere disse verdiene som indeksen til kolonnene, så for dette bruker vi 'reindex()'-metoden og plasserer navnet på variabelen 'column' der de nye kolonneindeksverdiene er lagret og sett også 'aksen' til 'kolonner', så den vil oppdatere kolonneakseindeksen. Vi legger 'reindex()'-metoden i 'print()', så den vil også gjengi på terminalen.


Ettersom vi har brukt 'reindex()'-metoden, oppdateres kolonneindeksverdiene som er tilstede i den første DataFrame, og nye verdier legges til i den oppdaterte DataFrame. Du kan også merke deg at alle verdiene til DataFrame konverteres til 'NaN' fordi begge indeksverdiene til kolonnene er forskjellige.

Eksempel # 03

'Programmering_data' i denne koden inneholder 'P_Languages', der vi har lagt til 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java og JavaScript'. Deretter har vi 'Hours' der vi plasserer '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs og 6_hrs'. Etter dette legges 'P_Code' inn, og vi setter inn '11523, 12423, 12321, 11456, 11454, 12267, 13106 og 14123'. Vi legger til «p_index»-variabelen og setter «Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G og Pro_H».

Disse verdiene vil bli brukt som indeksverdier for radene. Vi endrer 'Programming_data' i 'Programming_df' DataFrame. Vi legger også til 'p_index' til denne DataFrame ved å bruke 'indeks'-metoden. Vi setter 'Programming_df' og deretter 'indeks'-metoden og tilordner 'p_index' til dette. Nå legges indeksverdiene ovenfor til som radindeksverdier til DataFrame. Vi skriver ut 'Programming_df' også.

Etter dette legger vi til noen nye indeksverdier i «new_index»-variabelen, og disse er «P_1, P_2, P_3, P_4, P_5, P_6, P_7 og P_8». Ettersom vi ønsker å oppdatere indeksverdiene til rader, bruker vi 'reindex()'-metoden og setter 'new_index' som parameter for denne funksjonen og lagrer også den oppdaterte DataFrame i 'newProgramming_df' og plasserer 'newProgramming_df' i ' print()' for visning.


Indeksverdiene er oppdatert, og vi kan også si at vi har reindeksert DataFrame som vi har laget. Alle verdiene til DataFrame konverteres også til 'NaN' fordi begge indeksverdiene er forskjellige.

Eksempel # 04

Vi endrer for tiden 'Programming_df's'-indeksverdiene for kolonner, som vi tidligere utviklet i eksempel 3. Vi plasserer 'column'-variabelen og setter inn nye verdier i den. 'P_Code, P_Languages, Hours, and New' legges til i 'column'-variabelen. Deretter bruker vi igjen 'reindex()'-metoden der vi setter 'column'-variabelen, som vil oppdatere de forrige kolonneindeksverdiene og legge til disse nye kolonneindeksverdiene til DataFrame.

Her kan du merke deg at de nye verdiene som vi har lagt til i 'kolonne' er de samme som vi har lagt til i DataFrame ovenfor, men sekvensen er annerledes, så den vil endre rekkefølgen til kolonnene og justere alle kolonnene etter hvert som vi nevnt i 'kolonne'-variabelen. Vi legger også til en indeksverdi til som ikke er til stede i DataFrame ovenfor, som er 'Ny' her, så 'NaN'-verdiene vises i denne kolonnen.


Rekkefølgen til kolonnene endres her, og alle verdier vises slik de er tilstede i den originale DataFrame-kolonnene og 'Ny'-kolonnen i den oppdaterte DataFrame inneholder alle 'NaN'-verdier fordi denne kolonnen ikke er til stede i den originale DataFrame.

Konklusjon

Vi har presentert denne opplæringen som hjelper oss med å forstå begrepet 'pandas reindex' i detalj. Vi har diskutert hvordan vi kan reindeksere en DataFrames kolonne så vel som radens indeksverdier. Vi har forklart at 'reindex()'-funksjonen til 'pandas' brukes for å gjøre dette. Vi har gjort forskjellige eksempler der vi har endret indeksverdiene til radene i DataFrame og også indeksverdiene til kolonneindeksen til DataFrame. Vi har gjengitt resultatene av alle kodene som vi har gjort her i denne opplæringen og også forklart dem i dybden.