Unik Pandas dataramme

Unik Pandas Dataramme



Det mest populære Python-biblioteket som brukes i datavitenskap kalles Pandas. Det tilbyr Python-programmerere høyytelses, brukervennlige og dataanalyseverktøy. Når du forstår de grunnleggende funksjonene og hvordan du bruker dem, er Pandas et potent verktøy for å endre data. I 'pandaer' er standardmetodene for lagring av data i tabellform DataFrames. Vi kan bruke noen 'pandas'-metoder for å få de unike verdiene i 'pandas' DataFrames kolonne. Når vi trenger å få unike verdier i DataFrames kolonner og ikke ønsker duplisering av verdier i 'pandas' DataFrames kolonne, kan vi bruke metodene som 'pandas' gir for å gjøre dette. La oss se på slike metoder i denne veiledningen, sammen med noen eksempler og utdata for å få unike verdier i DataFrames kolonne med 'pandaer'.

Metoder for å få unike verdier i 'pandas' DataFrames kolonner

Vi kan bruke to metoder for å få de unike verdiene i 'pandaene' DataFrames kolonner. Vi dropper dupliserte verdier og får bare de unike verdiene i kolonnene til DataFrames. Metodene som 'pandaer' gir for å utføre denne oppgaven er:







  • Ved å bruke den unike() metoden.
  • Ved å bruke drop_dupliactes()-metoden.

Nå vil vi bruke begge metodene i 'pandas'-kodene for å få de unike verdiene i 'pandas' DataFrames kolonner.



Eksempel # 01

'Spyder'-appen brukes her for å generere disse 'pandas'-kodene for å bruke de metodene som hjelper oss med å få de unike verdiene i 'pandas' DataFrames kolonner. Vi må importere 'pandas'-modulene, som er nødvendige for 'pandas'-koden, før vi oppretter DataFrame. Ved å bruke begrepet «import» og plassere «pandaer som pd», importerer vi disse modulene.



Nå, ved hjelp av 'pd', kan vi raskt få 'pandas'-funksjonene eller -metodene. Vi legger deretter 'Subject_data' der vi legger til 'Name' og i 'Name', legger vi til navnets data som er 'Roman, William, Peter, Smith, John, Milli, Thomas og James'. Deretter legger vi til emnedataene i 'Emnet' som er 'Matte, økonomi, naturfag, matematikk, statistikk, statistikk, statistikk og datamaskin'. Deretter konverterer vi denne 'Subject_data' til 'Subject_df' DataFrame ved å bruke 'pd.DataFrame()'-metoden. Vi plasserer 'Subject_df' i 'print()'-metoden slik at den vises på terminalen.





Nå ønsker vi å få de unike verdiene i 'pandas' DataFrames kolonne 'Subj'. For dette formålet bruker vi 'unique()'-metoden her, og vi legger til navnet på kolonnen og også navnet på DataFrame som vist nedenfor. Vi legger til denne metoden i 'print()' slik at resultatet også vises på terminalen.



Nå trykker vi på 'Shift+Enter' for å få resultatet av denne koden, og den gjengis på terminalen og vises også her, som inneholder DataFrame med alle verdier. Dette er den originale DataFrame som vi har lagt til i koden, og under den viser den de unike verdiene til 'Subj'-kolonnen. Den sletter de dupliserte verdiene og viser de unike verdiene til 'Subj'-kolonnen i DataFrame.

Eksempel # 02

Vi lager 'Sample_list' som inneholder litt informasjon. Vi setter inn 'Layla, 21, 28, 31, 14 og 39' som vil vises som den første kolonnen når vi konverterer denne listen til DataFrame. Deretter legger vi til 'Lusy, 31, 25, 34, 26 og 21' som den andre raden i DataFrame. Etter dette har vi 'Peter, 38, 20, 20, 35 og 24' og 'Layla 38, 23, 39 24, 23' som vil være den tredje og fjerde raden i DataFrame. Vi legger også inn tre data til som er 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' og også 'Peter, 21, 21, 31, 21, 29' .

Nå konverterer vi 'Sample_list' til 'DF_Sample' som er navnet på DataFrame her ved å sette 'pd.DataFrame()' funksjonen. Vi angir også navnet på kolonnene i denne DataFrame og disse navnene er 'Name, Ass_1, Ass_2, Ass_3, Ass_4 og Ass_5'. Deretter bruker vi 'print()' som hjelper til med å vise DataFrame 'DF_Sample'. Nå bruker vi en annen metode i dette eksemplet for å få de unike verdiene i DataFrames kolonne. Denne metoden er 'drop_duplicates()'-metoden til 'pandas'.

I 'drop_duplicates()'-metoden setter vi navnet på kolonnen der vi ønsker å få de unike verdiene i DataFrames kolonne. Vi får unike verdier for 'Navn'-kolonnen ved å slippe dupliserte verdier i denne kolonnen ved hjelp av 'drop_duplicates()'-metoden og også gjengi disse unike verdiene ved å bruke 'print()'-funksjonen her.

Navnene som er duplisert blir slettet og unike verdier gjengis etter bruk av 'drop_duplicates()'-metoden. Du kan merke deg at 'Layla'-navnet vises i tre celler i 'Navn'-kolonnen. Men når 'drop_duplicates()'-metoden brukes på denne kolonnen, slettes alle dupliserte verdier og ett 'Layla'-navn har dukket opp på skjermen. Etter å ha droppet de dupliserte verdiene, dukket den nye DataFrame opp som inneholder de unike verdiene i denne 'Navn'-kolonnen. På denne måten kan vi droppe dupliserte verdier og få den unike verdien i DataFrames kolonne ved hjelp av 'drop_duplicates()' metoden.

Eksempel # 03

Den samme DataFrame brukes igjen, og nå bruker vi 'unique()'-metoden her. Med 'unique()'-metoden plasserer vi navnet på kolonnen samt DataFrames navn som vi ønsker å bruke denne 'unique()'-metoden på for å få de unike verdiene. Dette vil bare gjengi de unike verdiene for den kolonnen og vil ikke vise disse verdiene i form av DataFrame.

Her inneholder DataFrame syv verdier i 'Name'-kolonnen, men når vi bruker 'unique()'-metoden på denne kolonnen, har bare fire verdier dukket opp, og disse er de unike verdiene til den kolonnen. Den gjengir ikke dupliserte verdier.

Eksempel # 04

DataFrame som vi lager i dette eksemplet er 'F_G_df'. Vi setter inn 'My_fruits' og 'my_Vegs' i denne DataFrame. Kolonnen 'My_fruits' inneholder 'Eple, appelsin, eple, pære, litchi, eple, eple, pære og eple'. Deretter har vi 'My_Vegs' som inneholder navnene på grønnsakene som er 'Chili, Bringle, Gulrot, Potet, Potet, Gulrot, Løk, Hvitløk og Ingefær'. Denne DataFrame inneholder kun to kolonner.

Nå får vi de unike verdiene i begge kolonnene ved hjelp av «unique()»-metoden. Vi nevner navnet på DataFrame. Deretter setter du inn kolonnenavnet for første kolonne. Etter dette bruker vi append()-metoden. I dette vedlegget plasserer vi igjen navnet på DataFrame og det andre kolonnenavnet og plasserer 'unique()'-metoden. Dette vil få de unike verdiene for begge kolonnene og deretter legge til de unike verdiene for begge kolonnene og vise dem på skjermen.

DataFrame gjengis først og inneholder alle verdier. Etter dette brukes 'unique()'-metoden og de unike verdiene for begge kolonnene gjengis nedenfor. I denne koden får vi de unike verdiene i de flere kolonnene i DataFrame ved å bruke 'unique()'-metoden.

Konklusjon

Den fullstendige forklaringen på å få de unike verdiene i DataFrames kolonne finnes i denne veiledningen. Vi har diskutert metodene 'unique()' og 'drop_duplicates()' som hjelper oss med å få de unike verdiene til DataFrames kolonne. Vi har utforsket hvordan du bruker disse metodene i 'pandas'-koden ved å bruke disse metodene her i kodene våre. Vi har illustrert forskjellige eksempler i denne veiledningen og har vist deg hvordan du får de unike verdiene til én kolonne ved å bruke 'unique()'-metoden så vel som 'drop_duplicates()'-metoden. Vi har også utforsket hvordan du får de unike verdiene i flere kolonner ved å bruke 'unique()'-metoden i denne veiledningen.