Pandas Series til CSV

Pandas Series Til Csv



'Series.to_csv()'-metoden i Pandas gir ut det spesifiserte serieobjektet i en kommadelt verdi (csv)-notasjon. Denne funksjonen tar ganske enkelt verdiene fra en serie og endrer formatet ved å legge til kommaer for separasjon av indeks- og kolonneverdier.

For å bruke denne funksjonen, må vi bruke følgende syntaks:









Denne artikkelen vil gi deg to forskjellige teknikker for å lære hvordan du kan bruke denne metoden i et python-program.



Eksempel # 1: Bruk av Series.to_csv()-metoden for å konvertere en serie med DatetimeIndex til kommadelte verdier

For å endre en serie til et CSV-format, bruker vi funksjonen 'Series.to_csv()'. Denne illustrasjonen vil generere en serie med en DatetimeIndex og deretter konvertere den til et kommadelt verdiformat.





For å sette denne metoden i drift, må vi ha verktøy som støtter python-programmering. 'Spyder'-verktøyet er valgt for å kompilere kodene. For å skrive skriptet på det, lanserte vi først det installerte verktøyet i systemet vårt. Python-programmet trenger et bibliotek for å bruke metodene for å oppnå det nødvendige resultatet. Biblioteket vi har lastet inn her er 'Pandaene'. I samme kodelinje er dette bibliotekets alias identifisert som 'pd'. Så, uansett hvor i programmet, må vi skrive 'pandaer' for å få tilgang til en funksjon. Vi ville i stedet skrevet 'pd'.

Det første trinnet for å starte med koden er å generere en Pandas-serie. Vi må skrive 'pd' for å bruke serieopprettingsmetoden fra pandaer. Funksjonen 'pd.Series()' kalles for å konstruere en serie med de spesifiserte verdiene. Verdiene vi har gitt for serien er 'Istanbul', 'Izmir', 'Ankara', 'Ankara', 'Antalya', 'Konya' og 'Bursa'. Hvis du vil gi et navn til denne matrisen med verdier, kan du gjøre det ved å bruke 'navn'-parameteren. Her har vi kalt denne samlingen av verdier 'Byer' ettersom den har navnene på 6 byer. For å lagre denne serien er det laget et serieobjekt 'Tyrkia'.



For å lage en DatetimeIndex har vi påkalt «pd.date_range()»-metoden. Mellom parentesene til denne funksjonen har vi sendt 4 argumenter som er: 'start', 'freq', 'perioder' og 'tz'.

'Start'-argumentet bruker en dato og et klokkeslett for å begynne å generere et datoområde fra det. Her har vi spesifisert startdato og klokkeslett som '2022-03-02 02:30'. 'freq'-parameteren klassifiserer frekvensen for datointervallet. Så vi ga den verdien 'D'. Nå vil den opprette en datoperiode på daglig frekvens. 'Periode'-argumentet er satt til '6', som betyr at det vil generere en datoperiode for 6 dager. Den siste parameteren er 'tz' som spesifiserer tidssonen for det angitte området. Vi har spesifisert tidssonen for 'Asia/Istanbul'.

For å lagre denne datoperioden har vi laget en variabel 'Datetime'. For å angi DatetimeIndex har vi brukt egenskapen 'Series.index'. Navnet på serien 'Turkey' er levert med '.index'-egenskapen og tilordnet den dato- og tidsintervallet som er lagret i 'Datetime'-variabelen. Dermed vil 'indeks'-egenskapen ta verdiene fra 'Datetime'-variabelen og gjøre dem til indekslisten for 'Turkey'-serien. Til slutt, for å se utdataserien, har vi brukt 'print()'-metoden og sendt 'Tyrkia'-serien som input til den for å vise innholdet.

Vi trykket bare på 'Kjør fil' for å kjøre skriptet. Følgelig kan vi se en serie med DatetimeIndex som starter fra «2022-03-02 02:30:00+03:00» og slutter på «2022-03-07 02:30:00+03:00″ og oppretter en periode på 6 dager. Under serien er 'Freq :D', navnet på arraylisten 'Cities' og dtype 'objekt' også nevnt.

Nå skal vi lære å konvertere denne serien som vi nettopp har sett i øyeblikksbildet ovenfor til et CSV-format. For å endre serien til kommaseparerte verdier, har vi en metode levert av pandas-modulen som er 'Series.to_csv()'. Denne metoden tar verdiene til den angitte serien og legger til kommaer mellom kolonnens verdier.

Funksjonen 'Series.to_csv()' kalles. Navnet på serien som vi ønsker å konvertere er nevnt med metoden som 'Turkey.to_csv()'. For å bevare de kommaseparerte verdiene har vi laget en variabel 'Comma_Separated' og deretter satt innholdet i utdatavinduet ved å påkalle 'print()'-funksjonen.

Her er serien vår i csv-format. Vi kan se i øyeblikksbildet at indeks- og serieverdiene er skilt ved hjelp av kommaene i dem.

Eksempel #2: Bruk av Series.to_csv()-metoden for å konvertere en serie med NaN-verdier til kommaseparerte verdier

Den andre teknikken for å utøve 'Series.to_csv()'-metoden er å bruke denne metoden for å konvertere en serie som inneholder noen null-oppføringer til et CSV-format.

Vi har i første omgang importert de nødvendige pakkene. 'pd' er laget til et alias for pandaer og 'np' som et alias for numpy. Numpy-verktøysettet er lastet inn her fordi vi vil gjøre noen null-oppføringer i serien vår ved å bruke 'np.NaN' mens vi lager den ved å bruke pandas 'pd.Series()'-metoden.

'pd.Series()'-funksjonen påkalles for å bygge en pandaserie med disse verdiene: 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', «Donau», «Mekong», «np.NaN» og «Volga». Det er totalt 21 verdier definert for serien, hvorav 3 oppføringer inneholder 'np.NaN'-verdier som betyr at 3 verdier mangler i serien. Egenskapen 'navn' spesifiserer navnet på denne matrisen med verdier som vi ga 'Titler'. 'Indeks'-egenskapen brukes til å sette den brukerdefinerte indekslisten i stedet for å gå med standardlisten.

Her vil vi ha indekslisten med verdiene '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', og 21'. Nå vil serien vår ha indekslisten som starter fra '10' i stedet for '0'. Lagre nå denne serien slik at vi kan bruke den senere i programmet. Vi har initialisert et serieobjekt 'Rivers' og tildeler det utgangsserien generert fra å kalle 'pd.Series()'-metoden. Serien kan sees ved å vise den ved å bruke 'print()'-funksjonen med python.

Den gjengitte utgangen på terminalen skrev ut en serie hvis indeksliste starter fra 10 og slutter på 21, noe som betyr at serien har 21 verdier.

Serien vil bli transformert til et CSV-format med 'Series.to_csv()'-metoden.

Vi har påkalt «Series.to_csv()»-metoden med vår serie «Turkey». Derfor vil denne metoden ta verdiene fra 'Tyrkia'-serien og konvertere dem til et kommadelt verdiformat. Resultatet lagres i 'Converted_csv'-variabelen. Og til slutt blir den konverterte serien skrevet ut ved hjelp av 'print()'-funksjonen.

I øyeblikksbildet av utfallet nedenfor kan du se at verdiene til serien nå er endret på en måte der et komma brukes for å skille dem fra indekslisten. Dessuten, der verdiene mangler, er kun indeksnummeret skrevet ut med komma.

Konklusjon

Modifiseringen av en panda-serie til et CSV-format er en praktisk tilnærming. Dette kan oppnås ved å bruke pandas 'Series.to_csv()'-funksjonen. Denne veiledningen praktiserte to teknikker for å bruke denne metoden. I den første illustrasjonen har vi brukt denne metoden for å konvertere en serie med en DatetimeIndex til et kommadelt verdiformat. Den andre forekomsten brukte «Series.to_csv()»-funksjonen for å endre en serie med noen manglende oppføringer til et CSV-format. Begge teknikkene er praktisk talt implementert ved å bruke 'Spyder'-verktøyet på Windows-operativsystemet.