Hvordan lese excel (xlsx) -fil i python

How Read Excel File Python



De .xlsx er utvidelsen av excel -dokumentet som kan lagre en stor mengde data i tabellform, og mange typer aritmetisk og logisk beregning kan enkelt gjøres i et Excel -regneark. Noen ganger er det nødvendig å lese dataene fra excel -dokumentet ved hjelp av Python -skript for programmeringsformål. Mange moduler finnes i Python for å lese excel -dokumentet. Noen av de nyttige modulene er xlrd , openpyxl , og pandaer . Måtene du kan bruke disse modulene til å lese excel -filen i Python har blitt vist i denne opplæringen.

Forutsetning:

En dummy excel -fil med utvidelsen .xlsx vil være nødvendig for å sjekke eksemplene på denne opplæringen. Du kan bruke hvilken som helst eksisterende excel -fil eller opprette en ny. Her heter en ny excel -fil salg.xlsx filen er opprettet med følgende data. Denne filen har brukt til å lese ved å bruke forskjellige python -moduler i neste del av denne opplæringen.





salg.xlsx



Salgsdato Selger Beløp
05/12/18 Sila Ahmed 60000
12.06.19 Me Hossain 50 000
08.09.20 Sarmin Jahan 45000
04.07.21 Mahmudul Hasan 30000

Eksempel-1: Les excel-fil ved hjelp av xlrd

Xlrd -modulen er ikke installert med Python som standard. Så du må installere modulen før du bruker den. Den siste versjonen av denne modulen støtter ikke excel -filen med utvidelsen .xlsx. Så du må installere 1.2.0 -versjonen av denne modulen for å lese xlsx -filen. Kjør følgende kommando fra terminalen for å installere den nødvendige versjonen av xlrd .



$pipinstallere xlrd== 1.2.0

Etter at du har fullført installasjonsprosessen, oppretter du en python -fil med følgende skript for å lese salg.xlsx filen ved hjelp av den xlrd modul. open_workbook () funksjonen brukes i skriptet, åpne xlsx -filen for lesing. Denne excel -filen inneholder bare ett ark. Så workbook.sheet_by_index () funksjonen har blitt brukt i skriptet med argumentverdien 0. Deretter nestet 'til' loop har brukt til å lese celleverdiene i regnearket ved hjelp av rad- og kolonneverdiene. To range () -funksjoner har blitt brukt i skriptet for å definere rad- og kolonnestørrelsen basert på arkdataene. De celleverdi () funksjon har brukt til å lese den bestemte celleverdien til arket i hver iterasjon av løkken. Hvert felt i utdataene blir atskilt med ett tabulatorrom.





# Importer xlrd -modulen
importer xlrd

# Åpne arbeidsboken
arbeidsbok = xlrd.open_workbook('sales.xlsx')

# Åpne regnearket
regneark = arbeidsbok.ark_by_index(0)

# Gjenta rader og kolonner
tilJegiområde(0,5):
tiljiområde(0,3):
# Skriv ut celleverdiene med tabulatorplass
skrive ut(regneark.cell_verdi(jeg, j),slutt='t')
skrive ut('')

Produksjon:

Følgende utdata vises etter at skriptet ovenfor er utført.



Eksempel 2: Les excel-fil ved hjelp av openpyxl

De openpyxl er en annen python -modul for å lese xlsx -filen, og den er heller ikke installert med Python som standard. Kjør følgende kommando fra terminalen for å installere denne modulen før du bruker den.

$pipinstallereopenpyxl

Etter at du har fullført installasjonsprosessen, oppretter du en python -fil med følgende skript for å lese salg.xlsx fil. Som xlrd -modulen, openpyxl modulen har load_workbook () funksjon for å åpne xlsx -filen for lesing. De salg.xlsx filen brukes som argumentverdi for denne funksjonen. Hensikten med wookbook.active er blitt opprettet i manuset for å lese verdiene til max_row og maks_kolonne egenskaper. Disse egenskapene har blitt brukt i hekket for løkker for å lese innholdet i salg.xlsx fil. Range () -funksjonen har blitt brukt til å lese arkets rader, og iter_cols () -funksjonen har blitt brukt til å lese kolonnene i arket. Hvert felt i utdataene blir atskilt med to tabulatorrom.

# Importer openyxl -modul
import openpyxl

# Definer variabel for å laste inn wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Definer variabel for å lese det aktive arket:
regneark = wookbook.active

# Iterer løkken for å lese celleverdiene
tilJegiområde(0, regneark.max_row):
til med iworksheet.iter_cols(1, regneark. maks_kolonne):
skrive ut(med[Jeg].verdi,slutt=' t t')
skrive ut('')

Produksjon:

Følgende utdata vises etter at skriptet ovenfor er utført.

Eksempel-3: Les excel-fil ved hjelp av pandaer

Panda-modulen er ikke installert med python-lignende forrige modul. Så hvis du ikke har installert det før, må du installere det. Kjør følgende kommando for å installere pandaer fra terminalen.

$pipinstallerepandaer

Etter at du har fullført installasjonsprosessen, oppretter du en python -fil med følgende skript for å lese salg.xlsx fil. De read_excel () pandas funksjon brukes til å lese xlsx -filen. Denne funksjonen har brukt i skriptet for å lese salg.xlsx fil. De Dataramme() funksjonen har brukt her for å lese innholdet i xlsx -filen i datarammen og lagre verdiene i variabelen som heter data . Verdien av dataene er skrevet ut senere.

# Importer pandaer
importer pandaersompd

# Last inn xlsx -filen
excel_data = pd.read_excel('sales.xlsx')
# Les verdiene til filen i datarammen
data = pd.DataFrame(excel_data,kolonner=['Salgsdato','Selger','Beløp'])
# Skriv ut innholdet
skrive ut('Innholdet i filen er: n', data)

Produksjon:

Følgende utdata vises etter at skriptet ovenfor er utført. Utgangen av dette skriptet er forskjellig fra de to foregående eksemplene. Radnummerene skrives ut i den første kolonnen, der radverdien har talt fra 0. Datoverdiene justeres sentralt. Navnene på selgerne er justert til høyre. Beløpet er justert til venstre.

Konklusjon:

Python -brukerne må jobbe med xlsx -filer for forskjellige programmeringsformål. Tre forskjellige måter å lese xlsx -filen har blitt vist i denne opplæringen ved å bruke tre python -moduler. Hver modul har forskjellige funksjoner og egenskaper for å lese xlsx -filen. Denne opplæringen hjelper python -brukere med å lese xlsx -filen enkelt ved hjelp av python -skriptet etter å ha lest denne opplæringen.