Få et antall kolonner i R DataFrame

Fa Et Antall Kolonner I R Dataframe



I R er det å få antall kolonner en grunnleggende operasjon som kreves i mange situasjoner når du arbeider med DataFrames. Når du underdefinerer, analyserer, manipulerer, publiserer og visualiserer dataene, er antallet kolonner en viktig informasjon å vite. Derfor gir R forskjellige tilnærminger for å få summen av kolonnene i den angitte DataFrame. I denne artikkelen vil vi diskutere noen av tilnærmingene som hjelper oss å få tellingen av kolonnene i DataFrame.

Eksempel 1: Bruk av Ncol()-funksjonen

ncol() er den hyppigste funksjonen for å få summen av kolonnene i DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Antall kolonner i Data Frame :', n)

I dette eksemplet lager vi først en 'df' DataFrame med tre kolonner som er merket som 'y1', 'y2' og 'y3' ved å bruke data.frame()-funksjonen i R. Elementene i hver kolonne er spesifisert ved å bruke c()-funksjonen som lager en vektor av elementer. Deretter, ved å bruke 'n'-variabelen, brukes ncol()-funksjonen til å bestemme summen av kolonner i 'df' DataFrame. Til slutt, med den beskrivende meldingen og 'n'-variabelen, skriver den medfølgende cat()-funksjonen ut resultatene på konsollen.



Som forventet indikerer den hentede utgangen at den spesifiserte DataFrame har tre kolonner:







Eksempel 2: Tell totalt antall kolonner for den tomme datarammen

Deretter bruker vi ncol()-funksjonen på den tomme DataFrame som også får verdiene til de totale kolonnene, men den verdien er null.

tomme_df <- data.frame()

n <- ncol(empty_df)

cat('---Kolonner i dataramme :', n)

I dette eksemplet genererer vi den tomme DataFrame, 'empty_df', ved å kalle data.frame() uten å spesifisere noen kolonner eller rader. Deretter bruker vi funksjonen ncol() som brukes til å finne antall kolonner i DataFrame. Funksjonen ncol() er satt med 'empty_df' DataFrame her for å få de totale kolonnene. Siden 'empty_df' DataFrame er tom, har den ingen kolonner. Så utdata fra ncol(empty_df) er 0. Resultatene vises av cat()-funksjonen som er distribuert her.



Utdataene viser verdien '0' som forventet fordi DataFrame er tom.

Eksempel 3: Bruk av Select_If()-funksjonen med Length()-funksjonen

Hvis vi ønsker å hente antall kolonner av en bestemt type, bør vi bruke funksjonen select_if() sammen med funksjonen lengde() til R. Disse funksjonene brukes som kombineres for å få summen av kolonnene av hver type . Koden for å bruke disse funksjonene er implementert i følgende:

bibliotek (dplyr)

x1<-BOKSTAVER[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Summer','Vinter'),10,erstatt=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

lengde(velg_hvis(df1,er.numerisk))

I dette eksemplet laster vi først dplyr-pakken slik at vi får tilgang til funksjonen select_if() og lengde()-funksjonen. Deretter lager vi de fire variablene - henholdsvis 'x1', 'x2', 'x3' og 'x4'. Her inneholder 'x1' de første 10 store bokstavene i det engelske alfabetet. Variablene 'x2' og 'x3' genereres ved hjelp av funksjonen rpois() for å lage to separate vektorer med 10 tilfeldige tall med henholdsvis parametere 2 og 5. 'x4'-variabelen er en faktorvektor med 10 elementer som er tilfeldig samplet fra vektor c ('Sommer', 'Vinter').

Deretter prøver vi å lage 'df1' DataFrame der alle variablene sendes i data.frame()-funksjonen. Til slutt påkaller vi funksjonen length() for å bestemme lengden på 'df1' DataFrame som er opprettet ved hjelp av select_if()-funksjonen fra dplyr-pakken. Select_if()-funksjonen velger kolonnene fra en 'df1' DataFrame som et argument, og is.numeric()-funksjonen velger bare kolonnene som inneholder numeriske verdier. Deretter får lengde()-funksjonen summen av kolonner som er valgt av select_if() som er utdata fra hele koden.

Lengden på kolonnen vises i følgende utdata som angir det totale antallet kolonner i DataFrame:

Eksempel 4: Bruke Sapply()-funksjonen

Omvendt, hvis vi bare ønsker å telle de manglende verdiene til kolonnene, har vi sapply()-funksjonen. Funksjonen sapply() itererer over hver kolonne i DataFrame for å fungere spesifikt. Funksjonen sapply() sendes først med DataFrame som argument. Deretter tar det operasjonen som skal utføres på den DataFrame. Implementeringen av sapply()-funksjonen for å få tellingen av NA-verdier i DataFrame-kolonnene er gitt som følger:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

I dette eksemplet genererer vi 'new_df' DataFrame med tre kolonner - 'c1', 'c2' og 'c3'. De første kolonnene, 'c1' og 'c3', inneholder de numeriske verdiene inkludert noen manglende verdier som er representert av NA. Den andre kolonnen, 'c2', inneholder tegnene inkludert noen manglende verdier som også er representert av NA. Deretter bruker vi sapply()-funksjonen på 'new_df' DataFrame og beregner antall manglende verdier i hver kolonne ved å bruke sum()-uttrykket inne i sapply()-funksjonen.

Funksjonen is.na() er det uttrykket som er spesifisert til sum()-funksjonen som returnerer en logisk vektor som indikerer om hvert element i kolonnen mangler eller ikke. Sum()-funksjonen legger sammen TRUE-verdiene for å telle antall manglende verdier i hver kolonne.

Derfor viser utgangen de totale NA-verdiene i hver av kolonnene:

Eksempel 5: Bruke Dim()-funksjonen

I tillegg ønsker vi å få de totale kolonnene sammen med radene i DataFrame. Deretter gir dim()-funksjonen DataFrames dimensjoner. Funksjonen dim() tar objektet som et argument hvis dimensjoner vi ønsker å hente. Her er koden for å bruke dim()-funksjonen:

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

points=c(8, 10, 7, 4))

dimme (d1)

I dette eksemplet definerer vi først 'd1' DataFrame som genereres ved hjelp av data.frame()-funksjonen der to kolonner er satt til 'team' og 'poeng'. Etter det påkaller vi dim()-funksjonen over 'd1' DataFrame. Dim()-funksjonen returnerer DataFrames antall rader og kolonner. Derfor, når vi kjører dim(d1), returnerer den en vektor med to elementer – den første reflekterer antall rader i 'd1' DataFrame og den andre representerer antall kolonner.

Utdataene representerer dimensjonene til DataFrame der verdien '4' indikerer det totale antallet kolonner og verdien '2' representerer radene:

Konklusjon

Vi har nå lært at å telle antall kolonner i R er en enkel og viktig operasjon som kan utføres på DataFrame. Blant alle funksjonene er ncol()-funksjonen den mest praktiske måten. Nå er vi kjent med de forskjellige måtene å få antall kolonner fra den gitte DataFrame.