Hva er Amazon EMR?
Brukeren kan legge alle dataene inn i et datavarehus for å behandle dem med sitt valg av distribuerte prosesseringsrammer som Hadoop, Hive osv. Amazon S3 er den desidert beste datalagringen, men organisasjonene har funnet Spark og Hadoop vanskelige og dyre å sette opp. Amazon EMR kan brukes til å lage klynger ved å bruke applikasjoner som Spark eller Hadoop og analysere store data på skyen:
Egenskaper
Noen av hovedtrekkene til EMR er nevnt nedenfor:
Elastisk : Brukeren kan opprette flere klynger på EMR, og tjenesten tillater også å endre størrelsen på disse klyngene, slik at elastisiteten er dens viktige funksjon:
Fleksible datalagre : Amazon EMR-klynge er veldig fleksibel når det gjelder datalagringsfasiliteter, og den integreres godt med andre AWS-tjenester:
Verktøy : EMR tilbyr flere verktøy for brukerne å opprette og bruke klynger på skyen:
Hvordan bruke EMR?
For å bruke EMR-tjenesten til AWS, gå ganske enkelt inn i EMR-dashbordet og velg ' Klynger ' fra venstre panel og klikk på ' Opprett klynge ”-knapp:
Skriv inn navnet på klyngen og velg ' applikasjoner ' for klyngen:
Rull nedover siden og velg forekomsttype og nøkkelparfil for å konfigurere maskinvare- og sikkerhetsinnstillinger. Se gjennom konfigurasjonene og klikk på ' Opprett klynge '-knappen for å fullføre prosessen:
EMR-klyngen vil bli vist på siden:
Du har opprettet en EMR-klynge på AWS.
Konklusjon
Amazon EMR brukes til å lage klynger ved å bruke applikasjoner som Hadoop, Spark, etc., og lage EC2-forekomster gjennom den. EMR har funksjonene Elastisitet og fleksibilitet av klyngeskalerbarhet med sikker lagring av data på skyen. Brukeren kan opprette en EMR-klynge fra AWS-plattformen og koble til den ved hjelp av PuTTY-applikasjonen.