Liste over 10 beste datavitenskapelige bøker og beskrivelser for generalisten

Liste Over 10 Beste Datavitenskapelige Boker Og Beskrivelser For Generalisten



Data Science er studieretningen som håndterer enorme mengder data ved hjelp av vitenskapelige metoder, prosesser, algoritmer og systemer for å finne de usynlige mønstrene, utlede meningsfull informasjon, ta forretningsbeslutninger i selskaper og også bruke i ikke-forretningsinstitusjoner. De ikke-forretningsinstitusjonene inkluderer bransjer for helsetjenester, spill, bildegjenkjenning, anbefalingssystemer, logistikk, svindeldeteksjon (bank- og finansinstitusjoner), Internettsøk, talegjenkjenning, målrettet annonsering, flyruteplanlegging og utvidet virkelighet. Data Science er et undersett av kunstig intelligens. Dataene som brukes til analyse kan komme fra mange forskjellige kilder og presenteres i ulike formater. Noen av kildedataene kan være standardiserte; andre er kanskje ikke standardiserte.

For å si det på en annen måte, brukes forskjellige metoder for å samle dataene (flertall av datum). Deretter trekkes kunnskap (verdifulle konklusjoner) ut fra de samlede dataene. I prosessen, etter at dataene er samlet, gjøres forskningen på dem (data) for å få nye data (resultater) som problemene løses fra.







Datavitenskap som (hoved)disiplin eksisterer på bachelor- og mastergradsnivå ved universitetet. Imidlertid tilbyr bare få universiteter i verden datavitenskap ved bachelor- eller mastergraden. På bachelorgradsnivå uteksamineres studenten med en grad i datavitenskap. Dette er som en generell grad. På mastergradsnivå forlater studenten med en postgraduate-grad i datavitenskap, med spesialisering i dataanalyse, datateknikk eller som dataforsker.



Det kan overraske leseren og muligens dessverre at maskinlæring, modellering, statistikk, programmering og databaser er en forutsetning for å kunne studere datavitenskap på bachelornivå til tross for at de er respekterte universitetskurs i seg selv, studert i andre disipliner på bachelor- eller masternivå. Uansett, når en student går til et universitet for å studere datavitenskap på gradsnivå, vil alle disse kursene fortsatt bli studert, ved siden av eller før de riktige kursene, for datavitenskap.



Datavitenskap for bachelorgrad eller spesialiseringer som Data Analytics, Data Engineering eller som Data Scientist er fortsatt under utvikling; selv om de nådde et stadium at de brukes i industrien etter å ha blitt studert (på universitetet). Datavitenskap er en relativt ny disiplin, totalt sett.





Husk at du først bør være generalist før du blir spesialist. Skillene mellom spesialistprogrammer er ennå ikke klare. Skillene mellom generalist- og spesialistprogrammene er ikke klare ennå.

Siden Data Science er en relativt ny disiplin, er bøkene som er foreskrevet i dette dokumentet basert på innholdsdekning og ikke pedagogikk (hvor godt boken underviser). Og de er for Bachelor's Degree (generalist)-programmet. Det finnes ulike generalistkurs.



Listen

For flere detaljer og mulig kjøp med kredittkort er det gitt en hyperlenke for hver av bøkene. Ikke én av bøkene dekker alle generalistkursene.

Essensiell matematikk for datavitenskap: kalkulus, statistikk, sannsynlighetsteori og lineær algebra

Skrevet av: Hadrien Jean

  • Utgiver: Hadrien Jean
  • Publiseringsdato: Etter 30. september 2020
  • Språk: Engelsk
  • Antall sider: ‎mer enn 400

Innholdet i denne boken kan sees på som matematikkkurset for datavitenskap. Selv om det ikke anbefales å lære datavitenskap alene, bør en nyutdannet videregående skole som ønsker å lære datavitenskap på egen hånd begynne med denne boken.

Innhold: Kalkulus; Statistikk og sannsynlighet; Lineær algebra; Skalarer og vektorer; matriser og tensorer; Spenn, lineær avhengighet og romtransformasjon; Systemer av lineære ligninger; Egenvektorer og egenverdier; Enkeltverdidekomponering.

https://www.essentialmathfordatascience.com/

En sunn fornuftsguide til datastrukturer og algoritmer: Oppgrader dine kjerneprogrammeringsferdigheter / 2. utgave

Skrevet av: Jay Wengrow

  • Utgiver: Pragmatic Bookshelf
  • Publiseringsdato: 15. september 2020
  • Språk: Engelsk
  • Dimensjoner: 7,5 x 1,25 x 9,25 tommer
  • Antall sider: ‎508

Denne boken tar for seg algoritmer og datastrukturer som brukes i Data Science. Forutsatt at noen lærer datavitenskap alene etter endt utdanning fra videregående, så er dette den neste boken å lese etter å ha lest den forrige matteboken. Eksempelprogrammene er gitt i JavaScript, Python og Ruby.

Innhold: Hvorfor datastrukturer betyr noe; Hvorfor algoritmer betyr noe; Å ja! Big O-notasjon; Få fart på koden din med Big O; Optimaliseringskode med og uten Big O; Optimalisering for optimistiske scenarier; Big O i hverdagskode; Lynrask oppslag med hasjtabeller; Lage elegant kode med stabler og køer; Rekursivt rekurs med rekursjon; Lære å skrive rekursivt; Dynamisk programmering; Rekursive algoritmer for hastighet; Node-baserte datastrukturer; Få fart på alle tingene med binære søketrær; Hold prioriteringene dine rett med hauger; Det gjør ikke vondt å prøve; Koble alt med grafer; Håndtere plassbegrensninger; Teknikker for kodeoptimalisering

Smarter Data Science: Å lykkes med Enterprise-Grade Data og AI-prosjekter / 1 st Redigering

Skrevet av: Neal Fishman, Cole Stryker og Grady Booch

  • Utgiver: Wiley
  • Publiseringsdato: 14. april 2020
  • Språk: Engelsk
  • Antall sider: ‎286

Innhold: Klatring på AI-stigen; Innramming Del I: Betraktninger for organisasjoner som bruker AI; Innramming Del II: Betraktninger for arbeid med data og AI; Et tilbakeblikk på Analytics: Mer enn én hammer; Et blikk fremover på Analytics: Ikke alt kan være en spiker; Adressering av operasjonelle disipliner på AI-stigen; Maksimere bruken av dataene dine: Være verdidrevet; Verdsetter data med statistisk analyse og muliggjør meningsfull tilgang; Bygge på lang sikt; A Journey's End: En IA for AI.

Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning-serien) Illustrert utgave

Skrevet av: Kevin P. Murphy

  • Utgiver: The MIT Press
  • Publisert dato: 24. august 2012
  • Språk: Engelsk
  • Dimensjoner: 8,25 x 1,79 x 9,27 tommer
  • Antall sider: ‎1104

Denne boken er bra for nybegynnere. Igjen, som alle de andre bøkene som er foreskrevet i dette dokumentet, dekker ikke denne boken alt som er nødvendig for generalistprogrammet, som dessverre fortsatt ikke er ferdigstilt (spesialistprogrammene er heller ikke ferdigstilt). Den typiske nybegynneren her er en videregående utdannet med bestått i matematikk og informatikk.

Innhold: Introduksjon (Machine learning: what and why?, Unsupervised learning, Noen grunnleggende begreper innen maskinlæring); Sannsynlighet; Generative modeller for diskrete data; Gaussiske modeller; Bayesiansk statistikk; Frekvensstatistikk; Lineær regresjon; Logistisk regresjon; Generaliserte lineære modeller og eksponentiell familie; Rettede grafiske modeller (Bayes-nett); Blandingsmodeller og EM-algoritmen; Latente lineære modeller; Sparsomme lineære modeller; kjerner; Gaussiske prosesser; Adaptive basisfunksjonsmodeller; Markov og skjulte Markov-modeller; Statlige rommodeller; Ustyrte grafiske modeller (Markov tilfeldige felter); Nøyaktig slutning for grafiske modeller; Variasjonell slutning; Mer variasjonsslutning; Monte Carlo slutning; Markov-kjeden Monte Carlo (MCMC) slutning; Gruppering; Grafisk modellstrukturlæring; Latente variable modeller for diskrete data; Dyp læring.

Data Science for Business: Hva du trenger å vite om datautvinning og dataanalytisk tenkning / 1. utgave

Skrevet av: Tom Fawcett og Foster Provost

  • Utgiver: O'Reilly Media
  • Publisert dato: 17. september 2013
  • Språk: Engelsk
  • Dimensjoner: 7 x 0,9 x 9,19 tommer
  • Antall sider: ‎413

Innhold: Data-analytisk tenkning; Forretningsproblemer og datavitenskapelige løsninger; Introduksjon til prediktiv modellering: Fra korrelasjon til overvåket segmentering; Tilpasse en modell til data; Overfitting og dets unngåelse; Likhet, naboer og klynger; Beslutningsanalytisk tenkning I: Hva er en god modell?; Visualisere modellytelse; Bevis og sannsynligheter; Representere og utvinne tekst; Beslutningsanalytisk tenkning II: Mot analytisk teknikk; Andre datavitenskapelige oppgaver og teknikker; Datavitenskap og forretningsstrategi; Konklusjon.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktisk statistikk for dataforskere: 50+ essensielle konsepter ved bruk av R og Python / 2nd Edition

Skrevet av: Peter Bruce, Andrew Bruce og Peter Gedeck

  • Utgiver: O'Reilly Media
  • Publiseringsdato: 2. juni 2020
  • Språk: Engelsk
  • Dimensjoner: 7 x 0,9 x 9,1 tommer
  • Antall sider: ‎368

Innhold: Undersøkende dataanalyse, data- og samplingsfordelinger, statistiske eksperimenter og signifikanstesting, regresjon og prediksjon, klassifisering, statistisk maskinlæring, uovervåket læring.

Boken om hvorfor: Den nye vitenskapen om årsak og virkning

Skrevet av: Judea Pearl, Dana Mackenzie

  • Forlag: Grunnbok
  • Publiseringsdato: 15. mai 2018
  • Språk: Engelsk
  • Dimensjoner: 6,3 x 1,4 x 9,4 tommer
  • Antall sider: ‎432

Mens mange Data Science-bøker bruker den rene forretningsindustrien til illustrasjon, bruker denne boken medisinsk industri og andre disipliner til illustrasjon.

Innhold: Introduksjon: Mind over Data; Årsaksstigen; Fra Buccaneers til Guinea Pigs: The Genesis of Causal Inference; Fra bevis til årsaker: Pastor Bayes møter Mr. Holmes; Forvirrende og dekonfunderende: Eller, drepe den lurende variabelen; Den røykfylte debatten: Rensing av luften; Paradokser i massevis!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafakta: Gruveverdener som kunne vært; Mekling: Jakten på en mekanisme; Big Data, kunstig intelligens og de store spørsmålene.

Bygg en karriere innen datavitenskap

Skrevet av: Emily Robinson og Jacqueline Nolis

  • Utgiver: Manning
  • Publiseringsdato: 24. mars 2020
  • Språk: Engelsk
  • Dimensjoner: 7,38 x 0,8 x 9,25 tommer
  • Antall sider: ‎354

Innhold: Komme i gang med datavitenskap; Finne din datavitenskapsjobb; Sette seg inn i datavitenskap; Vokser i din Data Science-rolle.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2nd Edition

Skrevet av: Lillian Pierson

  • Utgiver: For Dummies
  • Publiseringsdato: 6. mars 2017
  • Språk Engelsk
  • Dimensjoner: 7,3 x 1 x 9 tommer
  • Antall sider: ‎384

Denne boken forutsetter at leseren allerede har den nødvendige kunnskapen om matematikk og programmering.

Innhold:  Wrapping Your Head around Data Science; Utforsking av rørledninger og infrastruktur for datateknikk; Bruk av datadrevet innsikt i næringslivet og industrien; Maskinlæring: Lær av data med maskinen din; Matematikk, sannsynlighet og statistisk modellering; Bruke klynging til å dele inn data; Modellering med instanser; Bygge modeller som driver Internet-of-Things-enheter; Følger prinsippene for datavisualiseringsdesign; Bruke D3.js for datavisualisering; Web-baserte applikasjoner for visualiseringsdesign; Utforsking av beste praksis innen dashborddesign; Lage kart fra romlige data; Bruker Python for Data Science; Bruk av åpen kildekode R for datavitenskap; Bruke SQL i datavitenskap; Gjør datavitenskap med Excel og Knime; Datavitenskap i journalistikk: Nailing Down the Five Ws (og en H); fordype seg i miljødatavitenskap; Datavitenskap for å drive vekst i e-handel; Bruke datavitenskap til å beskrive og forutsi kriminell aktivitet; Ti fenomenale ressurser for åpne data; Ti gratis datavitenskapelige verktøy og applikasjoner.

Utvinning av massive datasett / 3 rd Redigering

Skrevet av: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Utgiver: Cambridge University Press
  • Publiseringsdato: 13. februar 2020
  • Språk Engelsk
  • Dimensjoner: 7 x 1 x 9,75 tommer
  • Antall sider: ‎565

Denne boken forutsetter også at leseren allerede har den nødvendige kunnskapen om matematikk og programmering.

Innhold: Data Mining; MapReduce og den nye programvarestabelen; Algoritmer som bruker MapReduce; Finne lignende gjenstander; Gruvedatastrømmer; Link Analyse; Hyppige varesett; Gruppering; Annonsering på nettet; Anbefalingssystemer; Gruvedrift sosiale nettverk grafer; Dimensjonsreduksjon; Maskinlæring i stor skala.

Konklusjon

Skillene mellom spesialistprogrammer er ennå ikke klare. Skillene mellom generalist- og spesialistprogrammene er heller ikke klare ennå. Men etter å ha lest den gitte listen over bøker, vil leseren være i stand til å bedre sette pris på de spesielle rollene som dataanalytiker, dataingeniør og dataforsker, og deretter gå videre.