Tab Article
La data science è una materia in rapida evoluzione le cui applicazioni spaziano in ambiti diversi della nostra vita. Questo libro insegna a trasformare database caotici e dati non strutturati in dataset omogenei e ordinati attraverso l'impiego degli strumenti essenziali del linguaggio Python per il data mining, il machine learning, la network analysis e l'elaborazione del linguaggio naturale. Il lettore impara ad acquisire dati numerici e testuali eterogenei da fonti diverse come semplici file locali, database e il Web. Scopre come ripulirli e normalizzarli. Lavora su basi di dati SQL e NoSQL, applica strumenti per la rappresentazione grafica e scopre i modelli di analisi statistiche e predittive più utilizzati nel campo del machine learning. Una lettura dedicata a studenti e docenti, ai professionisti alle prime armi e agli sviluppatori in cerca di una guida di riferimento. I requisiti fondamentali sono una normale esperienza di programmazione in Python e un ambiente di sviluppo con installata la versione 3.3 (o superiore) del linguaggio oltre ai moduli e alle librerie specifiche indicate nel testo.