Facebook, Twitter e LinkedIn generano nel social web un’enorme quantità di dati di grande valore: ma come è possibile individuare le persone che sono in contatto attraverso i social media, scoprire ciò di cui parlano o localizzare le città di appartenenza? Questo libro risponde a queste e ad altre domande. Insegna a fare un uso integrato dei dati del social web, delle tecniche di analisi e dei sistemi di rappresentazione grafica per portare alla luce esattamente ciò che si sta cercando nell’oceano del web, nonché ulteriori informazioni di cui neppure si sospetta l’esistenza.
Ogni capitolo è strutturato come unità a sé e presenta le tecniche per estrarre i dati da aree diverse del social web, compresi i blog e le email. Tutto ciò che occorre per iniziare è una formazione da programmatore e la determinazione a imparare gli strumenti basilari di Python.
Gli argomenti trattati
- Una visione profonda e dettagliata del panorama del social web
- Script da GitHub facilmente personalizzabili che permettono di raccogliere dati dalle API dei social network come Twitter, Facebook e LinkedIn
- Uso di semplici strumenti in Python per atomizzare e riorganizzare i dati raccolti
- Esplorazione delle connessioni sociali in micro format con XHTML Friends Network
- Applicazione di tecniche avanzate di estrazione, come TF-IDF, coseno di similitudine, analisi della collocazione, riepilogo del documento e rilevamento delle cricche
- Costruzione di visualizzazioni interattive con tecnologie web basate su HTML 5 e JavaScript
Mattew A. Russell, responsabile dello sviluppo presso Digital Reasoning System e presso Zaffra, è un ricercatore informatico con la passione per l’estrazione dei dati, per l’open source e per le tecnologie delle applicazioni web.