Analizzare e capire i fondamentali di un modello di analisi predittiva
Milioni di informazioni rappresentano la storia e il percorso di un’azienda. Non tutti approfittano di questa ricchezza in modo esauriente: i dati, ordinati e studiati a fondo, potrebbero essere determinanti per migliorare l’evoluzione e il futuro dei processi di business attraverso l’analisi predittiva.

La tua azienda raccoglie dati di vendita dei clienti? Magari usando sistemi di fidelizzazione o controllo degli acquisti? Se la risposta è sì, avete tutti gli strumenti per determinare quali possibili clienti acquisire in futuro e raccomandare prodotti in base al comportamento di altri utenti. Volete prevedere le vendite dei prossimi due trimestri? Sapere quali pubblicità veicolare nelle vostre campagne? Queste sono tutte forme di analisi predittiva.
Possiamo davvero predire il futuro?
L’analisi predittiva non è solo prevedere l’andamento futuro, come stessimo guardando in una sfera di cristallo, ma prendere decisioni informate, sulla base di quanto accaduto in passato. È fondamentale riconoscere comportamenti comuni e pattern ripetitivi, identificando le azioni corrette per raggiungere un target.
[quote float=”right”]Il volume dei dati aziendali crescerà di oltre 50 volte per anno fino al 2020. (Hadoop Summit, 2014)[/quote]
La mancanza di buoni dati è la barriera più comune per chi cerca di costruire modelli predittivi ottimali. Quindi come possiamo ricercare la pepita d’oro (i dati significativi) in mezzo agli altri sassolini (dati meno rilevanti)? L’analisi predittiva obbliga a seguire uno step iniziale in cui ordinare e aggregare la conoscenza.
Dati, mattoni dell’analisi predittiva
Le informazioni presenti su una sorgente dati devono essere studiate e capite a fondo, sia singolarmente sia nel loro complesso: questa fase è tanto importante quanto l’obiettivo, anzi, è la parte fondamentale senza la quale il risultato potrebbe essere inaffidabile. La costruzione del modello, infatti, richiede tempo per lo studio dei dati.
[quote float=”left”]Molte aziende utilizzano solo il 12% dei dati (Forrester)[/quote]
Armiamoci quindi di tutti i database disponibili, confrontiamo i dati e annotiamo ogni idea che emerge dall’analisi. Fissiamo gli obiettivi del nostro modello predittivo e impostiamo i vincoli che essi richiedono. Procediamo poi alla loro aggregazione e stiamo ben attenti a dati fondamentali come quelli temporali o geografici. Trattiamoli affinché il sistema possa interpretarli correttamente. Il tempo speso ad analizzare e studiare i dataset permetterà di produrre modelli replicabili in minor tempo e risultati migliori.Le informazioni presenti su una sorgente dati devono essere studiate e capite a fondo, sia singolarmente sia nel loro complesso: questa fase è tanto importante quanto l’obiettivo, anzi, è la parte fondamentale senza la quale il risultato potrebbe essere inaffidabile. La costruzione del modello, infatti, richiede tempo per lo studio dei dati.
L’importanza della fase di preparazione
L’obiettivo della fase di preparazione dei dati consiste nel generare un dataset significativo che risponda esattamente alle nostre ipotesi.
Consideriamo ad esempio un caso comune in cui un’azienda contatti telefonicamente i clienti per offrire un servizio bancario aggiuntivo. Partiamo dalle informazioni anagrafiche e finanziarie dei clienti, aggiungiamo i dati socio economici nazionali, la durata della chiamata e l’accettazione o meno della proposta. Dall’analisi predittiva emerge come la durata della chiamata sia la variabile più significativa e si debba investire su questo dato. In Italia le proteste contro la registrazione della durata delle chiamate sono reticenti, ma è necessario insistere affinché si possa accedere a questo importante dato. La forza di questa variabile è talmente elevata da dover essere esclusa per poter studiare l’impatto delle altre variabili secondarie sul risultato finale.
Nei prossimi articoli…
Conoscere i dati che si possiedono non significa solamente aprire e leggere un database, ma capire cosa un utente può fare con essi. Discuteremo in futuro di altri casi di applicazione di analisi predittiva.