Oggi ogni Azienda è da considerarsi a tutti gli effetti una data-company ed ogni professionista che lavora al suo interno è un professionista dei Dati.
Contabili, venditori, responsabili delle risorse umane e ingegneri lavorano tutti con i Dati per ricavarne informazioni.
Questa nuova funzione lavorativa, per la quale qualsiasi professionista aziendale può utilizzare Dati e modelli di analisi per ottenere informazioni approfondite, ha creato il concetto di Citizen Data Scientist o CDS.
Secondo Gartner, “un CDS è qualcuno che crea o genera modelli utilizzando analisi diagnostiche avanzate o capacità predittive e prescrittive, ma la cui funzione lavorativa principale è al di fuori del campo delle statistiche e dell’analisi”.
Ma in che modo un CDS “Power User” sfrutta Dati ed Analytics per ricavare informazioni utili per il processo decisionale di tutta l’Azienda?
Quali strumenti e capacità ci permettono di “potenziare” il CDS?
3 strumenti chiave per il Citizen Data Scientist di successo
Fondamentalmente, un CDS di successo sfrutterà tre strumenti chiave per fornire Insights:
- Dati aziendali di qualità
- una solida piattaforma di analisi self-service (SSA)
- un solido processo di governance dei Dati e degli Analytics
Queste tre funzionalità offrono il potenziale per rispondere a esigenze di analisi dei Dati sempre più avanzate, mettendo più potere nelle mani degli utenti aziendali per ottenere risposte a domande critiche on-demand.
Sebbene le capacità dei CDS siano diverse a seconda dell’organizzazione, esistono ancora elementi comuni applicabili a tutte le organizzazioni.
Dati aziendali di qualità
Innanzitutto i Dati giusti – non necessariamente più Dati – sono ciò di cui gli utenti hanno bisogno per fornire buoni Insights.
I dati giusti nel contesto dell’analisi hanno tre caratteristiche principali:
- dimensioni o attributi rilevanti
- struttura dei Dati corretta
- minore variabilità nei valori dei Dati
Analytics self-service robuste
Il secondo componente che il CDS mette in campo è la piattaforma SSA, che consente ai professionisti aziendali di eseguire query e generare Insights con un supporto IT minimo.
Una solida piattaforma SSA nel contesto di analisi e del CDS dovrebbe supportare quattro caratteristiche chiave:
- Acquisizione dei Dati. Una piattaforma di analisi è preziosa quanto i Dati a sua disposizione. Pertanto, la piattaforma SSA dovrebbe connettersi facilmente alle fonti di Dati esistenti, sia che si tratti di un database canonico (come il Data Warehouse) o di un sistema di record (come un ERP o un CRM). Indipendentemente dalle origini Dati, che siano on-premise, cloud o su un cloud ibrido, la piattaforma SSA dovrebbe supportare una facile gestione degli indici (per una ricerca efficiente), dei caricamenti e degli aggiornamenti dei Dati.
- Sicurezza. SSA non significa meno sicurezza del sistema e dei Dati; la governance è un prerequisito chiave per un SSA e un CDS di successo. Le piattaforme SSA dovrebbero supportare l’autenticazione del CDS con soluzioni di gestione dell’identità (IDM) e Role-Based Access Control (RBAC) per garantire che l’accesso a dati sensibili come Payment Card Industry Data Security Standard (PCI DSS) e Personally Identifiable Information (PII) sia controllato e governato.
- Modello Semantico. Le soluzioni di Analytics dipendono dall’acquisizione di Dati da diversi sistemi. Dato che le definizioni di questi elementi di Dati variano, spesso è urgente offrire una rappresentazione semantica o significativa di questi ultimi. I modelli semantici descrivono le relazioni che esistono tra valori specifici di Dati. Quindi l’SSA dovrebbe aiutare il CDS a sfruttare un modello semantico centralizzato per stabilire un’unica fonte di verità (SoT – Source of Truth) per generare approfondimenti accurati e tempestivi.
- Librerie. La piattaforma SSA dovrebbe avere una vasta libreria di algoritmi di Analytics collaudati nel tempo, incluso l’accesso a librerie open source come TensorFlow, Keras, Scikit-learn e altre. Ciò renderà più facile per il CDS riutilizzare gli algoritmi di Analytics esistenti invece di creare le proprie soluzioni da zero.
Governance solida di Dati ed Analytics
Infine, il CDS non sarà “potenziato” senza i giusti processi di governance.
Sebbene non si possa negare che un CDS sia potente, è altrettanto importante riconoscere che il CDS debba essere gestito con un framework di governance dei Dati che ne identifichi la proprietà, valuti i ruoli, si istruisca sull’alfabetizzazione dei Dati, ottimizzi le query, segnali i report e le dashboard non utilizzati ed offra altre attività regolatorie e di gestione dei Dati.
Nell’odierna economia digitale e data-centrica, gli Analytics rappresentano un fattore chiave che trasforma i Dati in una risorsa aziendale fornendo le informazioni per un solido processo decisionale.
Purtroppo, la maggior parte dei progetti di Analytics si è concentrata su team di Data Science centralizzati per offrire Insights di Business, ed il risultato è che oltre l’80% dei programmi di Analytics viene “gestito da esperti i cui talenti non cresceranno nell’organizzazione”, secondo Gartner.
Questo approccio centralizzato non solo ha ritardato il consumo di informazioni, ma ha anche aumentato il costo della trasformazione di queste ultime in azioni di Business.
Il futuro del trarre valore da Dati ed Analytics si basa sul potenziare il CDS, e questo potenziamento può ridurre i tempi di ciclo, far risparmiare sui costi e migliorare il servizio clienti per le organizzazioni.
Tuttavia, il Citizen Data Scientist “Power User” deve essere orientato al successo offrendo Dati di qualità, un solido processo di governance degli stessi de una piattaforma SSA di facile utilizzo.