I dati sono il petrolio del futuro, ma come il petrolio devono essere raffinati prima di poter essere usati.Per accrescere la competitività di una impresa è necessario un sistema informativo che separi in modo chiaro il mondo dei dati dal mondo delle applicazioni.
I dati sono ovunque e non esiste un solo modo di trattarli: alcuni devono essere analizzati in tempo reale, altri possono essere analizzati con più calma. Pensate ad esempio un sistema di allarmistica o il sistema di indiciamento delle pagine web di Google.
Spesso i dati devono essere puliti, trasformati e caricati in storage intermedi per poter essere analizzati. Il vecchio datawharehouse non è più sufficiente. Oggi è necessario utilizzare data lake per stoccare log, federare dati che arrivano da fonti diverse e integrare open data. Quando i dati sono tantissimi occorre aggregarli utilizzando tecnologie di map-reduce come quelle messe a disposizione da Apache hadoop.
Ancora più spesso, anche grazie ai nuovi algoritmi di machine learning le relazioni tra i dati diventano così complicate e profonde da richiedere di essere organizzate in una base della conoscenza, ad esempio utilizzando un graph db RDF. La conoscenza così ottenuta può essere anche navigata da algorimi di machine learning, da regole basate su intelligenza artificiale o semplicemente importata da programmi di analisi.
Una data management platform (DMP) è appunto l’insieme degli strumenti che consentono di pulire, federare, integrare e analizzare i dati provenienti da moltissime fonti, sia interne che esterne all’azienda.
La piattaforma diventa smart nel momento in cui è in grado di comprendere anche il significato dei dati.
Solo così è possibile collegare dati eterogenei garantendo nel contempo la crescita ordinata delle informazioni a supporto delle decisioni.
Anche il significato dei dati muta nel tempo, fortunatamente le tecnologie semantiche sviluppate nell’ultimo decennio nell’ambito del Semantic Web hanno hanno dimostrato di essere capaci di supportare anche i cambiamenti di modello di business più radicali.
I dati con un significato formale si sono guadagnati sul campo la qualifica di smart e sono oggi maturi per un impiego nei business come già fanno Google, FaceBook, IBM, governi e moltissime startup.
Le principali piattaforme di cloud (Amazon AWS, Google Cloud, Microsoft Azure, etc) mettono a disposizione un ricco insieme di strumenti in modalità “as a Service” per gestire i big data, i data lake e molti altri componenti della data management platform. La startup italiana LinkedData.Center si è specializzata negli strumenti di ingestion dei significati e di interfaccia verso gli smart data con la sua piattaforma Smart Data as a Service (SDaaS)
Un esempio di implementazione completamente “as a Service” basata su strumenti disponibili sulla piattaforme Google, Amazon AWS e LinkedData.Center è descritta nella seguente figura:
Con una smart data management platform è possibile analizzare i gusti e i comportamenti dei propri clienti per proporgli il miglior prodotto, identificare nuove aree di business, nuove tendenze, ottimizzare i costi e tutto quanto la fantasia dell’imprenditore suggerisce.
L’unico elemento imprescindibile sono i dati, siano essi aziendali (first party data), provenienti da partner (second party data) o da fonti esterne all’azienda (third party data) come ad esempio gli open data forniti gratuitamente dai governi o i dati a pagamento forniti da data providers.
Una buona smart data management platform è in grado di utilizzarli tutti, anche in presenza di inconsistenze differente qualità tra i dati trattati.
L’autore:
Enrico Fagnoni
È un veterano IT con molti anni di esperienza in aziende nella creazione di processi ingegneristici sw. Crede in arte e scienza come motore di trasformazione sociale responsabile.
Sta lavorando con passione sul bordo della tecnologia dove cerca, con tutte le sue energie, di essere riconosciuto tra i leader.
Ha trascorso i suoi ultimi 10 anni sfruttando le tecnologie di organizzazione della conoscenza nelle imprese. Sta lavorando alla nuova architettura Web 3.0, cercando di capire meglio il suo potenziale e di contribuire al suo sviluppo.
Ora è proprietario e amministratore delegato @ LinkedData.Center e E-Artspace, proprietario e CTO @ Maximal. Co-fondatore e membro del Consiglio di Amministrazione nel H2RAISE, Occambee, Cipolla, NetForce, MyMockup, SmartCom.
Altre esperienze professionali: Direttore Innovazione @ Alten, membro del comitato consultivo @ W3C. Sto contribuendo a Joomla, KEES (Conoscenza cambio Services Engine) e molti altri progetti open source.
Istruzione: Master “Scienze dell’Informazione” @ “Università degli Studi” di Milano, ha pubblicato molti articoli su SW Engineering, Semantic Web, il cloud computing. Certificato ISTQB. Sociale
Attività: presidente dell’organizzazione no-profit “Bassa Definizione”, fondatore e tesoriere di “Centre Européen po ur l’improvvisazione” in Francia.
Questo artico è tratto dal “Dossier Economia Digitale”, pubblicato dall’Associazione I Copernicani nel mese di ottobre 2018
Articoli recenti
Martedì 17 settembre ore 21:00 – Creatività artificiale, AI generativa e diritti d’autore.
Nuovo appuntamento online della serie #DialoghiCopernicani, con Carlo Piana, rinomato avvocato ed esperto nel campo [...]
Set
Martedì 16 luglio ore 21:00 – Telecomunicazioni Italiane ed europee: nuovi scenari
Dal 1 luglio TIM ha cessato di essere un operatore verticalmente integrato. Quali le ripercussioni [...]
Lug
Martedì 25 giugno ore 21:00 – Quando a votare sono le Intelligenze Artificiali.
Riflessioni sui sistemi di votazione a distanza nell’era dell’Intelligenza Artificiale. Incontro online via Zoom. Durante [...]
Giu
Quando una A.I. partecipa ad un sondaggio gestito da una A.I. – PolisOrbis
Durante l’ultima assemblea della Associazione Copernicani abbiamo presentato le nostre attività nel progetto Europeo Orbis. [...]
Giu
Lunedì 15 aprile alle 21:00 – “The Forbidden Fruit. DMA la nuova arma dell’antitrust EU?” con Lazar Radic
A pochi giorni dall’entrata in vigore del Digital Markets Act che mira a regolamentare il mercato digitale [...]
Apr
Martedì 7 novembre ore 21:00 – The Internet Con: How to Seize the Means of Computation – Cory Doctorow
L’incontro sulla “truffa di Internet”, in lingua inglese, previsto per lo scorso 11 ottobre, non [...]
Ott
ChatControl: la pedopornografia non si batte con la sorveglianza di massa
Articolo apparso su Agenda Digitale il 25 ottobre 2023 La proposta di legge Ue Child [...]
Ott
depreDATI a Milano Digital Week 2023
In occasione di Milano Digital Week, l’associazione Copernicani organizza depreDATI© il laboratorio di autodifesa dalla [...]
Set
BLOCKCHAIN SUMMERFORUM 2O23 – The Social Impact Of Crypto-Activities.
📣 Venerdì 15 settembre, presso la Ex Manifattura Tabacchi in Viale Regina Margherita a Cagliari, [...]
Ago