L’intelligenza artificiale (IA) e il machine learning (ML) sono termini spesso usati come sinonimi, ma nascondono una relazione più complessa. Il machine Learning è già dietro molte delle decisioni che influenzano la tua vita (e il tuo business). Ma come funziona davvero? E soprattutto: cosa può fare per la tua azienda?
Indice dei contenuti
La differenza tra intelligenza artificiale e machine learning
/ [ torna al menu ]
L’intelligenza artificiale (IA) è un termine ombrello che indica strategie e tecniche per permettere alle macchine di gestire compiti complessi. L’IA include di tutto, smart assistant, robot aspirapolvere e auto a guida autonoma.
Il machine learning (ML) è un ramo dell’IA. È la scienza dello sviluppo di algoritmi e modelli statistici che i sistemi informatici utilizzano per eseguire attività complesse senza istruzioni esplicite.
Il Machine Learning è ciò che permette a un sistema informatico di imparare dai dati e migliorare con l’uso, proprio come fa un essere umano con l’esperienza.
I sistemi si basano invece su modelli e inferenze.
I sistemi informatici utilizzano gli algoritmi di machine learning per elaborare grandi quantità di dati storici e identificare modelli di dati.
Sebbene il machine learning sia IA, non tutte le attività IA sono machine learning.
Machine learning e sistemi informatici: un paradigma diverso
/ [ torna al menu ]
Un comune sistema informatico può essere scomposto in tre fattori:
- I dati o input: il sistema legge e/o produce dati che servono allo scopo per cui è stato pensato. Un sistema di vendita di biglietti online prima di poter approvare un’acquisto controlla il numero di biglietti ancora disponibili.
- le regole: l’insieme di algoritmi e procedure che permettono al sistema di risolvere il/i task per cui è stato sviluppato solitamente codificati in uno o più linguaggi di programmazione, ciò dipende dal contesto.
- output: la risposta, in termini di dato che ci si aspetta dal sistema basata su un particolare input
partendo dai dati e da un sistema di regole correttamente codificato otteniamo l’output.
Ad esempio, data la ricetta di una torta e tutti gli ingredienti necessari possiamo ottenere un delizioso dolce che fa bene all’anima.
Il Machine Learning è uno strumento reale, concreto e accessibile anche per la tua azienda. Scopri come.
Richiedici una consulenza!
Cosa fa il machine learning
Nel machine learning il sistema non è formato da regole già definite ma, a partire da dati e/o comportamenti, impara a ricostruire le regole che risolvono un dato problema tramite una procedura solitamente chiamata addestramento.
Quindi, a partire da dati e risposte, input e output già noti e correttamente associati, otteniamo un sistema che ha ricostruito le regole per ottenere a partire da un dato input un determinato output.
Leggi anche: In che modo i Big Data trasformano il settore retail |
In particolare, questo setup in cui abbiamo dati etichettati si colloca nella categoria di problemi di machine learning chiamata apprendimento supervisionato; come vedremo nelle sezioni successive ci sono altri approcci che non prevedono necessariamente, ad esempio, il fatto che i dati di input siano etichettati.
Quindi, ritornando all’esempio della torta, qui il sistema, dopo aver visto un numero sufficiente di volte come viene preparata una torta, impara a ottenere una torta a partire dai suoi ingredienti.
I tre pilastri del machine learning
/ [ torna al menu ]
Non tutto il machine learning è uguale. Ci sono tre modi principali in cui un algoritmo può imparare:
Supervisionato: è come insegnare a un bambino mostrandogli esempi con le etichette. Gli dici “questo è un cane, questo è un gatto”, e poi lo lasci provare da solo. È il metodo più usato, ad esempio per prevedere vendite o classificare email come spam.
Non supervisionato: qui l’algoritmo esplora da solo i dati, cercando somiglianze, gruppi o anomalie. È come dargli un mazzo di foto miste e chiedergli di raggrupparle per somiglianza, senza sapere cosa rappresentano.
Apprendimento per rinforzo: l’algoritmo impara facendo tentativi ed errori, un po’ come un videogioco. Ogni volta che prende una decisione, riceve un premio o una penalità. È il principio che guida le auto a guida autonoma o i robot intelligenti.
Possiamo pensare al Machine Learning come a tre modi diversi in cui una macchina può imparare: con un insegnante (supervisionato), da sola (non supervisionato), o sbagliando e correggendosi (apprendimento per rinforzo).
Un qualsiasi sistema di machine learning, al netto di particolari declinazioni, risolve due tipologie di problemi.
- problemi di classificazione in cui il sistema, dato un particolare input, deve essere in grado di etichettarlo correttamente sulla base di un sistema di categorie a noi noto. Un caso di classificazione è quando il sistema, data un’immagine, deve sapere dire se questa presenta al suo interno un cane o meno.
- problemi di regressione, qui il sistema sulla base dell’input deve essere in grado di produrre un numero sulla base dell’input. Ad esempio, un possibile caso di regressione è la previsione dei prezzi di un immobile in una data zona della città.
1. Apprendimento Supervisionato (Supervised Learning)
Nell’apprendimento supervisionato è indispensabile avere a disposizione dati etichettati.
Cerchiamo di capire cosa significa e di quanti dati abbiamo bisogno: supponiamo di voler sviluppare un sistema che, ogni qual volta riceviamo una mail, automaticamente ci dica se è una possibile mail di spam, in modo da spostarla contestualmente nell’opportuna cartella.
Per farlo, il nostro sistema deve sapere come è fatta una mail di spam, ma anche com’è fatta una mail ordinaria; dunque dobbiamo dargli degli esempi di un caso e dell’altro, ovvero un insieme di mail dove ognuna avrà un’etichetta che potrà essere “SPAM” o “NON SPAM“. Due aspetti diventano fondamentali a questo punto per i motivi che a breve verranno introdotti:
- Numerosità e diversità degli esempi;
- Bilanciamento delle classi;
Partiamo dal primo. Ciò che si intende in questo caso è che il numero di esempi del dataset deve essere abbastanza alto da permettere al sistema di capire come riconoscere una mail di spam.
Allo stesso tempo gli esempi devono essere tra loro diversi ma rappresentativi del fenomeno in esame. Partiamo da un esempio estremo in cui abbiamo un dataset con soli due esempi, uno per classe.
Leggi anche: Come l’analisi predittiva migliora la fidelizzazione dei clienti |
In un caso del genere il sistema farebbe un’enorme difficoltà a riconoscere mail di SPAM che siano diverse dall’unica che ha visto; allo stesso modo, se aumentiamo a dismisura il numero di esempi di SPAM, ma tutti troppo simili tra loro, il sistema, una volta messo in uso, saprà etichettare solo mail di SPAM molto simili a quelle che ha visto nel dataset. Risulta quindi fondamentale che i dati che abbiamo siano rappresentativi del fenomeno che vogliamo descrivere in maniera quanto più precisa e sfaccettata.
Nel Machine Learning i dati sono tutto. Se sbagli dati, sbagli direzione
Altro problema da non prendere sotto gamba è il bilanciamento delle classi. Nel nostro esempio abbiamo solo due classi, ma cosa accadrebbe se avessimo un milione di esempi di SPAM e un solo esempio di NON SPAM? Il sistema probabilmente tenderebbe a classificare quasi tutte le mail che vede come mail di SPAM in quanto lui conosce solo quelle.
Quindi è fondamentale che il numero di esempi per ogni classe coinvolta sia bene o male lo stesso, in modo da dare al sistema la possibilità di conoscerle tutte e saper correttamente distinguere l’una dall’altra.
2. Apprendimento Non Supervisionato (Unsupervised Learning)
Cosa succede quando abbiamo molti dati ma, per un qualsiasi motivo, questi non possono essere etichettati? Qui entra in gioco l’apprendimento non supervisionato.
Un sistema addestrato in maniera non supervisionata, non avendo a disposizione delle etichette, cercherà di raggruppare i dati sulla base delle loro caratteristiche intrinseche facendo emergere, lì dove già presenti, pattern e/o raggruppamenti.
Un’applicazione classica di questo tipo è il clustering. Supponiamo di avere un dataset anonimo di clienti con due variabili:
- Frequenza di acquisto (numero di ordini all’anno).
- Valore medio degli ordini (in euro).
L’obiettivo è raggruppare automaticamente i clienti simili senza sapere in anticipo quali categorie esistono (marketing personalizzato, sconti mirati, ecc.).

Pronto a trasformare i tuoi dati in valore grazie all’intelligenza artificiale?
Scopri cosa facciamo con l’Intelligenza Artificiale
Leggi altri articoli pubblicati nel nostro blog.
Questo articolo ha 0 commenti