AI Knowledge Map: come classificare le tecnologie AI

Uno schizzo di un nuovo panorama della tecnologia AI

Una versione più breve di questo articolo è apparsa per prima su Forbes

L'articolo è stato inoltre premiato con il badge Silver da KDnuggets come uno dei più letti e condivisi nell'agosto 2018.

I. Pensieri introduttivi

Sono stato nello spazio dell'intelligenza artificiale per un po 'e sono consapevole che esistono classificazioni multiple, distinzioni, paesaggi e infografiche per rappresentare e tracciare i diversi modi di pensare all'intelligenza artificiale. Tuttavia, non sono un grande fan di quegli esercizi di categorizzazione, principalmente perché tendo a pensare che lo sforzo di classificare i punti di dati dinamici in predeterminate caselle di correzione spesso non valga i vantaggi di avere un quadro così “chiaro” (è una generalizzazione ovviamente, perché a volte sono estremamente utili).

Quando si tratta specificamente dell'intelligenza artificiale, penso anche che molte delle categorizzazioni là fuori siano incomplete o incapaci di catturare forti legami e aspetti fondamentali di questa nuova ondata di intelligenza artificiale.

Vorrei quindi dirti prima la logica di questo post. Lavorando con l'agenzia di innovazione strategica Chôra, volevamo creare uno strumento visivo che consentisse alle persone di cogliere a colpo d'occhio la complessità e la profondità di questa cassetta degli attrezzi, oltre a stabilire una mappa che potesse aiutare le persone a orientarsi nella giungla dell'IA. Dovresti considerare il seguente grafico come un modo per organizzare le conoscenze non strutturate in una sorta di ontologia con l'obiettivo finale di non rappresentare accuratamente tutte le informazioni esistenti sull'intelligenza artificiale, ma piuttosto di avere uno strumento per descrivere e accedere a parte di tale set di informazioni.

Quello che segue è quindi uno sforzo per disegnare un'architettura per accedere alla conoscenza dell'IA e seguire le dinamiche emergenti, un gateway per la conoscenza preesistente sull'argomento che ti permetterà di cercare informazioni aggiuntive e infine creare nuove conoscenze sull'IA.

L'utilità del lavoro finale dovrebbe quindi aiutarti a raggiungere tre cose: dare un senso a ciò che sta succedendo e avere una mappa per seguire il percorso; capire dove oggi viene utilizzata l'intelligenza artificiale (rispetto a dove non era usata in passato); capire quali e quanti problemi vengono riformulati per consentire all'intelligenza artificiale di affrontarli (se si ha familiarità con il lavoro di Agrawal et al., 2018 questi sono conseguenze dirette del calo dei costi delle tecnologie di previsione).

Questo articolo in linea di principio si rivolge sia alle persone che stanno iniziando nell'intelligenza artificiale per dare loro un ampio senso di ciò che è là fuori, sia agli esperti e ai professionisti che stanno sperimentando queste tecnologie per un po '(con una richiesta esplicita di inviarmi un feedback su come lo struttureresti o altre tecnologie che dovrebbero essere catturate dallo spettro AI).

Sono anche ben consapevole che si tratta di un compito ambizioso, quindi guarda semplicemente questo come una prima bozza o tenta di farlo piuttosto che una soluzione finale scritta nella pietra.

Consentitemi anche di concludere questa introduzione con qualcosa che ho scoperto cercando di raggiungere l'obiettivo di creare questo visual: è molto, molto difficile. Cercare di rappresentare quante più informazioni possibili in una mappa non ovvia bidimensionale è stato estremamente impegnativo, qualcosa che non ti rendi conto fino a quando non provi a farlo da solo. Invito tutti voi a fare lo stesso per capire cosa intendo (credetemi, non è affatto facile, soprattutto vista la discrepanza di opinioni, punti di vista e approcci utilizzati nell'intelligenza artificiale negli ultimi 60 anni). Questo mi porta al disclaimer finale: a volte dovevo approssimare i concetti o la classificazione stessa per mantenere un compromesso tra accuratezza e chiarezza, quindi perdonami in anticipo per alcuni errori minori (o importanti, agli occhi di qualcuno).

Quindi passiamo ora alla AI Knowledge Map (AIKM).

II. Dominio problematico + Approccio = Soluzione tecnologica

Quindi eccoci qui, tutto qui. Probabilmente ti aspettavi, dato l'introduzione di uno strano motore VR che proietta più fasci di luci per ogni tecnologia, ma è invece un grafico bidimensionale vecchio stile. Così semplice.

Vediamolo un po 'più da vicino però.

Sugli assi troverai due macrogruppi, ovvero i paradigmi AI e i domini problematici AI. I paradigmi AI (asse X) sono in realtà gli approcci utilizzati dai ricercatori dell'IA per risolvere problemi specifici legati all'IA (include gli approcci di cui siamo a conoscenza). Dall'altro lato, i domini problematici AI (asse Y) sono storicamente il tipo di problemi che l'IA può risolvere. In un certo senso, indica anche le potenziali capacità di una tecnologia AI.

Quindi, ho identificato i seguenti paradigmi AI:

  • Strumenti basati sulla logica: strumenti utilizzati per la rappresentazione della conoscenza e la risoluzione dei problemi;
  • Strumenti basati sulla conoscenza: strumenti basati su ontologie e enormi database di nozioni, informazioni e regole;
  • Metodi probabilistici: strumenti che consentono agli agenti di agire in scenari di informazione incompleta;
  • Apprendimento automatico: strumenti che consentono ai computer di apprendere dai dati;
  • Intelligenza incorporata: toolbox di ingegneria, che presuppone che un corpo (o almeno un insieme parziale di funzioni come movimento, percezione, interazione e visualizzazione) sia richiesto per un'intelligenza superiore;
  • Ricerca e ottimizzazione: strumenti che consentono una ricerca intelligente attraverso molte possibili soluzioni.

Questi sei paradigmi rientrano anche in tre diversi macro-approcci, vale a dire simbolico, sub-simbolico e statistico (rappresentato da colori diversi). In breve, l'approccio simbolico afferma che l'intelligenza umana potrebbe essere ridotta alla manipolazione di simboli, quella sub-simbolica secondo cui nessuna specifica rappresentazione della conoscenza dovrebbe essere fornita ex ante, mentre l'approccio statistico si basa su strumenti matematici per risolvere specifici sotto-problemi.

Una breve nota aggiuntiva: potresti sentire le persone parlare di "tribù AI", un concetto proposto da Pedro Domingos (2015) che raggruppa i ricercatori in gruppi in base agli approcci che usano per risolvere i problemi. Puoi facilmente mappare quelle cinque tribù con la nostra classificazione di paradigma (senza considerare il gruppo di intelligenza incorporato), cioè Simbolisti con approccio basato sulla Logica (usano ragionamenti logici basati su simboli astratti); Connessionisti con Machine learning (sono ispirati dal cervello dei mammiferi); Evoluzionisti con ricerca e ottimizzazione (sono ispirati all'evoluzione darwiniana); Bayesiani con metodi probabilistici (usano modelli probabilistici); e infine analizzatori con metodi basati sulla conoscenza, dal momento che cercano di estrapolare dalla conoscenza esistente e precedenti casi simili.

L'asse verticale stabilisce invece i problemi per cui l'IA è stata utilizzata e la classificazione qui è abbastanza standard:

  • Ragionamento: la capacità di risolvere i problemi;
  • Conoscenza: la capacità di rappresentare e comprendere il mondo;
  • Pianificazione: la capacità di stabilire e raggiungere obiettivi;
  • Comunicazione: la capacità di comprendere la lingua e comunicare;
  • Perception: la capacità di trasformare input sensoriali grezzi (ad es. Immagini, suoni, ecc.) In informazioni utilizzabili.

Mi sto ancora chiedendo se questa classificazione sia abbastanza grande da catturare tutto lo spettro di problemi che stiamo affrontando o se debbano essere aggiunti più casi (ad esempio, Creatività o Movimento). Per il momento, però, rimarrò con quello a 5 cluster.

I modelli delle scatole invece dividono le tecnologie in due gruppi, ovvero applicazioni ristrette e applicazioni generali. Le parole usate sono di proposito leggermente fuorvianti, ma mi accompagnano per un secondo e spiegherò cosa intendevo dire. Per chiunque inizi nell'intelligenza artificiale, conoscere la differenza tra AI debole / stretto (ANI), AI forte / generale (AGI) e Artificial Super Intelligence (ASI) è fondamentale. Per motivi di chiarezza, l'ASI è semplicemente una speculazione aggiornata, l'IA generale è l'obiettivo finale e il Santo Graal dei ricercatori, mentre l'IA ristretta è ciò che abbiamo veramente oggi, cioè un insieme di tecnologie che non sono in grado di far fronte a nulla al di fuori del loro ambito di applicazione (che è la principale differenza con AGI).

I due tipi di linee utilizzate nel grafico (continui e punteggiati) quindi vogliono esplicitamente indicare quella distinzione e renderti sicuro che quando leggerai qualche altro materiale AI introduttivo non ti perderai completamente. Tuttavia, allo stesso tempo, la differenza qui delinea le tecnologie che possono risolvere solo un compito specifico (di solito migliore degli umani - Applicazioni strette) e altri che oggi o in futuro possono risolvere più compiti e interagire con il mondo (meglio di molti umani - Applicazioni generali).

Infine, vediamo cosa c'è nel grafico stesso. Nella mappa sono rappresentate le diverse classi di tecnologie AI. Nota, non sto intenzionalmente nominando algoritmi specifici, ma piuttosto raggruppandoli in macro-gruppi. Non sto fornendo una valutazione del valore di ciò che funziona e di cosa non funziona, ma sto semplicemente elencando ciò a cui i ricercatori e i data scientist possono attingere.

Quindi, come leggi e interpreti la mappa? Bene, lascia che ti dia due esempi per aiutarti a farlo. Se si considera Natural Language Processing, questo incorpora una classe di algoritmi che utilizzano una combinazione di approccio basato sulla conoscenza, apprendimento automatico e metodi probabilistici per risolvere i problemi nel dominio della percezione. Allo stesso tempo, se guardi lo spazio vuoto all'intersezione tra paradigma basato sulla logica e problemi di ragionamento, potresti chiederti perché non ci sono tecnologie lì. Ciò che la mappa sta trasmettendo non è che non esiste categoricamente un metodo che può riempire quello spazio, ma piuttosto che quando le persone affrontano un problema di ragionamento preferiscono piuttosto usare un approccio di Machine Learning, per esempio.

Per concludere questa spiegazione, questo è l'elenco completo delle tecnologie incluse con le proprie definizioni:

  • Robotic Process Automation (RPA): tecnologia che estrae l'elenco di regole e azioni da eseguire osservando l'utente che svolge un determinato compito;
  • Sistemi esperti: un programma per computer che ha regole rigide per emulare il processo decisionale umano. I sistemi fuzzy sono un esempio specifico di sistemi basati su regole che mappano le variabili in un continuum di valori tra 0 e 1, contrariamente alla logica digitale tradizionale che si traduce in un risultato 0/1;
  • Computer Vision (CV): metodi per acquisire e dare un senso alle immagini digitali (generalmente suddivise in riconoscimento delle attività, riconoscimento delle immagini e visione artificiale);
  • Natural Language Processing (NLP): sottocampo che gestisce i dati del linguaggio naturale (tre blocchi principali appartengono a questo campo, ovvero comprensione della lingua, generazione della lingua e traduzione automatica);
  • Reti neurali (NN o ANN): una classe di algoritmi modellati vagamente sulla struttura neuronale del cervello umano / animale che migliora le sue prestazioni senza essere esplicitamente istruito su come farlo. Le due principali e sottoclassi ben note di NN sono Deep Learning (una rete neurale a più livelli) e Generative Adversarial Networks (GAN - due reti che si addestrano a vicenda);
  • Sistemi autonomi: sottocampo che si trova all'intersezione tra robotica e sistemi intelligenti (ad esempio percezione intelligente, manipolazione di oggetti abili, controllo robotico basato su piano, ecc.);
  • Distributed Artificial Intelligence (DAI): una classe di tecnologie che risolvono i problemi distribuendoli a "agenti" autonomi che interagiscono tra loro. I sistemi multi-agente (MAS), la modellazione basata su agenti (ABM) e Swarm Intelligence sono tre specifiche utili di questo sottoinsieme, in cui comportamenti collettivi emergono dall'interazione di agenti auto-organizzati decentralizzati;
  • Affective Computing: un sottocampo che si occupa del riconoscimento, dell'interpretazione e della simulazione delle emozioni;
  • Algoritmi evolutivi (EA): è un sottoinsieme di un più ampio dominio dell'informatica chiamato calcolo evolutivo che utilizza meccanismi ispirati alla biologia (ad esempio, mutazione, riproduzione, ecc.) Per cercare soluzioni ottimali. Gli algoritmi genetici sono il sottogruppo più utilizzato di EA, che sono euristiche di ricerca che seguono il processo di selezione naturale per scegliere la soluzione candidata “più adatta”;
  • Programmazione logica induttiva (ILP): sottocampo che utilizza la logica formale per rappresentare un database di fatti e formulare ipotesi derivanti da tali dati;
  • Reti decisionali: è una generalizzazione delle reti / inferenze bayesiane più note, che rappresentano un insieme di variabili e le loro relazioni probabilistiche attraverso una mappa (chiamata anche grafico aciclico diretto);
  • Programmazione probabilistica: un framework che non ti obbliga a codificare in modo specifico una variabile specifica, ma piuttosto lavora con modelli probabilistici. Bayesian Program Synthesis (BPS) è in qualche modo una forma di programmazione probabilistica, in cui i programmi bayesiani scrivono nuovi programmi bayesiani (invece che gli umani lo fanno, come nel più ampio approccio di programmazione probabilistica);
  • Ambient Intelligence (AmI): un framework che richiede dispositivi fisici negli ambienti digitali per rilevare, percepire e rispondere con consapevolezza del contesto a uno stimolo esterno (di solito innescato da un'azione umana).

Al fine di risolvere un problema specifico, potresti seguire uno o più approcci, che a loro volta significano una o più tecnologie dato che molte di esse non si escludono a vicenda, ma sono piuttosto complementari.

Infine, esiste un'altra classificazione pertinente che non ho incorporato nel grafico sopra (ovvero il diverso tipo di analisi), ma che vale la pena ricordare per completezza. In realtà potresti incontrare cinque diversi tipi di analisi: analisi descrittiva (cosa è successo); analisi diagnostica (perché è successo qualcosa); analisi predittiva (cosa accadrà); analisi prescrittiva (raccomandando azioni); e analisi automatizzata (intraprendere azioni automaticamente). Potresti anche essere tentato di usarlo per classificare in qualche modo le tecnologie di cui sopra, ma la realtà è che questa è una classificazione funzionale e una di processo piuttosto che una di prodotto - in altre parole, ogni tecnologia nello spettro può adempiere a queste cinque funzioni di analisi .

III. Conclusione

Insegnare ai computer come imparare senza la necessità di essere programmati esplicitamente è un compito difficile che coinvolge diverse tecnologie per gestire molteplici sfumature e, sebbene questa mappa sia lungi dall'essere perfetta, è almeno un primo tentativo di dare un senso a un paesaggio disordinato come quello dell'intelligenza artificiale.

Sono perfettamente consapevole che qui emerge un forte principio di Pareto, vale a dire che l'80% (se non di più) degli attuali sforzi e risultati sono guidati dal 20% delle tecnologie illustrate nella mappa (vale a dire, apprendimento profondo, PNL e computer visione), ma sono anche sicuro che avere una gamma completa potrebbe aiutare ricercatori, start-up e investitori.

Oltre a cercare di incorporare e prendere in considerazione feedback e commenti su questa prima versione, sto pianificando di compiere altri due passi in futuro: uno sta creando un livello per il tipo di sfide che l'IA deve affrontare (ad esempio, problemi di memoria e dimenticanza catastrofica, trasferire l'apprendimento, apprendere da un minor numero di dati con cose come zero e one-shot learning, ecc.) e quale tecnologia può essere utilizzata per superare quel problema specifico. In secondo luogo, cercando di applicare gli obiettivi per esaminare le diverse tecnologie e non i problemi che stanno risolvendo, ma piuttosto quelli che stanno creando (ad esempio, problemi etici, problemi ad alta intensità di dati, black-box e problemi di spiegabilità, ecc.).

Se hai quindi commenti su come migliorare il lavoro esistente o suggerimenti su come incorporare questi due passaggi aggiuntivi, ti preghiamo di contattarci!

E se sei un'azienda che lavora con una delle tecnologie sopra menzionate, mi piacerebbe molto sapere di più da te.

Divulgazione: la mappa della conoscenza AI è stata sviluppata con la consulenza strategica sull'innovazione Axilo, per attività sulla loro piattaforma Chôra.

Riferimenti

Agrawal, A., Gans, J., Goldfarb, A. (2018). "Macchine di previsione: la semplice economia dell'intelligenza artificiale". Stampa di Harvard Business Review.

Domingos, P. (2015). "The Master Algorithm: How the Quest for the Ultimate Learning Machine rifarà il nostro mondo". New York: libri di base.