Un Anno di Generative AI: da dove veniamo e dove stiamo andando
1 anno fa usciva ChatGPT ed il mondo si apprestava a scoprire il potere della Generative AI, vediamo cosa è successo in questo anno e cosa accadrà nei prossimi mesi.
Mi perdonerete il silenzio di oltre un mese, ma l’occasione lo richiedeva, è nato il mio primo figlio e al di là del grande cambiamento non volevo perdermi nemmeno un momento dei suoi primi giorni, ho scritto una riflessione su questo mese e sul diventare genitori nel 2023, in tutti i suoi aspetti, la trovate qui.
Tornando all’innovazione digitale è passato un anno da quando ChatGPT ha iniziato a rivoluzionare il panorama digitale mondiale. Oggi, ad un anno di distanza ci troviamo in un momento di profonda evoluzione, testimoni dell'emergere di nuove tecnologie e applicazioni. Nel corso dell’ultimo mese vi sono state talmente tante novità che ho iniziato diverse volte a scrivere questa newsletter senza avere mai il tempo e il modo di finirla adeguatamente che veniva subito sorpassata da una nuova notizia.
In questa newsletter troverete:
Breve storia recente dei Modelli di Linguaggio
ChatGPT da demo tecnologica a titano tecnologico
Il futuro di ChatGPT, OpenAI, Sam Altman e il progetto Q*
Le contromosse di Google: Search Generative Experience, Gemini e Med-PalM 2
Llama 2 e il forte impatto dei Modelli di Linguaggio LLM Open Source sul Mercato
Il nodo della legislazione dell’Intelligenza Artificiale
5 previsioni per il 2024
Per questo ho voluto scrivere un approfondimento che desse un po’ il quadro d’insieme di dove la Generative AI stia andando e di come si evolverà nel prossimo anno senza tralasciare le novità di questi ultimi giorni e gli sviluppi di questi ultimi mesi.
Breve storia recente di ChatGPT e dei Modelli di Linguaggio
Dal lancio di ChatGPT, avvenuto lo scorso anno, sono successe molte cose nell'ambito di OpenAI, dei governi, del sistema legale e dei concorrenti. Ecco una breve cronologia degli eventi legati al rilascio di ChatGPT e al suo impatto. Gli eventi sono stati troppi per poterli elencare tutti in modo esaustivo, quindi ecco una panoramica incompleta e ampia dei momenti storicamente più importanti.
06/11/2018 - OpenAI annuncia GPT, il primo della serie di modelli linguistici GPT.
14/02/2019 - OpenAI lancia GPT-2, un seguito più capace di GPT.
28/05/2020 - OpenAI annuncia GPT-3, il suo modello linguistico più potente.
30/11/2022 - ChatGPT viene lanciato pubblicamente come progetto di ricerca gratuito, utilizzando GPT-3.5.
12/05/2022 - Sei giorni dopo il lancio, Sam Altman annuncia che ChatGPT ha raggiunto 1 milione di utenti.
20/01/2023 - Il NYT riporta che Google inizia a raddoppiare i progetti di IA generativa, spaventata da ChatGPT.
23/01/2023 - Microsoft e OpenAI estendono la loro partnership per 10 miliardi di dollari.
02/01/2023 - OpenAI lancia ChatGPT Plus, un servizio in abbonamento da 20 dollari al mese.
02/01/2023 - ChatGPT diventa l'applicazione consumer con la crescita più rapida di tutti i tempi, raggiungendo i 100 milioni di utenti mensili.
07/02/2023 - Microsoft lancia una prima versione di Bing Chat, un bot conversazionale segretamente basato su GPT-4.
24/02/2023 - Meta rilascia LLaMA, un LLM di ricerca che dà vita a un movimento di cloni open source di ChatGPT.
27/02/2023 - Snapchat annuncia il chatbot conversazionale My AI, basato sulla tecnologia di OpenAI.
03/01/2023 - Debutta l'API di ChatGPT, che consente agli sviluppatori di integrare il chatbot nelle loro applicazioni.
14/03/2023 - Viene lanciato il modello linguistico GPT-4, che arriva per la prima volta su ChatGPT.
14/03/2023 - Anthropic lancia una versione in accesso anticipato di Claude Instant, il suo concorrente di ChatGPT.
21/03/2023 - Google lancia un'anteprima limitata di Google Bard, la sua risposta a ChatGPT.
21/03/2023 - Brian Hood comunica a OpenAI la sua intenzione di fare causa per diffamazione a causa delle false generazioni di ChatGPT. La questione viene poi risolta in via extragiudiziale.
22.03.2023 - Il Future of Life Institute chiede una pausa di sei mesi nello sviluppo dell'intelligenza artificiale in risposta al GPT-4.
23/03/2023 - OpenAI annuncia i Plugin di ChatGPT, che permettono al bot di collegarsi a diverse funzioni esterne.
25/04/2023 - OpenAI introduce le funzioni di ChatGPT per la privacy, come la disabilitazione della cronologia delle chat.
05/10/2023 - Il chatbot Google Bard viene lanciato a tutti gli utenti negli Stati Uniti.
16/05/2023 - Sam Altman, CEO di OpenAI, testimonia sui pericoli dell'IA in un'audizione al Senato degli Stati Uniti.
18/05/2023 - OpenAI rilascia l'app ChatGPT per iOS.
24/05/2023 - L'avvocato Steven Schwartz si scusa con il giudice per aver citato sei falsi casi legali confabulati da ChatGPT.
11/07/2023 - Anthropic lancia Claude 2, un assistente AI con un'interfaccia simile a ChatGPT.
19/07/2023 - Bloomberg riporta che Apple ha sviluppato un proprio chatbot interno, Ajax.
20/07/2023 - La funzione Istruzioni personalizzate consente agli utenti di impostare una personalità ChatGPT persistente tra le sessioni.
26/07/2023 - OpenAI rilascia l'applicazione ChatGPT per Android.
28/08/2023 - OpenAI lancia ChatGPT Enterprise, rivolto alle aziende.
09/20/2023 - Il generatore di immagini AI DALL-E 3 arriva su ChatGPT in versione wide release.
25/09/2023 - ChatGPT diventa multimodale con la capacità di interpretare le immagini e di conversare con la sintesi vocale.
11/06/2023 - GPT-4 Turbo arriva su ChatGPT, spostando il suo limite di conoscenza da settembre 2021 ad aprile 2023.
11/06/2023 - OpenAI introduce i GPT, ruoli che ChatGPT può svolgere utilizzando prompt personalizzati e interfacce API.
15/11/2023 - Microsoft si definisce "l'azienda del Copilot" dopo il suo riorientamento verso la tecnologia AI di OpenAI.
17/11/2023 - Il consiglio di amministrazione di OpenAI licenzia a sorpresa Sam Altman. Il 29 novembre 2023 ritorna ufficialmente come amministratore delegato.
28/11/2023 - Amazon annuncia Amazon Q, il suo concorrente di ChatGPT focalizzato sulle imprese.
Da demo tecnologica a titano tecnologico
Nonostante l'impatto, nulla di tutto ciò era stato pianificato prima del lancio di ChatGPT. Anzi, è nata come una demo tecnologica. Secondo un eccellente articolo sulla creazione di ChatGPT pubblicato dal MIT Technology Review a marzo - che potrebbe anche essere di 3.000 anni fa - OpenAI l'ha vista come un'anteprima di ricerca, un modo per raccogliere feedback sui suoi difetti aprendola al pubblico. "Non volevamo pubblicizzarlo come un grande progresso fondamentale", ha dichiarato Liam Fedus, scienziato di OpenAI, a quella rivista.
ChatGPT si basa su una tecnologia che cerca di prevedere il più probabile token successivo, o frammento di parola, in una sequenza. Nel 2019, dopo il rilascio di GPT-2, qualcuno si è reso conto che questa tecnologia poteva essere trasformata in un chatbot se il modello linguistico di grandi dimensioni fosse stato alimentato con la trascrizione di una conversazione che doveva completare. Con questo metodo, ogni richiesta al modello linguistico include l'intera storia della conversazione. Nell'era del GPT-3, OpenAI ha incluso un'implementazione di questa funzione simile a una chat nell'area di test per sviluppatori (chiamata "Playground") sul suo sito web, ma non era pubblica. Con ChatGPT, OpenAI ha ripreso questo concetto, lo ha semplificato perfezionando una versione di GPT-3 sulle trascrizioni delle chat e lo ha reso disponibile al pubblico.
Da un punto di vista tecnologico, inizialmente ChatGPT non è sembrato a molti particolarmente nuovo, tra coloro che prestano attenzione all'IA. I chatbot esistevano già da tempo. Il GPT-3, il modello di IA che ha portato a ChatGPT, era in circolazione dal 2020. Nel settembre 2022 è stato lanciato un sito di chat AI interessante, chiamato Character.ai, e appena due settimane prima di ChatGPT, Meta era stata pubblicamente svergognata per aver lanciato un'anteprima pubblica di Galactica, un modello di IA che pretendeva di scrivere letteratura scientifica ma che poteva anche allucinare sciocchezze razziste.
Rispetto a Galactica, OpenAI ha affrontato ChatGPT da una prospettiva diversa. Fin dall'inizio, l'azienda ha adottato un approccio modesto e cauto che ha permesso di proseguire l'esperimento anche a fronte di rigorosi test pubblici. Fin dall'inizio, ChatGPT si è rifiutato di rispondere ad alcune domande incendiarie e, man mano che gli utenti astuti in cerca di punti per i social media aggiravano ogni limitazione, OpenAI ha eretto nuove barriere di protezione per mantenere ChatGPT in linea. Queste limitazioni hanno frustrato molti, che hanno odiato l'artificiosa manipolazione, ma hanno impedito che i media si scatenassero e che altrimenti avrebbero potuto uccidere il progetto.
Anche Sam Altman, CEO di OpenAI, ha parlato apertamente dei limiti di ChatGPT. Poco dopo il lancio, ha twittato: "ChatGPT è incredibilmente limitato, ma abbastanza bravo in alcune cose da creare un'impressione fuorviante di grandezza. È un errore fare affidamento su di esso per qualsiasi cosa importante in questo momento. È un'anteprima del progresso; abbiamo molto lavoro da fare sulla robustezza e sulla veridicità". Più avanti ha scritto: "Sa molte cose, ma il pericolo è che sia fiducioso e che si sbagli una frazione significativa del tempo".
Ma ChatGPT non è mai rimasto fermo. OpenAI ha testato frequentemente nuove funzionalità sull'enorme pubblico, che spesso lo utilizzava gratuitamente, anche se a febbraio è stato aggiunto un livello a pagamento per l'accesso prioritario (ChatGPT Plus). Con il lancio di GPT-4 nel marzo 2023, ChatGPT ha ricevuto un notevole aggiornamento, riducendo le confabulazioni e diventando un assistente più affidabile. Da allora, OpenAI ha aggiunto a ChatGPT conversazioni vocali, generazione di immagini e interpretazione di immagini. Ancora oggi, il GPT-4 di ChatGPT è ampiamente considerato il leader tra i modelli linguistici di IA Generativa.
Il futuro di OpenAI, Sam Altman e il Progetto Q*
La soap opera che ci ha regalato il consiglio di amministrazione di Open AI con il siluramento di Sam Altman ed il suo successivo reintegro ci ha permesso di interrogarci sulla governance di quella che attualmente è l’azienda forse di maggior importanza del pianeta. Innanzitutto è bene ricordare che Open AI non è una vera e propria azienda ma una fondazione nata con l’obiettivo di proteggere l’umanità dallo sviluppo di un’AGI (Artificial General Intelligence) malevola. Uno dei risvolti della vicenda risoltasi poi con l’intervento di Microsoft e di Satya Nadella in persona è che il pubblico ha conosciuto alcune indiscrezioni sul progetto Q* (si pronuncia Q Star).
Secondo le fonti, Q* ha dimostrato capacità di risolvere problemi matematici, generando ottimismo tra i ricercatori riguardo alle sue potenzialità future. Nonostante le preoccupazioni per la sicurezza dell'AI, questo progetto è considerato un passo avanti significativo nel campo dell'intelligenza artificiale.
Q* sembra collegato a un'iniziativa di OpenAI chiamata "supervisione dei processi", finalizzata a ridurre errori logici dei modelli linguistici di grandi dimensioni (Llm). Questo approccio potrebbe migliorare la capacità degli Llm di affrontare problemi matematici con maggiore efficacia. Alcuni suggeriscono che Q* potrebbe utilizzare tecniche come il Q-learning o l'algoritmo A* per ottimizzare il ragionamento e la risoluzione di problemi.
Nonostante le speculazioni, non ci sono indicazioni che Q* possa portare a sistemi AI capaci di eludere il controllo umano o alla tanto temuta Intelligenza Artificiale Generale o AGI. L'utilizzo dell'apprendimento per rinforzo per affinare gli LLM sembra una direzione plausibile per OpenAI, dato il suo impiego in progetti precedenti e l'integrazione in ChatGPT. In definitiva, mentre Q* rappresenta un'avanzata promettente, non è motivo di panico riguardo a scenari apocalittici AI.
A differenza dei sistemi AI attuali, che sono specializzati in compiti specifici, l'AGI mirerebbe a un'intelligenza onnicomprensiva, simile a quella umana. Sebbene ci siano molti scettici oltre che sfide etiche e tecniche da affrontare, il potenziale di un tale sviluppo sarebbe immenso, e di grande importanza strategica e Altman sarebbe stato giudicato dal consiglio di amministrazione troppo incauto sulla gestione dell’innovazione aziendale. Insomma dentro OpenAI abbiamo avuto modo di vedere una lotta di potere tra una fazione accelerazionista dell’AI ed una più conservativa, come andrà a finire? Probabilmente a favore dei primi, col favore di Microsoft sui cui Server Azure gira ChatGPT, (non è un caso che ci si chieda se quella di Microsoft non sia in fondo stata una acquisizione mascherata).
Le contromosse di Google
Google è l’azienda che più di tutte insieme a Meta aveva fatto passi da gigante nello sviluppo dei modelli di linguaggio (come ricordo sempre in GPT, la T sta per Transformer un modello di linguaggio che ha creato Google stessa), nonostante ciò è da oltre un anno che si trova ad inseguire Microsoft ed OpenAI.
Vediamo la strategia AI di Google come si svilupperà (se volete approfondire avevo dedicato un approfondimento negli scorsi mesi). Google ha sempre scelto un approccio olistico per la sua AI ovvero utilizzarla all’interno dei propri prodotti per creare sempre più una migliore esperienza utente, si pensi alla funzione Immersive View di Google Maps, tuttavia sta rilasciando importanti novità anche per i propri modelli di linguaggio e sta sperimentando molto tramite la sua controllata Deep Mind.
Search Generative Experience (SGE)
Google ha adottato un approccio ibrido alla ricerca web, implementando importanti aggiornamenti al suo prodotto Search Generative Experience (SGE), lanciato a maggio, per potenziare la sua strategia di ricerca e intelligenza artificiale generativa. Recentemente, il 15 agosto, Google ha introdotto nuove funzionalità a SGE, tra cui una che permette agli utenti di visualizzare definizioni e immagini relative a parole specifiche all'interno delle risposte generate dall'IA. Questo aggiornamento migliora l'esperienza dell'utente fornendo contesto e informazioni dettagliate direttamente nelle risposte di ricerca.
Inoltre, Google ha introdotto una funzionalità di evidenziazione della sintassi per aiutare i programmatori a comprendere e debuggare il codice generato dall'IA. Questo aggiornamento colora i segmenti di codice per facilitare la lettura e l'analisi.
Recentemente, Google ha anche lanciato "SGE while browsing", un'applicazione disponibile su Android e iOS, e presto su Google Chrome, per aiutare gli utenti a navigare online e trovare informazioni più velocemente.
In risposta alla crescente concorrenza nel campo dell'IA, specialmente dopo l'introduzione di ChatGPT in Bing di Microsoft, Google ha intensificato i suoi sforzi nell'IA generativa. Gli analisti hanno evidenziato l'importanza vitale dell'IA per Google, suggerendo che un cambio di tendenza nell'uso dei motori di ricerca potrebbe avere impatti significativi sulle sue entrate pubblicitarie.
Gli aggiornamenti di Google non sono limitati alla ricerca, ma fanno parte di una strategia più ampia sull'IA generativa. Questo include lo sviluppo di strumenti come il Generative AI App Builder e il Model Garden di Google Cloud, progettati per facilitare la creazione di assistenti digitali e l'interazione con i modelli di base di Google.
Gli ultimi sviluppi di Google si rivolgono principalmente al mercato consumer, ma esiste la possibilità che l'azienda segua l'esempio di Microsoft introducendo versioni aziendali sicure dei suoi strumenti di IA come fatto con Duet AI per la suite Workspace.
Nel contesto più ampio del mercato dell'IA, diverse aziende stanno esplorando modi diversi per offrire esperienze di ricerca in un mondo guidato dall'IA generativa. Bing Chat e SGE, ad esempio, adottano approcci diversi alle query di ricerca, con Bing Chat che si concentra su un'esperienza di conversazione, mentre SGE utilizza contesti specifici per fornire risposte.
In parallelo, Google sta lavorando a strumenti di IA che offrono consigli e idee per la vita quotidiana, con progetti testati da Deep Mind in vari settori (aveva fatto scalpore la notizia del modello di Deep Mind che aveva scoperto oltre 2,2 milioni di nuovi materiali teoricamente aggregabili in laboratorio). Questi sviluppi indicano una direzione interessante per il futuro dell'IA in Google e nel settore tecnologico più ampio.
Gemini
Gemini è un modello linguistico di grandi dimensioni (LLM) sviluppato da Google AI. È un LLM multimodale, il che significa che può generare testo, tradurre lingue, scrivere diversi tipi di contenuti creativi e rispondere alle vostre domande in modo informativo. Gemini è stato addestrato su un enorme set di dati di testo e codice ed è in grado di generare testo di qualità umana e pertinente all'argomento in questione.
Gemini è disponibile in due versioni: Gemini Pro e Gemini Ultra. Gemini Pro è disponibile gratuitamente per gli utenti inglesi, mentre Gemini Ultra richiede un abbonamento a pagamento. Gemini Ultra è una versione più potente di Gemini, in grado di generare testi più lunghi e complessi e di ottenere prestazioni migliori in compiti quali la traduzione e la generazione di codici.
Ecco alcune delle caratteristiche principali di Gemini:
Multimodalità: Gemini è in grado di generare testi, tradurre lingue, scrivere diversi tipi di contenuti creativi e rispondere alle vostre domande in modo informativo.
Ampio set di dati: Gemini è addestrato su un enorme set di testi e codici, che gli conferisce un'ampia gamma di conoscenze e abilità.
Testo di qualità umana: Gemini è in grado di generare testo di qualità umana e pertinente all'argomento trattato.
Gemini è uno strumento potente che può essere utilizzato per una serie di attività, tra cui:
Scrivere contenuti creativi: Gemini può essere utilizzato per scrivere poesie, codici, script, brani musicali, e-mail, lettere, ecc.
Traduzione: Gemini può essere usato per tradurre dall'inglese ad altre lingue e viceversa.
Rispondere alle domande: Gemini può essere utilizzato per rispondere alle vostre domande in modo informativo.
Gemini è un nuovo e promettente LLM ancora in fase di sviluppo. È già uno strumento potente e con il tempo non potrà che migliorare.
Gemini sembra avere qualità che mancano a ChatGPT:
La capacità di essere efficacemente connessi a uno spazio di lavoro.
La possibilità di essere molto più lunghi nelle risposte.
Raggiungere una vera multimodalità (video, audio, testo).
E per ora almeno anche essere gratuito.
Attualmente GPT 4 è più forte di Gemini, ma mi aspetto che Gemini Ultra, in uscita a gennaio, superi l'attuale ChatGPT.
Med PaLM 2
Med-PaLM 2 è un modello linguistico di grandi dimensioni (LLM) di Google Research, progettato per il settore medico. È stato addestrato su un enorme insieme di testi e codici, tra cui riviste mediche, libri di testo e studi clinici. Med-PaLM 2 è in grado di rispondere a domande su un'ampia gamma di argomenti medici, tra cui malattie, trattamenti e procedure. Può anche generare testo, tradurre lingue e scrivere diversi tipi di contenuti creativi.
Casi d'uso
Med-PaLM 2 può essere utilizzato per diversi scopi nel settore sanitario, tra cui:
Ricerca medica: Med-PaLM 2 può essere utilizzato per aiutare i ricercatori a trovare e analizzare i dati medici. Può anche essere utilizzato per generare ipotesi e testare nuove idee.
Supporto alle decisioni cliniche: Med-PaLM 2 può essere utilizzato per aiutare i medici a diagnosticare le malattie e a prendere decisioni sul trattamento. Può anche essere utilizzato per fornire ai pazienti informazioni sulla loro condizione e sulle opzioni di trattamento.
Educazione sanitaria: Med-PaLM 2 può essere utilizzato per creare materiale didattico per i pazienti e gli operatori sanitari. Può anche essere utilizzato per rispondere alle domande dei pazienti sulla loro salute.
Scoperta di farmaci: Med-PaLM 2 può essere utilizzato per aiutare i ricercatori a identificare nuovi bersagli farmacologici e a sviluppare nuovi farmaci.
Medicina personalizzata: Med-PaLM 2 può essere utilizzato per aiutare i medici a personalizzare il trattamento per i singoli pazienti. A tal fine, può prendere in considerazione la storia medica del paziente, la sua composizione genetica e altri fattori.
Med-PaLM 2 è attualmente disponibile per un numero limitato di clienti Google Cloud. Per iniziare, è possibile visitare il sito web di Google Cloud: https://cloud.google.com/ e registrarsi per una prova gratuita. Una volta che si dispone di un account Google Cloud, è possibile richiedere l'accesso a Med-PaLM 2.
Questo modello di linguaggio prefigura quello che sarà il futuro LLM molto specifici per delle nicchie di mercato addestrati nel miglior modo possibile.
Llama 2 e il forte impatto dei Modelli di Linguaggio LLM Open Source sul Mercato
Esistono due tipi principali di LLM: quelli open-source e quelli proprietari. A differenza dei modelli proprietari e chiusi come il GPT-3, i LLM open-source rendono pubblici i loro dataset di addestramento, le architetture dei modelli e i pesi. Questa trasparenza promuove la riproducibilità e la decentralizzazione della ricerca sull'IA.
L'ascesa dei modelli di linguaggio LLM (Large Language Models) open source sta trasformando il mercato dell'AI. Questi modelli, accessibili a ricercatori e sviluppatori, stanno democratizzando l'uso dell'intelligenza artificiale, permettendo a un numero maggiore di persone di esplorare e innovare in questo campo. Questo trend non solo accelera lo sviluppo dell'AI ma stimola anche una maggiore collaborazione e condivisione di conoscenze tra la comunità scientifica e tecnologica.
Per sviluppare modelli di linguaggio Open Source che siano validi sono fondamentali i dati con i quali vengono addestrati, la scarsità di dataset affidabili rischia di diventare un problema per una futura evoluzione di questi modelli, ecco perché si parla di crearne di pubblici e open source.
La rivoluzione dell'AI generativa attuale non sarebbe possibile senza i cosiddetti grandi modelli di linguaggio (LLM), basati su transformer, un'architettura neurale potente. Questi sistemi AI, utilizzati per modellare e processare il linguaggio umano, sono detti "grandi" per i loro miliardi di parametri, pre-allenati con enormi corpus di testo.
Tra i più notevoli LLM open-source troviamo LLaMA 2 di Meta, BLOOM, BERT, Falcon 180B, OPT-175B, XGen-7B di Salesforce, GPT-NeoX e GPT-J di EleutherAI, Vicuna 13-B e l’ultimo arrivato Mixtral 8X7B (che è un progetto francese e supera pure Llama 2). Questi modelli variano in dimensioni, prestazioni e applicazioni, offrendo soluzioni per vari scopi, dalla generazione di testo all'assistenza clienti.
Llama 2 il ChatGPT di Meta
Llama 2 rappresenta il migliore dei modelli di linguaggio open source disponibili con licenza commerciale sul mercato, Meta ha reso disponibile un modello veramente performante in grado do competere con GPT 3.5 Turbo.
Llama 2 però non è solo, qui trovate una guida completa ed una lista di LLM Open Source disponibili in licenza commerciale, mentre guardiamo al futuro dell'AI, è chiaro che questi sviluppi rappresentano solo la punta dell'iceberg.
L’AI Generativa arriverà anche sugli Hardware (occhio alla realtà aumentata)
Recentemente, Humane ha lanciato AI PIN, un dispositivo rivoluzionario che integra funzionalità AI avanzate. Questo hardware rappresenta un salto qualitativo nell'interazione tra uomo e macchina, offrendo un'esperienza utente più fluida e intuitiva. AI PIN combina elaborazione dati in tempo reale e funzionalità di apprendimento automatico, portando l'AI direttamente nelle mani degli utenti. La sua capacità di adattarsi e rispondere alle esigenze individuali apre nuovi orizzonti nell'uso quotidiano dell'intelligenza artificiale.
Ma AI Pin non è il solo esempio di hardware che godrà delle prestazioni potenziate della Generative AI, pensate alla trascrizione, ai verbali o alla traduzione di riunioni o conferenze c’è un dispositivo, Cabolo, che nasce per registrare, trascrivere, tradurre, sottotitolare, indicizzare e archiviare automaticamente i contenuti audio-video in tempo reale, senza alcuna connessione a internet.
Il prossimo step saranno smartphone, il Pixel di Google sta facendo da apripista (ennesima prova su chi tra Apple e Google fa davvero innovazione e chi invece fa solo marketing), assistenti personali come Google Home o Alexa, occhiali Smart, da tenere d’occhio la collaborazione tra Meta e Rayban ma anche il visore di Apple e molti altri progetti analoghi, ogni big tech a qualcosa che bolle in pentola.
Il nodo della legislazione dell’Intelligenza Artificiale
L'Unione Europea ha recentemente concordato i dettagli dell'AI Act, una legislazione innovativa che stabilisce regole per chi sviluppa e utilizza l'intelligenza artificiale. Questa legge, che spera di essere un modello per il resto del mondo, include divieti su sistemi biometrici che identificano persone basandosi su caratteristiche sensibili come l'orientamento sessuale e la razza, e lo scraping indiscriminato di volti da internet. Ci sono anche nuovi requisiti di trasparenza per tutti i modelli di AI general purpose e regole più rigide per i modelli "molto potenti".
L'AI Act impone multe da 35 milioni di € sino al 7% del fatturato globale per le aziende non conformi e prevede l'entrata in vigore delle varie disposizioni in un arco temporale che va dai sei mesi ai due anni. È stato sottolineato come l'AI Act rappresenti un primo passo significativo verso una regolamentazione globale dell'IA, con l'Europa che si posiziona come pioniere nella definizione degli standard.
Durante i due anni di negoziato, la tecnologia AI e le principali preoccupazioni ad essa correlate sono cambiate drasticamente. Da una parte, si è passati dalla preoccupazione per algoritmi opachi nella selezione del lavoro o nell'assegnazione di benefici sociali, a casi concreti di danno causato dall'IA, come famiglie separate dai loro bambini a causa di decisioni algoritmiche nei Paesi Bassi. Dall'altra, il rilascio di ChatGPT da parte di OpenAI ha spostato il dibattito, suscitando allarme tra alcuni esperti di AI che hanno paragonato l'AI a armi nucleari. Questo dibattito si è riflesso nelle negoziazioni dell'AI Act a Bruxelles, dove si è discusso se regolare i modelli fondamentali come quello dietro ChatGPT o concentrarsi sulle aziende che li utilizzano per creare nuove applicazioni alimentate dall'AI.
In conclusione, l'AI Act segna un punto di svolta nella regolamentazione dell'intelligenza artificiale, ma ci vorranno ancora anni per determinare il suo successo nel contenere gli aspetti negativi dell'ultima esportazione della Silicon Valley.
5 previsioni per il 2024
Diffusione dei Video Generati dall'AI: Nel 2024, è previsto un aumento significativo nell'uso della Generative AI per creare video realistici e personalizzati. Questa tecnologia troverà applicazioni in diversi settori, inclusi l'intrattenimento, il marketing e l'istruzione, permettendo la creazione di contenuti visivi su misura e ad alto impatto con costi e tempi ridotti.
L’evoluzione in questo settore sta andando veloce Meta è tra le big tech che pare avere più assi nella manica e più tavoli su cui poterli giocare, aspettatevi ad esempio di vedere cloni AI delle Celebrities spuntare come funghi nei prossimi mesi. Probabilmente assisteremo a interi trailer, video musicali o corti generati con strumenti AI, come RunwayML o Pika due tra i Tool più avanzati del mercato.Con le elezioni americane alle porte aspettatevi anche il diffondersi di deep fake e querelle tra le star di Hollywood e le loro contraffazioni digitali.
Integrazione nell'Educazione e Formazione: La Generative AI sarà sempre più adottata nel settore dell'istruzione per creare materiali didattici personalizzati, come libri di testo interattivi e simulazioni. Questo consentirà una maggiore personalizzazione del percorso formativo degli studenti, adattandosi ai loro stili e ritmi di apprendimento.
Sviluppo di Assistenza Virtuale Avanzata: Gli assistenti virtuali alimentati da Generative AI diventeranno più sofisticati, offrendo esperienze più naturali e interattive. Questi assistenti potranno gestire compiti più complessi, comprendere meglio le sfumature del linguaggio umano e offrire risposte più pertinenti e personalizzate.
Progressi nell'Arte e nella Creatività: La Generative AI influenzerà profondamente il mondo dell'arte e della creatività, consentendo agli artisti di esplorare nuovi confini espressivi. La collaborazione tra intelligenza artificiale e creatività umana darà vita a opere d'arte uniche e a nuovi stili artistici, spingendo i limiti dell'innovazione creativa.
Etica e Regolamentazione: Con l'evolversi della Generative AI, ci sarà un aumento nella discussione e nell'implementazione di linee guida etiche e regolamentari. Questo per garantire l'uso responsabile della tecnologia, soprattutto in termini di privacy, diritti d'autore, e impatto sociale. Le normative potrebbero includere standard per la trasparenza, il consenso per l'utilizzo dei dati e misure per prevenire abusi e discriminazioni.
Kilobyte: il meglio in breve di link, tool e news sull’Innovazione ed il Digitale
Le 5 Notizie più Interessanti di Questa Settimana per la Digital Innovation e la Generative AI:
Mistral, start-up francese di I.A., è valutata 2 miliardi di dollari nel round di finanziamento
Google ha perso il processo contro Epic Games: il processo potrebbe avere conseguenze anche per altre aziende
Meta ha rilasciato anche una prima demo di Audiobox il suo generatore di musica
5 Tool Interessanti:
5 Link Interessanti sull'AI Generativa:
Digital Innovation Meme
Avete seguito la soap sul conflitto tra Sam Altman e OpenAI?
No? Qui su Wired trovate il riassunto in breve!
Al prossimo numero, nel frattempo scopri cosa puoi fare:
Ci sentiamo presto la newsletter ha cadenza settimanale (salvo imprevisti), nel frattempo puoi: