Ora Google con Gemini fa sul serio
Bard diventa Gemini, ma Google con Deepmind va oltre il rebranding, con Gemini 1.5 Ultra lancia la sfida a GPT4 e con il nuovo modello Open Source "Gemma" vuole competere pure con LLaMA e Mistral.
🚀 Bard diventa Gemini: Ora Google fa sul serio
Google ha annunciato il rebranding di Bard, il suo modello di intelligenza artificiale conversazionale, che ora si chiamerà semplicemente Gemini.
Bard era per stessa ammissione di Google un esperimento, ora con Gemini Google apre al pubblico il suo più avanzato modello di linguaggio.
Gemini: la nuova frontiera dei Large Language Model di Google
Google, in collaborazione con Deepmind, ha recentemente alzato il sipario su Gemini, un ecosistema di Large Language Models (LLM) destinato a rivoluzionare il panorama dei modelli linguistici. Gemini include diversi modelli, ognuno specificamente progettato per diverse esigenze di utilizzo, offrendo strumenti sempre più potenti e flessibili.
Gemini Advanced: il livello base
Gemini Advanced: Questa incarnazione più potente del modello standard Gemini è pensata per gestire compiti complessi con accuratezza sbalorditiva. Alla base di Gemini Advanced si trova il modello Ultra 1.0, che gli permette di eccellere in ambiti creativi, di programmazione e di ragionamento logico. È un servizio a pagamento per coloro che cercano l'eccellenza nel campo AI.
I punti di forza di Gemini Advanced
Permette di svolgere compiti complessi come la programmazione, il ragionamento logico e la creazione di contenuti.
Offre conversazioni più lunghe e dettagliate rispetto al modello base.
È disponibile in inglese in più di 150 Paesi e territori (inclusa l'Italia) al costo di 21,99 euro al mese.
Include due mesi di prova gratuita e l'accesso a tutti i vantaggi di Google One Premium.
Gemini Ultra: il next level dell’AI di Google
Gemini Ultra è il modello di intelligenza artificiale più grande e capace di Google. Si tratta di un modello multimodale, in grado di processare e generare testo, immagini, codice e audio in modo integrato.
Le sue caratteristiche principali:
Prestazioni avanzate: Gemini Ultra ha superato gli esperti umani in alcuni test di comprensione del linguaggio e ha raggiunto risultati paragonabili a GPT-4 nei benchmark più complessi.
Capacità multimodali: Gemini Ultra è in grado di analizzare e generare contenuti in diverse modalità, aprendo nuove possibilità per l'interazione uomo-macchina e l'analisi di dati complessi.
Gemini Ultra rappresenta il vertice dell'offerta di Google in termini di LLM. Al momento è sottoposto a rigorosi test, red-teaming e perfezionamento continuo per garantirne affidabilità e sicurezza. Una volta pronti, una selezione di clienti, sviluppatori e partner saranno i primi a testarlo prima di una distribuzione più ampia. Gemini Ultra si pone come servizio a pagamento incluso in un tier dedicato di Google One, promettendo il meglio dell'intelligenza Google anche all'interno dei prodotti Workspace.
📱L'app mobile di Gemini
Gemini Mobile App: Porta la potenza dei modelli AI di Google direttamente sui dispositivi mobile. Attraverso l'app, potremo scrivere testi, farci aiutare nel brainstorming, riassumere contenuti, generare immagini e molto altro. L'app, interagendo attraverso testo, voce e fotocamera, è progettata come strumento polivalente per chi vuole creatività e produttività al proprio fianco, collegandosi anche ad altri servizi Google come Maps e Voli.
Permette di utilizzare Gemini con la voce, il testo o le immagini.
Offre un'esperienza completamente nuova su Android, integrandosi con l'Assistente Google.
Su iOS, è accessibile direttamente dall'app Google.
È disponibile in inglese negli Stati Uniti e sarà distribuita gradualmente in altri Paesi e lingue. (l’Italia dovrà attendere ancora un po’)
🌟 Il Futuro è Adesso con Gemini 1.5 🌟
Gemini 1.5 è un salto generazionale che fa luce sulle prossime innovazioni del modello da parte di Google grazie a un'architettura incredibilmente efficiente e a una finestra contestuale notevolmente ampliata. Si basa sull'architettura Transformer e Mixture of Experts (MoE), per apprendimento ed efficienza superlativi. Gemini 1.5 offre una finestra di 128.000 token, con piani per estenderla a 1 milione. È attualmente in anteprima per sviluppatori e grandi aziende, promettendo velocità e abilità senza precedenti.
Gemini 1.5 non solo porta avanti le capacità del modello, ma introduce anche una caratteristica sperimentale rivoluzionaria: una finestra di contesto estremamente ampia, capace di elaborare fino a 1 milione di token.
🔍 Che cosa significa tutto questo?
Maggiore Efficienza: Con la sua architettura innovativa, Gemini 1.5 è più efficiente da addestrare e utilizzare, promettendo avanzamenti rapidi e sostenibili nello sviluppo di modelli AI.
Finestra di Contesto Ampliata: La capacità di processare enormi quantità di informazioni in una volta sola apre a capacità di analisi e sintesi senza precedenti.
Architettura all'Avanguardia: Basandosi sulla ricerca di punta di Google DeepMind, Gemini 1.5 utilizza una struttura Mixture-of-Experts (MoE) per ottimizzare l'efficienza e l'apprendimento e migliorare la qualità delle risposte.
🛠️ Cosa possono fare gli sviluppatori? Google offre un'anteprima limitata di questa caratteristica sperimentale a sviluppatori e clienti aziendali tramite AI Studio e Vertex AI. Questo rappresenta un'occasione unica per esplorare le nuove capacità di Gemini 1.5 e sperimentare con contesti di informazioni estesi.
🧠 La Finestra di Contesto: Una Rivoluzione nell'IA
Le finestre di contesto sono cruciali perché permettono ai modelli IA di ricordare informazioni durante una sessione, superando le limitazioni precedenti dove i modelli potevano elaborare solo fino a 32.000 token contemporaneamente. Con Gemini 1.5 Pro, il primo modello 1.5 rilasciato per i test preliminari, si raggiunge una capacità di elaborazione senza precedenti di 1 milione di token, ampliando enormemente la quantità di testo, immagini, audio, codice o video che il modello può processare e comprendere. Praticamente l'AI di Google è in grado di assimilare sino a 10 volte testi della lunghezza di guerra e pace o interi film.
Gemini 1.5, frutto del lavoro congiunto di Google e Deepmind, rappresenta un passo avanti significativo nel campo dell'intelligenza artificiale. Questo modello innovativo si basa su una serie di innovazioni scientifiche e ingegneristiche che hanno interessato ogni aspetto dello sviluppo e dell'infrastruttura dei modelli di base di Google. Tra queste innovazioni, l'introduzione della Mixture-of-Experts (MoE), recentemente introdotta anche da Mistral, ha permesso di rendere Gemini 1.5 ancora più efficiente in fase di addestramento e utilizzo.
Il primo modello di Gemini 1.5 rilasciato per i test iniziali è Gemini 1.5 Pro. Si tratta di un modello multimodale di medie dimensioni, ottimizzato per essere scalabile su un'ampia gamma di attività. Le sue prestazioni sono simili a quelle di 1.0 Ultra, il modello più grande di Google fino ad oggi.
Inoltre, Gemini 1.5 Pro introduce una caratteristica sperimentale innovativa: la comprensione di contesti lunghi. Come dicevamo la versione standard di Gemini 1.5 Pro ha una finestra di contesto di 128.000 token. Tuttavia, a partire da oggi, un gruppo limitato di sviluppatori e clienti aziendali può provare una versione con una finestra di contesto di fino a 1 milione di token tramite AI Studio e Vertex AI in anteprima privata.
Mentre Google implementa la finestra di contesto completa da 1 milione di token, sta lavorando attivamente a ottimizzazioni per migliorare la latenza, ridurre i requisiti di calcolo e migliorare l'esperienza utente. L'azienda è entusiasta di vedere le persone provare questa funzionalità innovativa e fornirà ulteriori dettagli sulla sua futura disponibilità di seguito.
Questi continui progressi nei modelli di prossima generazione di Google e Deepmind apriranno nuove possibilità per persone, sviluppatori e aziende di creare, scoprire e costruire utilizzando l'intelligenza artificiale.
💡🌐 Implicazioni e Futuro
Questo notevole salto in avanti è il risultato di una serie di innovazioni nell'apprendimento profondo. "C'è stata una scoperta che ha portato a un'altra e un'altra ancora, e ciascuna di esse ha aperto nuove possibilità", spiega Denis Teplyashin, Ingegnere presso Google DeepMind. Queste innovazioni hanno permesso di passare da 128.000 token a 1 milione e, recentemente, fino a 10 milioni di token nella ricerca interna.
Le nuove capacità di Gemini 1.5 Pro aprono strade inesplorate per interagire con il modello: può ora riassumere documenti di migliaia di pagine o analizzare decine di migliaia di linee di codice in una volta sola. In un test, il modello ha addirittura generato documentazione per un intero codice sorgente e risposto con precisione a domande su un film del 1924 dopo aver "visto" l'intero lungometraggio.
Gemini 1.5 Pro non è solo un passo avanti tecnologico; rappresenta anche un nuovo orizzonte di possibilità creative e di apprendimento. Il modello, per esempio, ha dimostrato di poter apprendere a tradurre in lingue estremamente rare, come il Kalamang, una lingua di un'isola del sud est asiatico, con un livello di competenza paragonabile a quello di un umano che studia dallo stesso materiale. E' bastato infatti fornire a Gemini un dizionario Kalamang- Inglese per fargli imparare una lingua che attualmente non ha più di 200 parlanti al mondo.
Sebbene la finestra di contesto da 1 milione di token rappresenti una sfida computazionale che richiede ulteriori ottimizzazioni, il team di Google DeepMind è già proiettato verso il futuro, lavorando per rendere il modello ancora più veloce ed efficiente, con la sicurezza sempre al centro delle loro preoccupazioni.
L'entusiasmo del team è palpabile, e la comunità di sviluppatori e il pubblico più ampio sono invitati a esplorare e sfruttare queste nuove capacità. "Quando ho visto per la prima volta che avevamo un milione di token in contesto, la mia prima domanda è stata: 'Ma come lo usi?' Ora credo che l'immaginazione delle persone si espanderà, trovando modi sempre più creativi per utilizzare queste nuove capacità", conclude Machel Reid, ricercatore presso Google DeepMind.
Gemma la versione Open Source di Gemini
Gemma: il Modello Open Source di Google pare essere decisamente superiore a LLama 2 secondo vari benchmark
Google sta rivoluzionando ancora una volta il campo dell'Intelligenza Artificiale con l'introduzione di Gemma, una serie di modelli aperti all'avanguardia pensati per assistere sviluppatori e ricercatori nel costruire IA in modo responsabile. Ispirati ai modelli Gemini e sviluppati da Google DeepMind e altri team di Google, Gemma riflette l'impegno dell'azienda nel contribuire alla comunità aperta con tecnologie innovative come TensorFlow e BERT. Con Gemma, Google offre due versioni del modello, Gemma 2B e Gemma 7B, entrambi disponibili in varianti pre-addestrate e istruzione-tunate, oltre a un kit di strumenti dedicato all'IA generativa responsabile per garantire applicazioni AI più sicure.
Google non solo mette a disposizione gli strumenti per personalizzare questi modelli alle specifiche esigenze di apprendimento, ma assicura anche un'ottimizzazione su più piattaforme hardware, rendendo Gemma compatibile con un'ampia gamma di dispositivi e integrabile con le principali tecnologie e strumenti di sviluppo. Inoltre, l'azienda enfatizza il suo impegno verso un utilizzo etico e responsabile dell'IA, dotando i modelli Gemma di meccanismi di sicurezza avanzati e offrendo agli sviluppatori risorse per ridurre i rischi associati al loro impiego.
Per agevolare la ricerca e lo sviluppo in questo campo, Google offre crediti gratuiti su Kaggle, Colab e Google Cloud, incentivando la comunità globale di sviluppatori e ricercatori a esplorare le potenzialità di Gemma. Questa iniziativa non solo apre nuove frontiere nell'applicazione dell'IA ma dimostra anche l'impegno di Google nel promuovere un'avanzata tecnologica inclusiva e accessibile a tutti.
Gemini su Iphone con IOS 18
Dopo 15 anni di competizione serrata con un colpo di scena Apple ha stretto un'alleanza con Google per portare il modello di linguaggio avanzato di quest'ultimo, Gemini, sugli iPhone con l'imminente lancio di iOS 18. È Bloomberg a lanciare la bomba: Cupertino cerca di colmare il divario nell'IA generativa, puntando alle competenze già affermate di Google. Si parla di un'integrazione che va oltre la semplice assistenza quotidiana, spingendo Gemini a gestire operazioni complesse basate sul cloud, come la creazione di immagini realistiche o testi articolati, simile a quello che offrono ChatGPT e Dall-E di OpenAI o Copilot di Microsoft.
Mentre Apple lavora su progetti propri nell'IA, come il misterioso Ferret o le AI generative Ajax e Apple GPT, l'accordo con Google rappresenta una mossa strategica per non restare indietro nella corsa all'innovazione, soprattutto pare una mossa in funzione anti Microsoft. Google, da parte sua, ha recentemente aggiornato Gemini, ampliandone le capacità a comprendere audio, video e testi più complessi, nonostante le critiche per una tendenza a risultati troppo politicamente corretti e controversie legate alle immagini generate. Insomma se pure un competitor come Apple punta su Gemini qualcosa vorrà dire a livello di potenzialità future.
Cosa aspettarsi da Gemini nell’ecosistema Google
Nel video potete vedere come Gemini possa attingere ai contenuti di YouTube per fornire risposte ancora più pertinenti e aggiornate.
L'evoluzione di Gemini sarà continua: Google sta attivamente integrandolo in prodotti come Ricerca, Ads, Chrome e Workspace migliorando l'esperienza di ricerca con risposte più veloci e migliori, e già tramite l'API Gemini è accessibile a chi sviluppa nei contesti di Google AI Studio o Google Cloud Vertex AI. Persino in Android 14, a partire dai prossimi Pixel 8 Pro, Gemini Nano fornirà assistenza grazie ad AICore.
Nuove funzionalità in arrivo:
Funzionalità multimodali ampliate: Google continuerà a sviluppare le capacità multimodali di Gemini Ultra, per renderlo ancora più versatile e potente.
Funzioni di coding più interattive: Gemini Ultra sarà in grado di collaborare con gli sviluppatori in modo più efficace, aiutandoli a scrivere e testare il codice.
Capacità di analisi dei dati più profonde: Gemini Ultra sarà in grado di estrarre informazioni più complesse dai dati, per aiutare le aziende a prendere decisioni migliori.
Gemini di Google si dimostra un ecosistema di modelli AI flessibili, adatti dalle app mobile a compiti altamente specializzati. L'integrazione costante in prodotti e servizi Google, e il continuo sviluppo, fanno di Gemini una realtà che cambierà il nostro modo di rapportarci all'intelligenza artificiale, vedremo se sarà abbastanza per sfidare ChatGPT e Microsoft Copilot.
Gli annunci di Google
Bard diventa Gemini: ecco Ultra 1.0 e una nuova app mobile: https://blog.google/intl/it-it/prodotti/bard-diventa-gemini-provate-oggi-ultra-10-e-una-nuova-app-mobile/
L’app di Gemini: https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en&gl=US
Vertex AI: https://cloud.google.com/vertex-ai/generative-ai/docs/start/quickstarts/quickstart-multimodal
Gemma il modello Open Source: https://blog.google/technology/developers/gemma-open-models/
Gemini in Workspace: https://blog.google/products/google-one/google-one-gemini-ai-gmail-docs-sheets/
Kilobyte: il meglio in breve di link, tool e news sull’Innovazione ed il Digitale
Notizie più Interessanti di Questa Settimana per la Digital Innovation e la Generative AI:
L’annuncio di NVIDIA che rivoluziona il mondo della robotica
Elon Musk ha aperto a tutti il suo sistema di intelligenza artificiale
L’Italia investirà un miliardo per creare un campione italiano sull’intelligenza artificiale
Il Parlamento europeo approva la legge sull'intelligenza artificiale
500 italiani che contano nel mondo dell’intelligenza artificiale
Tool Interessanti:
5 GPT da provare
Book Creator Guide per creare il proprio libro
SQL Expert per ricevere aiuto con i database SQL
Content Creation Bot per creare contenuti
Networking Navigator per Linkedin
CTO Cofounder per sviluppare soluzioni digitali in una startup
Digital Innovation Meme
Secondo metà dei ricercatori sull’AI, l’AGI avrebbe il 10 % di possibilità di causare la nostra estinzione, non male no?
Al prossimo numero, nel frattempo scopri cosa puoi fare:
A presto, nel frattempo puoi:
🌐 Entrare in Beyond: il gruppo Telegram dedicato alla Digital Innovation
📲 Iscriverti al mio canale Telegram dove condivido articoli, link e tool utili