Per semplificare tutti i suoi strumenti di intelligenza artificiale, Google utilizzerà d’ora in poi un solo nome: Gemini che avrà versioni gratuite e a pagamento (El Mundo)

Le diverse intelligenze artificiali di Google avranno d’ora in poi un solo nome, Gemini, lo stesso che finora l’azienda utilizzava per il modello di linguaggio “lungo” (il motore che permette alle applicazioni di intelligenza artificiale di comprendere e esprimersi con naturalezza che le rendeva possibili). Si tratta di una decisione simile a quella presa da altre aziende tecnologiche che negli ultimi anni hanno puntato su intelligenze artificiali generative e applicazioni conversazionali. Microsoft, ad esempio, ha anch’essa rilanciato la sua strategia di recente, raggruppando tutte le sue applicazioni sotto il marchio Copilot. Dietro entrambe le decisioni c’è l’intento di semplificare la complessa realtà delle applicazioni di intelligenza artificiale, in cui diverse tecnologie e modelli di linguaggio assumono il controllo in base alle esigenze di ogni compito. Ad esempio, affinché un’intelligenza artificiale generativa crei un disegno a partire da un testo, deve prima comprendere le istruzioni che riceve in linguaggio naturale, per cui necessita di una serie di strumenti specifici. Successivamente ne utilizza altri per creare l’immagine.

Nel corso dell’ultimo anno, l’attenzione dell’industria si è spostata sulle applicazioni multimodali, in grado di fornire risposte in forma scritta, di immagine o addirittura di video o audio. A volte possono anche accettare diversi tipi di media come parte dei comandi ricevuti (ad esempio, una foto che un utente vuole modificare in un modo specifico, con i comandi scritti in linguaggio naturale), cosa che non solo è incredibilmente complessa, ma richiede di saltare tra diversi modelli di linguaggio e motori generativi che fino a poco tempo fa erano associati a strumenti indipendenti, ognuno con il proprio nome. Semplificare tutto questo processo sotto un unico marchio, quindi, ha senso e rafforza la percezione di avere a che fare con una “intelligenza” reale. Il caso di Google è paradigmatico. Bard era nato come un’applicazione conversazionale basata sul modello di linguaggio LaMDA, per poi passare a un modello più complesso ed efficace, PaLM. Questi due modelli potevano solo comprendere e fornire risposte sotto forma di testo. A dicembre Bard è passato al modello più avanzato sviluppato dall’azienda, Gemini, che è multimodale. Per evitare ulteriori confusioni, Google ha deciso di battezzare il prodotto con lo stesso nome della tecnologia che lo rende possibile.

Ma Bard non era l’unica intelligenza artificiale di Google. L’azienda aveva anche Duet, un’intelligenza artificiale progettata per accompagnare le applicazioni di produttività e creatività dell’azienda. D’ora in poi, si chiamerà anche Gemini. Tutto è organizzato sotto lo stesso nome. Non è l’unico vantaggio. Il cambiamento ha anche permesso a Google di riorganizzare l’offerta e di proporre diversi livelli di abbonamento allo strumento. Gemini, quello che prima era conosciuto come Bard, avrà una versione gratuita con funzionalità limitate e una versione a pagamento con accesso a tutte le sue capacità. Cosa significa questo per un utente occasionale di intelligenza artificiale? Probabilmente non si noterà molta differenza. Ma un utente più esperto potrebbe apprezzare la maggiore flessibilità offerta dalle diverse opzioni di abbonamento. In futuro è probabile che vedremo Gemini integrato in un numero crescente di prodotti e servizi Google. Ad esempio, potrebbe essere utilizzato per migliorare la ricerca, le traduzioni e le conversazioni in Google Assistant.