Bard di Google arriva in 180 Paesi, e sfida l’AI di Microsoft

Lo ha annunciato Sundar Pichai, ceo di Google e Alphabet, durante il Google I/O 2023, l’annuale conferenza degli sviluppatori. Bard, lo strumento di Intelligenza artificiale di Google, presto sarà disponibile gratuitamente in 180 Paesi, all’inizio solo in inglese, giapponese e coreano, e successivamente nelle 40 principali lingue del mondo. Del resto, Pichai ha dichiarato di voler “rendere l’Intelligenza artificiale uno strumento utile per tutti”. Di fatto, continua la sua competizione con Microsoft nella sfida dell’AI. Tra le novità, ora gli utenti potranno esportare le risposte ottenute da Bard su Gmail e Google Docs, e proprio come farà Microsoft, anche il chatbot di Google fornirà risposte multimodali, ovvero non risponderà solo con un testo, ma anche con immagini.

Dal chatbot all’editor la rivoluzione è nelle foto 

Il chatbot di Google funziona in due modi: da un lato incorporerà immagini nelle risposte, e dall’altro saranno gli utenti stessi a poter porre a Bard domande con foto. Ma anche Magic Editor, il nuovo editor di Google è alimentato dall’AI, e trasforma le immagini senza strumenti professionali.
Un esempio mostrato al Google I/O 2023 è quello di una foto con una persona davanti a una cascata: Magic Editor permette di spostare il soggetto, cancellare la tracolla di una borsa e rendere il cielo meno nuvoloso. Un altro esempio? Magic Editor è in grado di spostare l’immagine di un bambino seduto su una panchina, generando una ‘nuova’ parte della panchina e i palloncini tenuti in mano dal bambino. Alcuni telefoni Pixel avranno accesso anticipato a Magic Editor entro la fine dell’anno.

PaLM 2, il modello linguistico si aggiorna e diventa più intelligente

Un’altra novità è PaLM 2, il nuovo modello linguistico (LLM) di Google alla base di Bard e di 25 prodotti dell’azienda. PaLM 2 include più di 100 lingue, ed è stato addestrato su 20 linguaggi di programmazione. Non solo è in grado di eseguire traduzioni letterali, ma anche di comprendere e tradurre modi di dire, poesie e indovinelli. L’aggiornamento migliorerà le capacità matematiche, logiche e di ragionamento, nonché di programmazione, di Bard. L’ampio set di dati di PaLM 2 include articoli scientifici e pagine Web contenenti espressioni matematiche. Il ramo sanitario di PaLM 2, Med-PaLM 2, raggiunge risultati all’avanguardia nella competenza medica, e può rispondere a domande sulla medicina a un livello pari a quello di un medico esperto.

Con Live View e Immersive View Maps supera il concetto di navigatore

Ora Maps reinventa il modo di muoversi. Con le funzionalità di ricerca di Live View e Immersive View supera il concetto di navigatore e rende l’esperienza più visiva, riporta Agi.  Immersive View utilizza la computer vision e l’AI per fondere insieme miliardi di Street View e immagini aeree creando il più ricco modello digitale del mondo. Sarà possibile ottenere indicazioni stradali visualizzando in anteprima piste ciclabili, marciapiedi, incroci e parcheggi lungo il percorso.
Un’altra novità riguarda Duet AI for Workspace, che ora integra la potenza dell’AI generativa in tutte le app di Workspace. Ad esempio, l’integrazione di Duet AI in Presentazioni renderà possibile generare facilmente immagini con poche parole di input.