Gli sviluppatori di intelligenza artificiale cercano da tempo di penetrare nel cuore del PDA, offrendo un servizio intelligente, con cui è facile interagire e sempre disponibile. Gemini Live, annunciato alla conferenza Made by Google all’inizio di questa settimana, è un nuovo tentativo di Google di fare proprio questo, quindi ho concesso a questa IA un periodo di prova di 24 ore per vedere quanto si avvicinava all’essere effettivamente utile.
Anche se non sono abituato a chattare direttamente con gli assistenti IA, oltre a chiedere loro di impostare i timer mentre cucino, volevo vedere quale fosse il vantaggio di avere una conversazione aperta con un assistente come Gemini. Dopo questa giornata di test, sono almeno fiducioso nell’utilità di parlare con l’IA in questo modo, anche se al momento ho meno fiducia in alcune delle risposte che fornisce.
Anche se i miei esperimenti con Gemini Live erano ben lungi dall’essere un test formale delle sue capacità, l’ampiezza delle domande che gli ho posto ci ha dato un’idea chiara di cosa era bravo e di cosa non era bravo. Quindi sono fiducioso nella mia valutazione che Gemini Live sarà una buona aggiunta al pacchetto Gemini e forse una ragione sufficiente per convincere alcuni utenti gratuiti a convertirsi in utenti a pagamento di Gemini Advanced per $ 20 al mese. Anche se il programma non ha ancora raggiunto tutti i suoi obiettivi.
Giovedì pomeriggio – preparazione
Gemini Live fa parte dell’abbonamento Gemini Advanced, ma mentre è in fase di lancio mentre scrivo questo articolo, non è ancora disponibile per tutti gli utenti. Fortunatamente, avevo un Google Pixel 9 Pro XL per provarlo. Se vuoi saperne di più sul telefono, puoi dare un’occhiata alla nostra recensione pratica di Google Pixel 9 Pro e Pro XL, dove ci concentreremo esclusivamente su Gemini Live qui.
Un altro problema è che al momento devi impostare la lingua del tuo Gemelli sull’inglese americano per usarla. Fortunatamente, anche dopo averlo fatto, sono riuscito comunque a selezionare una voce britannica per chattare con Gemini, chiamata “Capella”, tra le dieci offerte. Sembrano tutti del tutto normali, solo con diversi livelli di entusiasmo e tono di voce. Anche quando inizi a fare domande, è raro che ti venga commesso un errore o una frase formulata in modo imbarazzante.
Giovedì sera – ritorno a casa
Dopo aver impostato tutto, la mia prima grande interazione con Gemini Chat è stata chiedergli indicazioni per tornare a casa. Gemini Live inizialmente non mi ha detto cosa ha trovato una volta che gli ho detto il metodo di trasporto prescelto e ho confermato le fermate tra cui volevo passare. Dopo una lunga attesa gli ho chiesto di raccontarmi effettivamente cosa aveva trovato e di descrivermi il percorso.
Probabilmente sarei tornato a casa per la stessa strada. Tuttavia, il viaggio non sarebbe stato affatto tranquillo. Gemini identificò erroneamente una linea ferroviaria e una stazione, trascurò di notare che uno dei cambiamenti apportati richiedeva tecnicamente il collegamento tra due stazioni, e poi sembrò aver inventato un treno dal nulla. Il che è abbastanza strano perché Gemini ha affermato di aver controllato il sito web di TfL per le sue informazioni.
Questo è un problema con il modello AI di base e non con Gemini Live, ma la presenza di una voce che suona come quella di un’autorità (con un accento britannico nientemeno) suggerisce che il percorso potrebbe portare qualcuno con meno familiarità con i trasporti pubblici di Londra a ottenere perduto. Sembra che sia meglio attenersi a Google Maps per questo genere di cose.
Venerdì mattina – conferenza stampa
Il giorno dopo, ho chiesto al Grillo di aggiornarmi sulle ultime notizie della giornata mentre mi preparavo per andare al lavoro. Con semplici gesti ha saputo raccontarmi molto sui mutevoli presentatori di Good Morning Britain e This Morning, oltre a un breve accenno al recente accoltellamento di Leicester Square. Ma quando gli ho chiesto di aggiornarmi sulla tecnologia, le cose sono diventate ancora più strane.
Inizialmente Google Gemini mi aveva detto che Microsoft aveva annunciato il Surface Duo 3, un dispositivo che non è stato confermato e che infatti da mesi si vociferava della sua cancellazione. La PS5 Slim è reale, ma è uscita lo scorso autunno e possiamo supporre che si riferisca all’interruzione di Crowdstrike del mese scorso con il suo recente commento
Ho quindi chiesto a Gemini Live di concentrarsi sulle voci sull’iPhone, ma inizialmente le sue risposte riguardavano tutte la gamma iPhone 15 attualmente disponibile. Dopo ulteriori sollecitazioni, ha descritto alcune voci sulla fotocamera dell’iPhone 16, ma non in modo molto dettagliato.
Venerdì a metà mattina – Guida alla produzione della birra
Dopo alcune ore di lavoro, era giunto il momento di fare una pausa caffè, quindi ho provato a chiedere a Gemini Live di guidarmi nella preparazione di un caffè V60.
Speravo in istruzioni dettagliate da parte dell’intelligenza artificiale, ma il problema qui è che è necessario richiedere o interrompere costantemente Gemini Live per costringerlo a fornire le risposte come passaggi. Tuttavia, è stato in grado di interrompere la conversazione e fornire risposte che sembravano convincenti anche se la trascrizione mostrava che inizialmente non aveva ascoltato i miei suggerimenti.
L’app Gemini Live era un miscuglio di informazioni. Ha dato alcuni consigli adatti agli appassionati, come quello di filtrare l’acqua prima di farla bollire. Nonostante la sua semplicità, la ricetta complessiva ha prodotto una tazza bevibile. Ma l’app Gemini Live mi ha anche suggerito il peso del caffè in cucchiai di chicchi anziché in grammi o once, che non è una misura tipica quando si prepara il caffè. Ma grazie ad ulteriori indicazioni, sono riuscito a ottenere la quantità in grammi.
Pranzo del venerdì – Discorsi di combattimento
Dopo averne avuto la possibilità a pranzo, ho fatto una breve chiacchierata con Gemini Live riguardo Street Fighter 6, il gioco a cui sto giocando molto in questo momento. Il sito ha menzionato correttamente il campione Evo 2024 di quest’anno in SF6, così come il suo avversario, ma anche in questo caso non ha fornito molti dettagli iniziali.
Ho spostato la conversazione sui consigli per l’allenatore (tendo a fare troppo affidamento su certe mosse), dove ho ricevuto alcuni suggerimenti su come ripensare il mio approccio alla partita. È più facile a dirsi che a farsi quando il tuo avversario ti lancia palle di fuoco, ma è stato comunque un buon consiglio.
Ho anche provato a ricevere alcuni suggerimenti su dove trovare incontri di persona, ma non ha funzionato. Ho provato a controllare i dettagli sul sito ufficiale, ma ho scoperto che non conteneva nulla al di fuori dei tornei ufficiali di Capcom. Poi ha trovato un gruppo Facebook nelle vicinanze, ma non è riuscita a fornirmi un collegamento per accedervi in seguito nel testo.
Venerdì pomeriggio – Consigli per scrivere
Come compito finale per Gemini, ho deciso di parlare di MATA e no, non stiamo parlando di Llama 3. Gli ho chiesto di aiutarmi a creare l’introduzione a questo particolare articolo.
Avendo incontrato i Gemelli che trascuravano di fornirmi molti dettagli nelle mie risposte precedenti, sono rimasto sorpreso da quanto i Gemelli fossero disposti a suggerire formule specifiche. Quando gli ho chiesto di includere più informazioni o di cambiare il suo punto di vista, ha risposto in modi sensati. Come Google ha sottolineato con orgoglio durante la demo Made by Google, Gemini Live è in grado di gestire le interruzioni e modificare le sue risposte al volo.
Questa è stata la migliore sensazione che abbia mai provato su Gemini Live, dove ripetere un pensiero ad alta voce sembra del tutto naturale, anche quando parli con un’onda luminosa al telefono. Alla fine, ho scritto l’introduzione a questo articolo da zero. Ma forse puoi vedere gli echi del suo suggerimento finale se scorri verso l’alto per confrontarlo con quello che mi ha dato.
Google Gemini Live: considerazioni finali
Da questo articolo potresti supporre che non apprezzo Gemini Live, ma non è del tutto vero. La mia critica peggiore è rivolta al modello Gemini Advanced utilizzato, poiché sembrava fraintendere ciò che cercava in molti scenari di test. Stranamente, il recente scontro tra Gemini e Gemini Advanced che abbiamo avuto ha dimostrato che forse sarebbe stato meglio restare fedele al programma Gemini di base.
Nel frattempo, la stessa app Gemini Live era impressionante. E poter avere una conversazione continua con un chatbot, a patto che tu sia disposto a chiarirla e a interromperla se va fuori strada, sembra un modo molto migliore di interagire rispetto a testo o immagini. Puoi porre domande di follow-up ai normali assistenti digitali, ma non è ancora così semplice come ha dimostrato Gemini Live. Questa facilità è ciò che lo rende pratico, aiutandoti a rispondere alle domande e a fornire istruzioni non solo a mani libere, ma anche senza occhi, permettendoti di concentrarti su qualcos’altro mentre tu e il chatbot parlate.
Ma rimane ancora la grande domanda su come questo si confronti con l’imminente ChatGPT Voice, soprattutto perché Gemini Live si affida all’interpretazione del parlato come testo prima di fornire la sua risposta mentre ChatGPT Voice può elaborare direttamente il parlato. Ma anche con i soliti avvertimenti sull’intelligenza artificiale, sembra che Google sia sulla strada giusta per perseguire il sogno del PDA.
Altro dalla guida di Tom
“Pluripremiato specialista televisivo. Appassionato di zombi. Impossibile scrivere con i guantoni da boxe. Pioniere di Bacon.”