Che si tratti di assistenti virtuali, trascrizione o call center, i servizi vocali AI trasformano parole e conversazioni in pezzi di magia aziendale.
Al GTC di questa settimana, NVIDIA ha annunciato nuove aggiunte a Nvidia Rivaun kit di sviluppo software con accelerazione GPU per la creazione e la distribuzione di applicazioni di intelligenza artificiale vocale.
I modelli prefabbricati di Riva sono ora offerti in sette lingue, tra cui francese e hindi. Altre lingue all’orizzonte: arabo, italiano, giapponese, coreano e portoghese. Riva offre anche miglioramenti della precisione per inglese, tedesco, mandarino, russo e spagnolo. Inoltre, aggiunge funzionalità come i punteggi di affidabilità a livello di parola e la pianificazione degli oratori, il processo di identificazione degli oratori nei flussi audio.
Riva è progettato per essere completamente personalizzabile in ogni fase della pipeline dell’IA vocale per aiutare a risolvere in modo efficiente problemi unici. Gli sviluppatori possono anche implementarlo dove vogliono che i loro dati siano: on premise, per cloud multi-ibridi, all’edge o in dispositivi embedded. Le aziende lo utilizzano per migliorare i servizi, l’efficienza e il vantaggio competitivo.
Sebbene la domanda di IA per i servizi vocali sia stata elevata, gli strumenti di sviluppo sono rimasti indietro. Sempre più persone lavorano e imparano da casa, fanno acquisti online e cercano assistenza clienti remota, stressano i call center e spingono le applicazioni vocali al limite. I tempi di attesa del servizio clienti sono triplicati di recente poiché la carenza di personale ha gravemente colpito i call center, Secondo un rapporto di Bloomberg per l’anno 2022.
I progressi nell’intelligenza artificiale del parlato offrono la via da seguire. NVIDIA Riva consente alle aziende di esplorare modelli di deep learning più ampi e di sviluppare sistemi audio più accurati. Le applicazioni di intelligenza artificiale basate su Riva forniscono una corsia preferenziale per servizi migliori e promettono esperienze e coinvolgimento dei clienti migliori.
La domanda di applicazioni di intelligenza artificiale vocale è in crescita
Il mercato globale dei software per contact center era di circa 27 miliardi di dollari nel 2021, un numero che dovrebbe quasi triplicare fino a raggiungere i 79 miliardi di dollari entro il 2029, secondo Fortune Business Insights.
Questo aumento è dovuto ai vantaggi che le applicazioni vocali personalizzate offrono alle aziende di qualsiasi dimensione, in quasi tutti i settori: dalle organizzazioni globali, agli OEM che forniscono sistemi vocali basati sull’intelligenza artificiale e servizi cloud, agli integratori di sistemi e ai fornitori di software indipendenti.
Riva SDK accelera il flusso di lavoro AI
NVIDIA Riva include modelli linguistici pre-addestrati che possono essere utilizzati così come sono o ottimizzati utilizzando Transfer Learning from Kit di strumenti NVIDIA TAO, che consente set di dati personalizzati in un ambiente privo di codice. I moduli Riva per il riconoscimento vocale automatico (ASR) e la sintesi vocale (TTS) possono essere migliorati, esportati e pubblicati come servizi vocali.
L’intelligenza artificiale vocale si sta facendo strada in più tipi di applicazioni che mai, come assistenti virtuali di assistenza clienti e chatbot, sistemi di videoconferenza, ordini di cibo convenienti durante la guida, vendita al dettaglio di telefoni, media e intrattenimento. Le organizzazioni globali hanno adottato Riva per guidare gli sforzi dell’IA vocale, tra cui T-Mobile, Deloitte, HPE, Interactions, 1-800-Flowers.com, Quantiphi e Kore.ai.
- T-Mobile Riva ha certificato T-Mobile Expert Assist, un’app di call center personalizzata che utilizza l’intelligenza artificiale per acquisire le conversazioni dei clienti in tempo reale e consigliare soluzioni, per 17.000 agenti del servizio clienti. T-Mobile prevede di lanciare Riva in tutto il mondo a breve.
- Fondazione Hewlett Packard I server HPE ProLiant dotati di GPU NVIDIA e software NVIDIA Riva offrono un sistema in grado di sviluppare ed eseguire complessi carichi di lavoro di elaborazione vocale e di elaborazione del linguaggio naturale che possono facilmente trasformare la voce in informazioni dettagliate. Sistemi HPE ProLiant e NVIDIA Riva Costituisce una soluzione completa e di prim’ordine per la gestione di servizi finanziari e altre applicazioni del settore.
“Per offrire le capacità di NVIDIA Riva, HPE offre un’architettura di riferimento basata su Kubernetes che si basa sul software HPE Ezmeral”, ha affermato Scott Ramsay, Vice President di HPE GreenLake Solutions presso HPE. “Fornita dalla piattaforma cloud HPE GreenLake, questa piattaforma consente agli sviluppatori di accelerare lo sviluppo e l’implementazione di applicazioni di IA vocale di prossima generazione”.
- Deloitte Supporta i clienti che desiderano implementare casi d’uso ASR e TTS, come i sistemi di ordinazione in alcuni dei più grandi ristoranti di ordini rapidi del mondo. Sta inoltre sviluppando servizi di chatbot per gli operatori sanitari che consentiranno una trascrizione accurata ed efficiente delle domande dei pazienti e dei riepiloghi delle chat.
“I progressi nell’elaborazione del linguaggio naturale consentono di progettare esperienze convenienti che consentono conversazioni significative, semplici e naturali con i clienti”, ha affermato Kristen Ahn, direttrice di Deloitte US. “I nostri clienti sono alla ricerca di un percorso semplificato per l’implementazione dell’IA conversazionale e NVIDIA Riva supporta tale percorso”.
- Interazioni Ha integrato Riva con la sua piattaforma software Curo per creare interazioni continue e personalizzate per i clienti in un’ampia gamma di settori che includono le telecomunicazioni, nonché per aziende come 1-800-Fiori.comche ha implementato un sistema per prendere ordini con intelligenza artificiale.
- core.ai Riva si integra con il call center AI SmartAssist as a Service, che supporta i prodotti BankAssist, HealthAssist, AgentAssist, HR Assist e IT Assist. Proof of Concepts con NVIDIA Riva in corso.
- Quantificare è un partner per la fornitura di soluzioni che sviluppa soluzioni di sottotitoli utilizzando Riva per i clienti nei settori dei media e dell’intrattenimento, incluso Fox News. Sviluppa anche avatar digitali utilizzando Riva per le telecomunicazioni e altri settori.
Condutture vocali complesse di intelligenza artificiale, soluzioni più semplici
Le pipeline vocali AI possono essere complesse e richiedere il coordinamento tra più servizi. I microservizi devono essere eseguiti su larga scala con modelli ASR, comprensione del linguaggio naturale, sintesi vocale e applicazioni specifiche del dominio. Le GPU NVIDIA sono ideali per accelerare questi tipi di attività specializzate.
Riva offre librerie software per la creazione di applicazioni di intelligenza artificiale vocale e include servizi ottimizzati per GPU per ASR e TTS che utilizzano i più recenti modelli di deep learning. Gli sviluppatori possono integrare queste molteplici abilità di intelligenza artificiale nelle loro app.
Gli sviluppatori possono accedere facilmente ai modelli Riva e ai modelli già pronti NVIDIA NGCun hub per software e modelli di intelligenza artificiale ottimizzati per GPU ed esempi di notebook Jupyter.
Il supporto Riva è disponibile tramite NVIDIA AI Enterprise, una suite cloud-native di analisi dei dati e software di intelligenza artificiale ottimizzata per consentire a qualsiasi organizzazione di utilizzare l’intelligenza artificiale. È certificato per l’implementazione ovunque, dal data center aziendale al cloud pubblico, e include il supporto aziendale globale per tenere traccia dei progetti di intelligenza artificiale.
Prova NVIDIA Riva Con laboratori pilota sull’infrastruttura pronta per l’esecuzione in NVIDIA LaunchPad.
“Nerd televisivo. Ninja di Twitter. Evangelista della birra. Difensore di Internet professionista.”