Lors de l’événement Goldman Sachs Communacopia + Technology, les entreprises Zoom et Twilio ont annoncé des avancées significatives dans l’amélioration de la technologie des assistants vocaux. Ces améliorations visent à rendre les communications plus rapides et naturelles, levant ainsi les obstacles à l’adoption de l’IA vocale.
Les CEO de ces deux entreprises, Eric Yuan de Zoom et Khozema Shipchandler de Twilio, ont souligné que l’évolution récente de l’intelligence artificielle permet aux assistants vocaux de conduire des échanges plus fluides. Selon Shipchandler, les utilisateurs commencent même à préfèrer converser avec des agents virtuels dans des contextes tels que la santé, en raison de la disparition des silences et des malaises souvent rencontrés lors des interactions humaines.
Zoom a présenté son nouvel assistant vocal multilingue, AI Companion, qui promet de supprimer les pauses et de rendre les conversations plus naturelles. Malgré ces avancées enthousiasmantes, des défis subsistent. Par exemple, des chaînes de restauration rapide comme McDonald’s et Taco Bell ont arrêté leurs tests de commandes vocales, car l’IA peine encore à comprendre les différents accents et bruits de fond. Ce constat met en lumière la complexité de la variabilité du langage humain, même au sein d’une même langue.
Cependant, les experts et dirigeants restent optimistes quant au potentiel de la voix pour fluidifier les interactions, même si actuellement, environ 35 % des commandes alimentaires passent encore par téléphone. De plus, la voix est un moyen d’interaction essentiel pour ceux qui ne maîtrisent pas parfaitement l’écriture.
Un autre point essentiel soulevé durant la conférence est la sécurité. Face aux risques potentiels d’usurpation de voix, les entreprises travaillent sur des systèmes de reconnaissance vocale robustes pour authentifier les utilisateurs. Zoom, en particulier, collabore avec des experts en cybersécurité pour garantir que ses solutions sont sécurisées.
En conclusion, l’IA vocale se dirige vers une nouvelle ère de maturité, avec des conversations plus fluides et naturelles à l’horizon. Néanmoins, des défis techniques et de sécurité doivent être résolus avant que cette technologie ne devienne omniprésente.
Pour en savoir plus sur ces développements, vous pouvez consulter l’article complet sur Le Monde Informatique.