Les assistants vocaux sont-ils sur le point de devenir enfin utiles ?
Paul Grieselhuber
Le potentiel des assistants vocaux tels que Siri, Alexa et Google Assistant, longtemps surestimé, pourrait enfin se concrétiser en 2025, grâce aux progrès réalisés dans le domaine des agents d'intelligence artificielle. Baptisée "ère agentique" par Sundar Pichai, PDG d'Alphabet, cette nouvelle phase de la technologie vise à transformer les assistants vocaux en outils véritablement utiles, capables d'accomplir des tâches de manière autonome, ce qu'ils ont eu du mal à faire depuis leur création.
Initialement conçus comme des assistants personnels capables de gérer les tâches quotidiennes, les assistants vocaux n'ont jamais été à la hauteur, se limitant à des fonctions de base telles que le réglage de minuteries ou la commande d'éclairages intelligents. L'écart entre les capacités promises et l'utilité réelle a conduit de nombreux utilisateurs à les considérer comme des nouveautés plutôt que comme des outils essentiels. Toutefois, l'essor de l'IA générative est en train de modifier cette vision des choses, en donnant naissance à des agents intelligents capables de prendre des mesures concrètes au nom des utilisateurs.
Contrairement aux assistants vocaux traditionnels qui fournissent des informations en réponse à des requêtes, ces nouveaux agents d'IA sont conçus pour prendre des mesures telles que la réservation de réunions, l'organisation de voyages ou l'exécution d'achats en ligne. Ils visent à fonctionner comme des assistants numériques au sens propre du terme, c'est-à-dire qu'ils ne se contentent pas de fournir des réponses, mais qu'ils exécutent des tâches de manière transparente.
Les géants de la technologie se sont déjà lancés dans la course pour prendre la tête de cette évolution. Le modèle Gemini AI de Google, le partenariat d'Amazon avec Anthropic et l'intégration de ChatGPT dans Siri par Apple démontrent que les grands acteurs misent sur les agents AI pour redéfinir le paysage des assistants vocaux. Ces avancées sont soutenues par des investissements massifs, tels que la participation de 8 milliards de dollars d'Amazon dans Anthropic, qui visent tous à créer des assistants plus intelligents et plus proactifs.
Le potentiel s'étend au-delà des applications grand public. Les agents d'IA pourraient transformer des secteurs tels que le service à la clientèle, le développement de logiciels et la logistique, où l'automatisation des tâches pourrait considérablement améliorer l'efficacité. Des startups comme LangChain, CrewAI et Play.ai entrent en lice et rivalisent pour offrir les plateformes d'agents les plus avancées.
Cependant, certains experts restent sceptiques. Kanjun Qiu, fondateur d'Imbue, affirme que même avec des capacités d'IA plus avancées, la confiance reste un obstacle important. Les gens hésitent encore à déléguer des tâches importantes à des outils d'IA, craignant qu'ils ne se trompent. Pour l'instant, de nombreux utilisateurs réservent les assistants vocaux à des tâches triviales, préférant s'occuper eux-mêmes d'actions plus critiques.
Un domaine dans lequel les agents d'IA sont indéniablement prometteurs est la technologie vocale elle-même. Contrairement aux modèles de langage étendu basés sur le texte, les modèles vocaux sont formés à partir de la parole réelle, ce qui leur permet de saisir des nuances telles que le ton et l'émotion. Des entreprises comme Play.ai et ElevenLabs repoussent les limites dans ce domaine, en rendant les interactions plus humaines et plus intuitives.
Au-delà des assistants vocaux, les agents d'IA trouvent également leur place dans les innovations matérielles. Le projet Astra de Google, par exemple, comprend des prototypes de lunettes intelligentes qui intègrent des agents d'IA. Ces lunettes peuvent afficher des informations pertinentes en temps réel, par exemple le code d'une porte à partir de votre courrier électronique lorsque vous regardez un clavier, ce qui démontre l'utilité pratique des outils d'IA pilotés par la voix. De même, les lunettes Orion de Facebook combinent le contrôle vocal et gestuel pour améliorer les interactions avec l'utilisateur.
Les outils d'IA basés sur la voix deviennent également l'interface préférée des jeunes générations, des études montrant que 42 % des 18-29 ans aux États-Unis utilisent régulièrement des messages vocaux dans leurs applications de chat. Cette évolution indique que les interactions vocales pourraient devenir l'interface par défaut pour les générations futures, faisant des assistants vocaux pilotés par l'IA un élément essentiel de la vie numérique.
Du point de vue de Rendr, ces avancées dans le domaine des agents vocaux et de l'IA représentent un changement important dans la manière dont les gens interagissent avec la technologie. En tant qu'agence ayant pleinement adopté l'IA au cours de l'année écoulée, Rendr a déjà constaté de première main comment les outils intelligents peuvent révolutionner software development et e-commerce les flux de travail. Les agents vocaux pourraient encore améliorer l'accessibilité et la productivité, en permettant aux utilisateurs d'obtenir davantage en formulant simplement leurs demandes.
Remerciements
Inspiré par l'article de Richard Nieva publié dans Forbes le 2 janvier 2025, "AI agents could finally make Siri and Alexa truly useful".