Assistants vocaux : comment fonctionnent-ils ?

Alexa, Ok Google, dis Siri…ces quelques phrases sont vite rentrées dans le langage courant à défaut d’être devenu des habitudes chez tous les consommateurs. En effet, les assistants vocaux, bien que déployés à vitesse grand V, restent encore mystérieux pour une grande partie de la population.

Qu’est-ce qu’un assistant vocal ?

Un assistant vocal, c’est un assistant personnel qui répond à la voix à tous les requêtes que vous pouvez faire. C’est la même utilité que d’aller sur Google faire une recherche, sauf que vous la faite simplement à l’oral. L’assistant vocal se présente sous deux formes. Il y a tout d’abord ces enceintes connectées comme la Google Home, Amazon Echo pour ne citer que les plus répandues dans le commerce. Ce sont des enceintes, au demeurant de bonne qualité sur le plan de la restitution sonore, qui écoutent vos ordres à partir du moment où est énoncé une phrase de référence, comme Ok Google.

L’enceinte active alors son système de reconnaissance vocale afin d’enregistrer votre question, de l’envoyer sur les serveurs de Google pour y trouver la réponse, qui vous est restituée oralement sur cette même enceinte. Dans la pratique, une grande majorité des consommateurs est équipée de ces assistants personnels puisque les smartphones fonctionnant sous Android comme ceux d’Apple ont accès au même service d’assistant vocal depuis simplement le smartphone. L’assistant vocal n’est pas la finalité, c’est ce qu’il permet de faire qui est particulièrement intéressant.

A votre bureau, il rend vos interactions avec votre environnement beaucoup plus souple. Envie d’écouter de la musique en streaming, ou par bluetooth, il suffit de lui demander. Besoin de faire une recherche internet en même temps que vous rédigez un document, il suffit de poser la question à haute voix. Et les possibilités d’usage d’assistant de génération récente ou un peu plus vieille n’a pas de limite.

Avec un assistant vocal, boostez la puissance de votre téléphone portable.

Des technologies de pointe

Tous les grands acteurs du big data comme Google et Amazon se sont lancés à corps perdu dans le monde de l’enceinte connectée et ce n’est pas un hasard. En effet, le fonctionnement de ces enceintes connectées est un vrai défi technologique. Si l’écoute d’une personne n’a rien de sorcier avec les microphones, le fait de synthétiser la voix pour comprendre la requête est un exploit dont on ne saisit que peu la portée. Utilisable dans de nombreuses langues, et sans se heurter à la vitesse de diction ou l’accent régional, l’enceinte reconnaît à coup sûr la demande faîte.

On discute de façon naturelle et spontanée avec l’assistant Google dont la voix pour la réponse est elle aussi assez naturelle. Suite à cette compréhension de la voix humaine, le reste est plus classique avec une demande envoyée sur internet aux serveurs des géants du numérique, puis renvoyée à l’utilisateur final par le haut-parleur. L’enceinte répond en écho à votre question sans temps mort, permettant une conversation assez spontanée ou répond par le lancement d’applications vocales. Si le sujet des assistants vocaux vous intéresse, je ne saurai que trop vous conseiller de prendre vos places pour le salon Voice Tech Paris.

L’élément de contextualisation

Les assistants à commandes vocales n’ont d’intérêt que si on peut leur parler naturellement, et pas seulement pour leur demander la météo. La domotique, ou smart home, est un très bon exemple de la contextualisation de ces enceintes connectées. Il suffit de demander, à haute voix, d’ouvrir les volets pour que l’ouverture se fasse.

Même chose pour allumer l’ampoule Hue Philips que l’on contrôle de la voix, des volets roulants que l’on ouvre sans avoir à se déplacer, et de bien d’autres éléments compatibles. C’est ainsi toute la maison qui peut être contrôlée très simplement. Au travail, ces assistants vocaux peuvent vous permettre de gagner du temps en vous facilitant les requêtes internet. Lorsque l’on regarde cette nouvelle technologie de l’extérieur, on se dit que c’est un peu gadget ou inutile que de pouvoir piloter sa maison à la voix, de poser des questions à son smartphone ou son enceinte plutôt que de l’écrire sur son téléphone.

En fait, on se rend compte que la technologie de la commande vocale est si performante que tout devient rapidement intuitif. Il ne faut que quelques jours pour inclure ses requêtes orales à Google dans n’importe quelle autre discussion. Le fait de nous libérer les mains rend aussi bien des services.

Amazon, Microsoft, Apple, Samsung, Orange, et bien sûr Google, nombreuses sont les entreprises à se lancer dans ce secteur qui deviendra bientôt la porte d’entrée principale des recherches internet.