Blog
Blog
Blog
Blog
La Voice UI, la nouvelle forme de reconnaissance vocale

A travers nos articles, notre mission est de vous éclairer autour de nos savoir-faire en web et nos connaissances du digital. Raconter nos métiers nous semble être un bon moyen de partager notre passion avec vous. Que vous soyez novice ou expert du web, que vous soyez web friendly ou webophobe, notre ambition est d'intéresser le plus grand nombre et d'apporter des réponses dans chacun de nos articles.

20 octobre 2022 separateur 575 Vues separateur 9 MIN DE LECTURE
La Voice UI, la nouvelle forme de reconnaissance vocale

Tout ce que vous devez savoir sur la Voice UI

Avez-vous déjà entendu parler de la VUI ? La Voice User Interface, en français interface utilisateur vocale, est une technologie présente partout, peut-être même chez vous grâce aux assistants vocaux comme Siri (Apple), Google Assistant, Alexa (Amazon) ou Cortana (Microsoft). Découvrez dans cet article comment l’utiliser à bon escient.

Qu’est-ce qu’une Voice User Interface ?

Définition de la Voice User Interface

La Voice UI permet une interaction humaine à l’oral avec des ordinateurs, téléphones et autres appareils disposant d’une commande vocale. L’objectif d’une interface d’utilisateur vocale pour ses utilisateurs ? Comprendre les questions et commandes de l’utilisateur et y répondre oralement, autrement dit text-to-speech

Progressivement, les Voice User Interface ont fait surface dans notre quotidien : ordinateurs, téléphones mobiles, voitures, domotique, appareils ménagers mais aussi sur les télécommandes et les télévisions elles-mêmes. De quoi banaliser l’usage de ces technologies de pointe et implanter leur utilisation dans nos habitudes. Ainsi, la VUI représente le moyen principal d’interaction avec les assistants virtuels, et peut être activée sans avoir besoin d’appuyer sur un bouton.

Comment la voice UI fonctionne-t-elle ?

Plusieurs technologies ont été créées afin de répondre aux besoins d’échange entre l’utilisateur et l’appareil. Avant, il fallait appuyer sur des boutons pour commander une machine. Maintenant, avec l’aide de l’intelligence artificielle, la voix suffit.

La captation de la voix

“Quel temps fait-il aujourd’hui à Paris ?” entend la voice UI. C’est la première étape ! En effet, votre voix est captée par la machine avant que celle-ci formule la réponse tant attendue. Votre machine identifie des mots-clés, comme “Ok Google” ou “Dis Siri”, qui seront les déclencheurs de l’échange entre l’interface vocale et vous (utilisateur).

Text-to-Speech (TTS)

Text-to-Speech, ou TTS, désigne en français la synthèse vocale. Il s’agit d’une technologie de synthèse sonore permettant, à partir de n’importe quel texte, de créer de la parole artificielle.

Cette technique informatique s’appuie sur du traitement linguistique afin de transformer le texte orthographique en un message vocal. Le Text-to-Speech consolide votre lien avec votre appareil en créant une conversation entre vous deux.  

La reconnaissance automatique de la parole

Aussi connue sous le sigle RAP, la reconnaissance automatique de la parole analyse la voix humaine, pour que la Voice User Interface puisse faire une transcription textuelle de la commande vocale. Il s’agira donc de vous adressez directement à votre appareil ! 

Il existe 2 types de reconnaissance automatique de la parole : 

➡️ la reconnaissance monolocuteur : concerne une voix individuelle. Les entreprises s’en servent car elle permet d’ajouter le vocabulaire d’un métier dans le dictionnaire du logiciel. 

➡️ la reconnaissance multilocuteur : concerne plusieurs voix. Elle peut être utilisée par plusieurs utilisateurs et s’acclimate aux commandes du quotidien.

L’intelligence artificielle

L’intelligence artificielle, ou IA, vise à améliorer la reconnaissance automatique de la parole et de la synthèse vocale. Les différentes techniques servent aux machines pour imiter l’intelligence humaine. Et par conséquent, les machines agissent comme des humains. 

On retrouve, parmi les branches de l’intelligence artificielle, la compréhension du langage naturel (CLN). Elle aide les serveurs vocaux interactifs et les assistants intelligents à mieux connaître le langage de l’homme. Les requêtes et les questions de la part des utilisateurs ne sont plus restreintes à des formules prédéfinies. Grâce à la CLN, la machine peut répondre à des demandes qu’elle n’aurait pas saisi auparavant. Ceci prouve donc les progrès qui ont été fait dans ce domaine, et n’est qu’un avant-goût de ce qui pourra être possible plus tard.

Utilisation de la Voice User Interface en entreprise

Même si les Voice User Interface sont plus récurrentes sur téléphones mobiles et les enceintes connectées, vous pouvez en tant qu’entreprise adopter l’interface utilisateur vocale. Vous pouvez vous mettre à utiliser cette technologie pour augmenter la promotion de votre image de marque, favoriser la collaboration et améliorer votre expérience utilisateur

On peut se servir de la Voice UI au bureau pour une utilisation interne mais également dans leurs produits, quand cela est possible, pour créer une meilleure expérience utilisateur. Quelle que soit l’utilisation, la reconnaissance vocale vient renforcer la fidélité et l’engagement entre votre utilisateur (ou votre collaborateur) et votre entreprise.

Quelques exemples d’assistants intelligents

Parmi les plateformes de Voice UI, vous retrouverez les assistants vocaux, un logiciel qui accomplit des tâches demandées par son utilisateur. Dans ce cas, les demandes sont effectuées par une commande vocale. 

Vous connaissez forcément des assistants vocaux intelligents ! Voici les plus connus : 

➡️ Siri, développé par Apple et disponible sur tous les appareils de la marque. À partir d’un “Dis Siri”, elle est apte à répondre à plusieurs requêtes et réaliser plusieurs actions comme de la traduction, des calculs, envoyer des messages, passer des appels ou faire des recherches. 

➡️ Google Assistant, développé par Google grâce à une intelligence artificielle. Avec un “Ok Google”, celle-ci lui permet d’effectuer différentes tâches comme répondre à des requêtes comme la météo ou la localisation mais aussi divertir ses utilisateurs avec des blagues et des devinettes. 

➡️ Alexa, développé par Amazon et qui se retrouve sur les enceintes connectées de la marque. Avec un simple “Alexa”, elle se réveille et peut répondre à vos interrogations, lancer votre musique ou même programmer des alarmes.

➡️ Cortana, développé par Microsoft. En activant le mode “Hey Cortana”, vous pouvez bénéficier de ses services. Comme les autres assistants vocaux, elle peut s’occuper de la recherche d’informations ou ouvrir des applications sur votre ordinateur. 

Les avantages de la Voice User Interface

La rapidité

Le fait de parler ou de dicter pour la reconnaissance vocale vous permet d’être plus rapide que d’écrire ou faire la recherche soit même. L’utilisation de la Voice User Interface est motivée par la rapidité d’action et l’aspect intuitif. En tant qu’utilisateurs, nous aimons tous pouvoir faire une recherche, envoyer un message ou réaliser une tâche en ayant les mains libres.

L’accessibilité

La Voice Interface Utilisateur est très importante pour les personnes en situation de handicap car elle leur apporte une solution pour se libérer de tâches quotidiennes complexes. De même pour les séniors qui font face à une diminution de certaines de leurs capacités ou qui ne maîtrisent pas les nouvelles technologies. 

Le champ d’utilisation de la reconnaissance vocale est très large et vaste, ce qui est crucial pour être accessible au plus grand nombre d'utilisateurs. 

La facilité

L’interface utilisateur vocale est conçue pour le grand public et pour être facile d’utilisation afin de vous fournir, en tant qu’utilisateur, une réelle aide. Alors que vous êtes en train de cuisiner votre repas du soir, vous souhaitez mettre un minuteur pour la cuisson de vos pâtes. Il vous sera plus facile de dicter cette action à votre appareil que de prendre le temps de le faire vous-même. Elle vous permet de garder les mains et les yeux libres tout en utilisant votre appareil digital.

Les inconvénients de la reconnaissance vocale

Même si la Voice User Interface vous permet d’offrir une merveilleuse expérience utilisateur, il a quelques inconvénients. 

Certaines configurations manquent de précisions et entraînent une difficulté pour l’appareil de bien répondre à l’utilisateur. Il faut faire attention à bien articuler et tous les contextes de demande, avec du bruits environnants par exemple, ne peuvent pas être compris par les appareils. Ces 2 éléments jouent sur l’interprétation de votre demande. 

Attention également aux homonymes comme “ou” et “où” qui peuvent entraîner des confusions et envoyer de fausses informations à l’assistant vocal.

Concevoir une Voice User Interface

Si je vous dis UX (User Experience) et UI (User Interface) ? Ça devrait vous parler. Dans ce cas, on parle de VUX (Voice User Experience) et de VUI (Voice User Interface). 

Le VUX définit le résultat d’une réflexion interne pour s’adapter aux objectifs de la marque. Quelle que soit l’expérience, elle doit être fluide et agréable et certains principes sont indispensables. Par exemple, il est inutile de proposer trop d’options à un utilisateur lors d’une interaction car il aura du mal à en retenir plus de trois. 

Lors de la création d’une application, la partie recherche est une étape clé et doit être axée sur l’utilisateur final. Cela permet de déterminer la nature de l’application sur l’aspect émotionnel, l’aspect fonctionnel et le ton et la nature de la voix.

Comprendre les besoins des utilisateurs

Une interface vocale efficace doit respecter les codes de l’UX et être centrée sur l’expérience client dans les interactions avec l’assistant. 

Il est primordial de connaître les besoins de vos utilisateurs, posez-vous la question “quelles sont les attentes des utilisateurs qui vont utiliser mon interface vocale ?”. Votre Voice User Interface a besoin de chercher à accomplir les demandes des utilisateurs et choisir les bons termes et expressions pour être le plus efficace. 

Trouver son ton de voix

Le ton de la voix, tone of voice en anglais, est celui qui est utilisé par votre entreprise pour communiquer avec ses utilisateurs. Le ton de voix doit rester le même sur toutes vos plateformes : site web, application mobile, communiqué de presse ou bien réseaux sociaux. Pour travailler l’identité verbale de l’interface vocale, la tonalité doit se faire :

➡️ la manière de parler : la façon de s’adresser à votre utilisateur, le choix du lexique et du vocabulaire utilisé

➡️ l’usage de l’assistant : son objectif, ses caractéristiques, les tâches qu’il peut effectuer

➡️ la voix : son style, sa façon de s’exprimer. Par exemple, votre voix peut être comique, formelle, sérieuse, mystérieuse… 

Choisir sa voix

C’est une étape majeure dans la conception de votre interface de reconnaissance vocale. Vous avez le choix entre 2 options :  

➡️ une voix synthétisée : plus facile à modifier car elle est basée sur la technique Text-to-Speech. Cependant, c’est une voix robotique, moins expressive que peut l’être une voix humaine. 

➡️ la voix d’un acteur humain : contrairement à la voix synthétisée, il s’agit d’un enregistrement réaliste et non conçu avec la technique TTS. Il est possible d’enregistrer plusieurs intonations mais elle vous sera plus coûteuse et moins rapidement modifiable en cas de changement. 

Définir des use-case

Un use-case, ou cas d’usage, est utile pour définir les fonctions de votre Voice User Interface et la manière de l’utiliser

Cependant, il n’est pas possible de prévoir une réponse à toutes les requêtes de vos utilisateurs. Votre liste de cas d’usage doit comporter les demandes les plus fréquentes et n’est pas une liste exhaustive.

Penser vos réponses

Passons à la partie rédactionnelle ! Il vous faudra rédiger les échanges possibles entre l’utilisateur et votre interface vocale. La phase use-case vous a permis de prévoir les demandes de vos utilisateurs auxquels vous allez devoir rédiger des réponses. 

Nous vous conseillons d’intégrer également des éléments conversationnels pour humaniser votre Voice User Interface comme : 

➡️ pour les erreurs : lors d’une incompréhension de la part de l’assistant vocal, il faut prévoir des réponses alternatives. 

➡️ pour confirmer ou remercier : “d’accord”, “c’est noté”, “merci”, “bien reçu”... des messages qui feront comprendre que votre interface vocale a bien compris la demande. 

Tester encore et encore

Pour voir le fonctionnement de votre Voice User Interface, il vous faut tester, tester et encore tester pour perfectionner votre assistant de reconnaissance vocale. 

Les tests doivent certifier que les réponses de l’interface vocale sont claires, que les dialogues sont pertinents et que la voix garantit une bonne expérience client. 

Inclure une Voice User Interface apporte une véritable valeur ajoutée. Grâce à l'expertise de nos développeurs et les technologies que nous utilisons, nos équipes  pourront intégrer votre interface utilisateur vocale à vos applications mobiles.

Vous avez un projet web et vous cherchez une entreprise qualifiée à qui le confier ? Contactez dès maintenant nos experts pour nous faire part de votre projet.