SoapBox Labs apprend aux assistants vocaux à comprendre la façon dont les enfants parlent. La startup irlandaise cherche à rendre la technologie vocale accessible aux enfants, en améliorant comme jamais auparavant le Machine Learning de l’assistant vocal dans le but de comprendre au mieux leurs façons de parler.
Sommaire
Les enfants comme bête noire des assistants vocaux
Bon nombre de vidéos sur YouTube rencontrent un franc succès du fait qu’elles mettent en scène des enfants de bas âge tentant de communiquer avec un assistant vocal, en vainc. Un exemple hilarant que vous pouvez visionner ci-dessous concerne une petite fille demandant à son assistant Alexa de jouer la chanson pour enfant « Baby Shark ». Après plusieurs tentatives, c’est finalement grâce à l’intervention de la maman que l’assistant vocal d’Amazon se décide de jouer la chanson demandée. Preuve que les assistants vocaux n’ont pas été conçus pour les enfants.
« Mon plus beau moment a été de voir mon enfant interagir avec la technologie » a déclaré Patricia Scanlon, PDG de SoapBox Labs, au site d’actualités Voicebot.ai lors d’une interview. « Pour eux, la technologie vocale est un besoin plus qu’un souhait. Et ils n’aiment pas qu’on ne les comprenne pas. »
Scanlon, une ancienne chercheuse des Bell Labs, a fondé SoapBox en 2013 pour combler le retard qu’avait pris la technologie vocale à comprendre et communiquer avec les enfants. Après plus de deux décennies de travail dans le domaine de la reconnaissance vocale, elle a déterminé que le plus gros problème était le manque d’information. La plupart des enregistrements utilisés pour construire et former les IA vocales proviennent d’adultes. Cependant, les enfants parlent différemment. Cela limite la capacité de l’assistant vocal à comprendre les bizarreries inhérentes à la parole des enfants.
« Ils allongent les syllabes, su-renoncent les mots et ne parlent pas de la même façon que les adultes. Nous avons recueilli des milliers d’heures de discours d’enfants pour construire notre propre ensemble de données parce que la qualité d’un système dépend de la qualité des données qui y sont ajoutées, a ajouté Scanlon.
« Les assistants vocales leaders du marché de chez Google, Amazon ou Apple fonctionnent bien, mais une fois qu’on a un enfant qui s’écarte du langage adulte, cela devient un problème. Ils n’ont pas ou n’utilisent pas les données sur la façon dont les enfants parlent ce qui rend leur compréhension très difficile. »
Parler aux tout-petits
SoapBox Labs associe ses données à une technologie d’apprentissage approfondie pour créer des modèles et des algorithmes que les plates-formes vocales peuvent utiliser pour parler aux enfants. Jusqu’à aujourd’hui, l’accent était mis sur la création de la technologie, mais l’entreprise a commencé se concentrer sur cette technologie en tant qu’API, a indiqué M. Scanlon.
Les applications de reconnaissance vocale destinées aux enfants sont de plus en plus nombreuses. La création d’applications vocales ou d’assistants intelligents pour l’éducation et le divertissement est déjà une industrie en pleine croissance, qu’il s’agisse de l’Echo Dot Kids Edition d’Amazon, de jouets qui peuvent bouger et parler aux enfants, ou encore de la volonté du Ministère de l’Education Nationale français de fournir les écoles en assistants vocaux pour apprendre l’anglais aux élèves de primaire.
La plupart des collaborations à venir de SoapBox sont encore en cours d’élaboration, mais certains de ses partenariats ont été rendus publics. Par exemple, Lingumi Labs utilise la technologie SoapBox pour enseigner l’anglais à de jeunes enfants à Taiwan. À un niveau plus important, SoapBox a travaillé avec Microsoft pour ajouter sa technologie de reconnaissance vocale à la plate-forme Azure plus tôt cette année afin de créer des tuteurs automatisés pour les enfants. La technologie SoapBox est utilisée pour aider les enfants et l’IA à se comprendre pendant les cours.
SoapBox a amassé environ 5,5 millions de dollars en capital et en subventions pour sa recherche depuis son lancement en 2013. Scanlon a indiqué que le plan actuel consiste à continuer d’élargir son ensemble de données pour tenir compte des nouvelles langues et des nouveaux accents, ce qui permettra à un plus grand nombre d’enfants d’interagir avec la technologie vocale avec succès.
Le besoin de sécurité et de savoir-faire technique
La demande actuelle et future pour ce type de technologie soulève la question de savoir pourquoi il n’y a pas plus d’entreprises qui se concentrent sur la parole des enfants ou pourquoi des entreprises comme Amazon et Google n’ont pas consacré plus de ressources dans ce domaine. Scanlon a son explication.
« Rétrospectivement, je sais maintenant pourquoi il n’y a pas plus d’entreprises qui nous font concurrence. Premièrement, la sécurité des données. Nous avons été très concentrés sur cela dès le début. Nous avons un plan en instance de brevet pour faire passer la sécurité au niveau supérieur. Mais pour l’instant, la confiance est érodée. »
Scanlon a souligné la préoccupation constante de savoir qui écoute les enregistrements réalisés par les assistants vocaux comme un problème mondial. Ensuite, il y a les craintes liées à la vie privée des enfants. Amazon fait l’objet de plusieurs poursuites judiciaires pour savoir si Alexa viole la vie privée des enfants, et de nombreux autres grands noms de l’industrie font l’objet d’un examen minutieux pour savoir s’ils violent la Children’s Online Privacy Protection Act (COPPA) ou des lois connexes.
« Deuxièmement, il est très difficile de construire une reconnaissance vocale pour les enfants, c’est une difficulté technique sous-estimée » explique Scanlon.
« D’autres entreprises ont fait beaucoup de bruit au sujet des produits intelligents pour les enfants, puis les produits n’arrivent jamais et ils disent que c’était trop difficile. La reconnaissance vocale des enfants nécessite une mise au point hors du commun. Les gens pensent que c’est comme s’adapter à une nouvelle langue ou accent ce qui n’est pas le cas. »
0 commentaires