{"id":16130,"date":"2020-02-21T00:00:00","date_gmt":"2020-02-21T00:00:00","guid":{"rendered":"https:\/\/localhost:10083\/non-classifiee\/how-speech-to-text-works-fr\/"},"modified":"2023-05-08T17:45:48","modified_gmt":"2023-05-08T15:45:48","slug":"coment-fonctionne-les-logiciels-de-saisie-vocale","status":"publish","type":"post","link":"https:\/\/wp-staging.amberscript.com\/fr\/blog\/coment-fonctionne-les-logiciels-de-saisie-vocale\/","title":{"rendered":"Comment fonctionne la saisie vocale ?"},"content":{"rendered":"\n<p><em>Avec l\u2019introduction de la saisie vocale tel qu\u2019Alexa, Cortana, Siri et Google assistant, la reconnaissance vocale a commenc\u00e9 \u00e0 remplacer la saisie manuelle comme un moyen d\u2019interagir avec nos appareils num\u00e9riques.<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Quel est l\u2019\u00e9tat actuel de la saisie vocale ?<\/h2>\n\n\n\n<p>Les d\u00e9veloppements technologiques r\u00e9cents dans le domaine de la reconnaissance vocale ont non seulement rendu notre vie plus pratique et notre flux de travail plus productif, mais aussi ouvert des opportunit\u00e9s, qui \u00e9taient consid\u00e9r\u00e9es comme \u00abmiraculeuses\u00bb \u00e0 l\u2019\u00e9poque.<\/p>\n\n\n\n<p>Les logiciels de synth\u00e8se vocale ont une grande vari\u00e9t\u00e9 d\u2019applications, et la liste continue de s\u2019allonger chaque ann\u00e9e. Sant\u00e9, service client am\u00e9lior\u00e9, recherche qualitative, journalisme \u2013 ce ne sont l\u00e0 que quelques-uns des secteurs o\u00f9 la conversion voix-texte a d\u00e9j\u00e0 chang\u00e9 la donne.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Pourquoi avons-nous besoin d\u2019une transcription automatique ?<\/h3>\n\n\n\n<p>Les professionnels de divers domaines ont besoin de transcriptions de haute qualit\u00e9 pour effectuer leurs activit\u00e9s professionnelles. La technologie \u00e0 la base de la saisie vocale progresse \u00e0 un rythme rapide, la rendant plus dynamique, moins ch\u00e8re et plus pratique que la transcription manuelle.<\/p>\n\n\n\n<p>Bien que la technologie ne soit pas encore l\u00e0 pour atteindre les performances humaines, la pr\u00e9cision du logiciel peut atteindre 95%. Les services de transcription exigeaient autrefois du temps et de la main-d\u2019\u0153uvre, alors que l\u2019implication humaine dans ce processus se limite d\u00e9sormais \u00e0 de petits ajustements.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Une raison de plus \u2013 L\u2019accessibilit\u00e9 num\u00e9rique<\/h3>\n\n\n\n<p>Pourquoi la reconnaissance vocale automatique est-elle actuellement en plein essor ici en Europe? La r\u00e9ponse est assez simple: l\u2019accessibilit\u00e9 num\u00e9rique. Comme d\u00e9crit dans la&nbsp;<a href=\"https:\/\/eur-lex.europa.eu\/legal-content\/EN\/TXT\/HTML\/?uri=CELEX:32016L2102&amp;from=EN\" target=\"_blank\" rel=\"noopener\">directive europ\u00e9enne 2016\/2102<\/a>, les gouvernements doivent prendre des mesures pour garantir \u00e0 tous un acc\u00e8s \u00e9gal \u00e0 l\u2019information. Les podcasts, vid\u00e9os et enregistrements audio doivent \u00eatre accompagn\u00e9s de l\u00e9gendes ou de transcriptions pour \u00eatre accessibles aux personnes malentendantes.<\/p>\n\n\n<div class=\"image-block-wrapper\">\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/cdn.shortpixel.ai\/client\/to_avif,q_glossy,ret_img,w_300,h_300\/https:\/\/wp-staging.amberscript.com\/wp-content\/uploads\/2020\/02\/accessibilit%C3%A9-num%C3%A9rique-300x300.png\" alt=\"\" title=\"accessibilit\u00e9 num\u00e9rique\"\/><\/figure>\n<\/div>\n\n\n<p><strong>Comment fonctionne la reconnaissance vocale automatique ?<\/strong><\/p>\n\n\n\n<p>P.s \u2013 si c\u2019est trop long pour vous, n\u2019h\u00e9sitez pas \u00e0 passer \u00e0 l\u2019infographie r\u00e9capitulative au bas de cette page.<\/p>\n\n\n\n<p>Le c\u0153ur d\u2019un service de transcription automatique est le syst\u00e8me de reconnaissance vocale automatique. En bref, de tels syst\u00e8mes sont compos\u00e9s de composants acoustiques et linguistiques fonctionnant sur un ou plusieurs ordinateurs.<\/p>\n\n\n\n<p>Le composant acoustique est responsable de la conversion de l\u2019audio de votre fichier en une s\u00e9quence d\u2019unit\u00e9s acoustiques \u2013 de tr\u00e8s petits \u00e9chantillons sonores. Avez-vous d\u00e9j\u00e0 vu une forme d\u2019onde du son? C\u2019est ce que nous appelons le son analogique ou les vibrations que vous cr\u00e9ez lorsque vous parlez \u2013 ils sont convertis en signaux num\u00e9riques, de sorte que le logiciel puisse les analyser. Ensuite, les unit\u00e9s acoustiques mentionn\u00e9es sont associ\u00e9es aux \u00ab<a href=\"https:\/\/www.voxforge.org\/home\/docs\/faq\/faq\/what-is-an-acoustic-model\" target=\"_blank\" rel=\"noopener\">phon\u00e8mes<\/a>\u00bb existants \u2013 ce sont les sons que nous utilisons dans notre langue pour former des expressions significatives.<\/p>\n\n\n\n<p>Par suite, le composant linguistique est charg\u00e9 de convertir ces s\u00e9quences d\u2019unit\u00e9s acoustiques en mots, phrases et paragraphes. Il y a beaucoup de mots qui sonnent de la m\u00eame mani\u00e8re, mais qui signifient des choses compl\u00e8tement diff\u00e9rentes, comme conte, compte et comte.<\/p>\n\n\n\n<p>La composante linguistique analyse tous les mots pr\u00e9c\u00e9dents et leur relation pour estimer la probabilit\u00e9 de savoir quel mot va \u00eatre utilis\u00e9 ensuite. Les geeks les appellent les \u00ab<a href=\"https:\/\/medium.com\/@postsanjay\/hidden-markov-models-simplified-c3f58728caab\" target=\"_blank\" rel=\"noopener\">mod\u00e8les de Markov cach\u00e9s<\/a>\u00bb \u2013 ils sont largement utilis\u00e9s dans tous les logiciels de reconnaissance vocale. C\u2019est ainsi que les moteurs de reconnaissance vocale sont capables de d\u00e9terminer des parties du discours et des fins de mots (avec un succ\u00e8s vari\u00e9).<\/p>\n\n\n\n<p>Exemple: ils \u00e9coutent un podcast. M\u00eame si le son \u00ab-ent\u00bb du mot \u00ab\u00e9coutent\u00bb n\u2019est pas prononc\u00e9, la composante linguistique peut quand m\u00eame d\u00e9terminer que le mot doit \u00eatre \u00e9pel\u00e9 avec \u00ab-ent\u00bb, car il a \u00e9t\u00e9 pr\u00e9c\u00e9d\u00e9 de \u00abils\u00bb.<\/p>\n\n\n\n<p>Vous pouvez facilement le tester dans la vraie vie, comme toute autre application de saisie vocale, Google Translate a des mod\u00e8les de langage derri\u00e8re lui. Vous pouvez saisir \u00e0 la voix un mot al\u00e9atoire qui a plusieurs significations, puis fournir au traducteur un contexte (en mettant un mot dans une phrase). Il est tr\u00e8s probable que vous obteniez une transcription et une traduction plus pr\u00e9cises.<\/p>\n\n\n\n<p>Avant de pouvoir utiliser un service de transcription automatique, ces composants doivent \u00eatre form\u00e9s de mani\u00e8re appropri\u00e9e pour comprendre une langue sp\u00e9cifique. La partie acoustique de votre contenu, c\u2019est-\u00e0-dire la fa\u00e7on dont il est parl\u00e9 et enregistr\u00e9, et la partie linguistique, c\u2019est-\u00e0-dire ce qui est dit, sont essentielles pour la pr\u00e9cision de la transcription qui en r\u00e9sulte.<\/p>\n\n\n\n<p>Chez Amberscript, nous am\u00e9liorons constamment nos composants acoustiques et linguistiques afin de perfectionner notre moteur de reconnaissance vocale.<\/p>\n\n\n<div class=\"image-block-wrapper\">\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/cdn.shortpixel.ai\/client\/to_avif,q_glossy,ret_img,w_800,h_2000\/https:\/\/wp-staging.amberscript.com\/wp-content\/uploads\/2020\/02\/logiciel-speech-to-text.png\" alt=\"\" title=\"logiciel speech to text\"\/><\/figure>\n<\/div>\n\n\n<h3 class=\"wp-block-heading\">Surprise\u2026 Il y a encore un autre mod\u00e8le !<\/h3>\n\n\n\n<p>Il existe \u00e9galement quelque chose appel\u00e9 \u00ab<a href=\"https:\/\/speechangel.com\/2016\/05\/04\/difference-speaker-dependent-speaker-independent-recognition-software\/\" target=\"_blank\" rel=\"noopener\">speaker model<\/a>\u00bb. Le logiciel de reconnaissance vocale peut \u00eatre soit d\u00e9pendant du locuteur, soit ind\u00e9pendant du locuteur.<\/p>\n\n\n\n<p>Le mod\u00e8le d\u00e9pendant du locuteur est form\u00e9 pour une voix particuli\u00e8re, telle que la solution de saisie vocale de Dragon. Vous pouvez \u00e9galement entra\u00eener Siri, Google et Cortana \u00e0 reconna\u00eetre uniquement votre propre voix (en d\u2019autres termes, vous rendez l\u2019assistant vocal d\u00e9pendant du haut-parleur).<\/p>\n\n\n\n<p>Cela se traduit g\u00e9n\u00e9ralement par une pr\u00e9cision plus \u00e9lev\u00e9e pour votre cas d\u2019utilisation particulier, mais il faut du temps pour entra\u00eener le mod\u00e8le \u00e0 comprendre votre voix. En outre, le mod\u00e8le d\u00e9pendant du locuteur n\u2019est pas flexible et ne peut pas \u00eatre utilis\u00e9 de mani\u00e8re fiable dans de nombreux contextes, tels que les conf\u00e9rences.<\/p>\n\n\n\n<p>Vous l\u2019avez probablement devin\u00e9 \u2013 un mod\u00e8le ind\u00e9pendant du locuteur peut reconna\u00eetre de nombreuses voix diff\u00e9rentes sans aucune formation. C\u2019est ce que nous utilisons actuellement dans notre logiciel chez Amberscript.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Tous les outils de reconnaissance vocale sont-ils identiques?<\/h3>\n\n\n\n<p>Non ! Il existe de nombreux outils de reconnaissance vocale qui servent \u00e0 des fins diff\u00e9rentes. Certains d\u2019entre eux sont con\u00e7us pour des t\u00e2ches r\u00e9p\u00e9titives simples, d\u2019autres sont incroyablement avanc\u00e9s. Examinons les diff\u00e9rents niveaux de&nbsp;<a href=\"https:\/\/www.semanticscholar.org\/paper\/A-Review-on-Different-Approaches-for-Speech-System-Saksamudre-Shrishrimal\/9554b35ff019944109cd164a209bdec8065028d3\" target=\"_blank\" rel=\"noopener\">reconnaissance vocale<\/a>.<\/p>\n\n\n\n<p>1) Avez-vous d\u00e9j\u00e0 appel\u00e9 une entreprise, puis le robot vocal vous a demand\u00e9 de laisser votre num\u00e9ro de t\u00e9l\u00e9phone? C\u2019est l\u2019outil de reconnaissance vocale le plus simple, qui fonctionne sur le pattern-matching, il a un vocabulaire limit\u00e9, mais il fait le travail (dans ce cas, comprendre les chiffres).<\/p>\n\n\n\n<p>2) Le niveau suivant de reconnaissance vocale implique l\u2019analyse statistique et la mod\u00e9lisation (comme les mod\u00e8les de Markov cach\u00e9s) \u2013 nous en avons d\u00e9j\u00e0 parl\u00e9 dans l\u2019une des sections pr\u00e9c\u00e9dentes.<\/p>\n\n\n\n<p>3) Le niveau ultime de reconnaissance vocale est bas\u00e9 sur des r\u00e9seaux de neurones artificiels \u2013 essentiellement, il donne au moteur la possibilit\u00e9 d\u2019apprendre et de s\u2019am\u00e9liorer. Google, Microsoft, ainsi que notre moteur sont aliment\u00e9s par l\u2019apprentissage automatique.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Logiciel Speech To Text. Attentes vs. R\u00e9alit\u00e9<\/h3>\n\n\n\n<p>Bien que la technologie de saisie vocale de la derni\u00e8re d\u00e9cennie ait progress\u00e9 \u00e0 un rythme tr\u00e8s rapide, les logiciels de synth\u00e8se vocale sont toujours confront\u00e9s \u00e0 un certain nombre de d\u00e9fis. Les limitations actuelles des logiciels de reconnaissance vocale sont:<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Les conditions d\u2019enregistrement<\/strong>. Les performances de la transcription humaine et automatis\u00e9e d\u00e9pendent largement des conditions d\u2019enregistrement. Les logiciels de reconnaissance vocale ont encore du mal \u00e0 interpr\u00e9ter la parole dans un environnement bruyant ou lorsque de nombreuses personnes parlent en m\u00eame temps.<\/p>\n\n\n\n<p>P.s \u2013 consultez notre article sur&nbsp;<a href=\"https:\/\/wp-staging.amberscript.com\/fr\/blog\/ameliorer-qualite-audio-et-transcription\/\">Comment am\u00e9liorer votre qualit\u00e9 audio et optimiser la transcription de la parole en texte<\/a>&nbsp;pour apprendre quelques conseils pratiques qui am\u00e9lioreront la qualit\u00e9 de votre transcription automatique.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Reconna\u00eetre certains dialectes et accents<\/strong>. La langue est une structure complexe, et tout le monde parle d\u2019une mani\u00e8re l\u00e9g\u00e8rement diff\u00e9rente. Une multitude de dialectes et d\u2019accents cr\u00e9ent une complexit\u00e9 suppl\u00e9mentaire pour le mod\u00e8le. Cependant, cette complexit\u00e9 peut \u00eatre g\u00e9r\u00e9e en rassemblant diff\u00e9rents types de donn\u00e9es.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Comprendre les homonymes<\/strong>. Les homonymes sont des mots qui sonnent de la m\u00eame mani\u00e8re, mais qui diff\u00e8rent par leur signification et leur orthographe. Par exemple, \u00ab&nbsp;court&nbsp;\u00bb et \u00ab&nbsp;cours&nbsp;\u00bb ou encore \u00ab&nbsp;soi&nbsp;\u00bb et \u00ab&nbsp;soie&nbsp;\u00bb. Le choix de la bonne option n\u00e9cessite une compr\u00e9hension du contexte. Bien que les moteurs de synth\u00e8se vocale modernes soient aliment\u00e9s par l\u2019IA, interpr\u00e9ter correctement le contexte unique reste difficile pour les machines.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Qu\u2018est-ce qui rend le syst\u00e8me d\u2019Amberscript si pr\u00e9cis?<\/h3>\n\n\n\n<p>On estime que notre moteur atteint une pr\u00e9cision de 95% \u2013 ce niveau de qualit\u00e9 \u00e9tait auparavant inconnu du march\u00e9 n\u00e9erlandais. Nous serions plus qu\u2019heureux de partager, d\u2019o\u00f9 vient cette performance in\u00e9gal\u00e9e:<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Architecture et mod\u00e9lisation intelligentes<\/strong>. Nous sommes fiers de travailler avec une \u00e9quipe de talentueux sp\u00e9cialistes de la parole qui ont d\u00e9velopp\u00e9 un mod\u00e8le de langage sophistiqu\u00e9, ouvert \u00e0 une am\u00e9lioration continue.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>De grandes quantit\u00e9s de mat\u00e9riel de formation<\/strong>. Le logiciel Speech-to-Text repose sur l\u2019apprentissage automatique. En d\u2019autres termes, plus vous alimentez le syst\u00e8me en donn\u00e9es, meilleures sont ses performances. Nous avons collect\u00e9 des t\u00e9raoctets de donn\u00e9es pour atteindre un niveau de qualit\u00e9 aussi \u00e9lev\u00e9.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Balanced data<\/strong>. Afin de perfectionner notre algorithme, nous avons utilis\u00e9 diff\u00e9rentes sortes de donn\u00e9es. Nos sp\u00e9cialistes ont obtenu une taille d\u2019\u00e9chantillon suffisante pour les deux sexes, ainsi que des accents et des tons de voix diff\u00e9rents.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Scenario exploration<\/strong>. Nous avons test\u00e9 notre mod\u00e8le dans diverses conditions acoustiques pour garantir des performances stables dans diff\u00e9rents param\u00e8tres d\u2019enregistrement.<\/p>\n\n\n<div class=\"image-block-wrapper\">\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/cdn.shortpixel.ai\/client\/to_avif,q_glossy,ret_img,w_300,h_300\/https:\/\/wp-staging.amberscript.com\/wp-content\/uploads\/2020\/02\/comment-nlu-est-utilis%C3%A9.png\" alt=\"\" title=\"comment nlu est utilis\u00e9\"\/><\/figure>\n<\/div>\n\n\n<h3 class=\"wp-block-heading\">Compr\u00e9hension du langage naturel \u2013 La prochaine grande \u00e9tape de la reconnaissance vocale<\/h3>\n\n\n\n<p>Discutons de la prochaine \u00e9tape majeure pour l\u2019ensemble du secteur, \u00e0 savoir la&nbsp;<a href=\"https:\/\/fr.wikipedia.org\/wiki\/Compr%C3%A9hension_du_langage_naturel\" target=\"_blank\" rel=\"noopener\">compr\u00e9hension du langage naturel (ou NLU)<\/a>. C\u2019est une branche de l\u2019intelligence artificielle, qui explore comment les machines peuvent comprendre et interpr\u00e9ter le langage humain. La compr\u00e9hension du langage naturel permet \u00e0 la technologie de reconnaissance vocale non seulement de transcrire le langage humain, mais aussi d\u2019en comprendre le sens. En d\u2019autres termes, ajouter des algorithmes NLU revient \u00e0 ajouter un cerveau \u00e0 un convertisseur parole-texte.<\/p>\n\n\n\n<p>NLU vise \u00e0 relever le d\u00e9fi le plus difficile de la reconnaissance vocale \u2013 comprendre et travailler avec un contexte unique.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Que pouvez-vous faire avec la compr\u00e9hension du langage naturel ?<\/h3>\n\n\n\n<p>\u2013&nbsp;<strong>Machine translation<\/strong>. C\u2019est quelque chose qui est d\u00e9j\u00e0 utilis\u00e9 dans Skype. Vous parlez dans une langue et votre voix est automatiquement transcrite en texte dans une autre langue. Vous pouvez voir \u00e7a comme le niveau suivant de Google Traduction. Cela seul a un potentiel \u00e9norme \u2013 imaginez \u00e0 quel point il devient plus facile de communiquer avec des personnes qui ne parlent pas votre langue.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>R\u00e9sum\u00e9 des documents<\/strong>. Nous vivons dans un monde plein de donn\u00e9es. Peut-\u00eatre qu\u2019il y a trop d\u2019informations l\u00e0-bas. Imaginez avoir un r\u00e9sum\u00e9 instantan\u00e9 d\u2019un article, d\u2019un essai ou d\u2019un e-mail.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Content categorization<\/strong>. Semblable \u00e0 un point pr\u00e9c\u00e9dent, le contenu peut \u00eatre divis\u00e9 en th\u00e8mes ou sujets distincts. Cette fonctionnalit\u00e9 est d\u00e9j\u00e0 impl\u00e9ment\u00e9e dans les moteurs de recherche, tels que Google et YouTube.<\/p>\n\n\n\n<p>\u2013&nbsp;<strong>Analyse des sentiments<\/strong>. Cette technique vise \u00e0 identifier les perceptions et opinions humaines gr\u00e2ce \u00e0 une analyse syst\u00e9matique des blogs, des critiques ou m\u00eame des tweets. Cette pratique est d\u00e9j\u00e0 mise en \u0153uvre par de nombreuses entreprises, en particulier celles qui sont actives sur les r\u00e9seaux sociaux.<\/p>\n\n\n\n<p>Oui, nous y sommes ! Nous ne savons pas si nous allons nous retrouver dans un monde rempli de robots amicaux ou celui de Matrix, mais les machines peuvent d\u00e9j\u00e0 comprendre les \u00e9motions humaines basiques.<\/p>\n\n\n\n<p>-D\u00e9tection de plagiat. Des outils de plagiat simples v\u00e9rifient uniquement si un \u00e9l\u00e9ment de contenu est une copie directe. Un logiciel avanc\u00e9 comme Turnitin peut d\u00e9j\u00e0 d\u00e9tecter si le m\u00eame contenu a \u00e9t\u00e9 paraphras\u00e9, ce qui rend la d\u00e9tection du plagiat beaucoup plus pr\u00e9cise.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Dans quel domaine la compr\u00e9hension du langage naturel (NLU) est-elle appliqu\u00e9 aujourd\u2019hui ?<\/h3>\n\n\n\n<p>Il existe de nombreuses disciplines dans lesquelles la NLU (en tant que sous-ensemble du traitement du langage naturel) joue d\u00e9j\u00e0 un r\u00f4le important. Voici quelques exemples:<\/p>\n\n\n<div class=\"image-block-wrapper\">\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/cdn.shortpixel.ai\/client\/to_avif,q_glossy,ret_img,w_300,h_300\/https:\/\/wp-staging.amberscript.com\/wp-content\/uploads\/2020\/02\/NLU-300x300.png\" alt=\"\" title=\"NLU\"\/><\/figure>\n<\/div>\n\n\n<p>1. Analyse des m\u00e9dias sociaux<br>2. Recherche en psychologie<br>3. D\u00e9tection des spams<br>4. Utilisation de l\u2019analyse vocale dans les centres d\u2019appels<br>5. M\u00eame\u2026 r\u00e9soudre des crimes<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Et apr\u00e8s ?<\/h3>\n\n\n\n<p>Nous int\u00e9grons actuellement des algorithmes NLU dans nos syst\u00e8mes pour rendre notre logiciel de reconnaissance vocale encore plus intelligent et applicable dans une plus large gamme d\u2019applications.<\/p>\n\n\n\n<p>Nous esp\u00e9rons que vous en connaissez maintenant un peu plus sur ce domaine fascinant de la saisie vocale! N\u2019h\u00e9sitez pas \u00e0 consulter notre blog pour des lectures encore plus int\u00e9ressantes !<\/p>\n\n\n\n<p>Vous pourriez \u00e9galement \u00eatre int\u00e9ress\u00e9 par cette lecture:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/wp-staging.amberscript.com\/fr\/blog\/comment-creer-speaker-vector\/\">Comment cr\u00e9er des \u00ab speaker vector \u00bb aux fichiers audio pour la transcription ?<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p><b>Comment fonctionnent les logiciels de saisie vocale ?<\/b><\/p>\n<p>Les logiciels de saisie vocale et de dict\u00e9e vocale utilisent la technologie de reconnaissance vocale pour transcrire la parole en texte.<\/p>\n","protected":false},"author":70,"featured_media":74307,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[143],"tags":[636,162],"class_list":["post-16130","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","tag-automatic-transcription-fr","tag-sous-titres-automatiques"],"acf":{"text":"","link":"","questions":""},"_links":{"self":[{"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/posts\/16130","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/users\/70"}],"replies":[{"embeddable":true,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/comments?post=16130"}],"version-history":[{"count":0,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/posts\/16130\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/media\/74307"}],"wp:attachment":[{"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/media?parent=16130"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/categories?post=16130"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wp-staging.amberscript.com\/fr\/wp-json\/wp\/v2\/tags?post=16130"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}