12 avril 2022

6 méthodes éprouvées pour personnaliser la collecte de données vocales

Il existe plusieurs types de clients différents - certains ont une idée claire de la façon dont leurs données vocales doivent être structurées, et certains sont plus flexibles avec leur approche.

En tant que prestataire de services, nous devons nous assurer que les exigences du client sont satisfaites. Cependant, avec un client qui est flexible avec ses exigences, il est possible qu'il n'ait pas pleinement donné collecte de données vocales une pensée complète.

C'est là que la contribution du fournisseur d'ensembles de données vocales entre en jeu.

Nous avons la responsabilité de mettre en valeur les points à garder à l'esprit avant de commencer l'audio collecte de données projet afin de permettre aux organisations d'IA d'identifier une solution réalisable, efficace et rentable.

Le marché de la reconnaissance vocale, dans le monde, devrait croître pour 27.16 milliards de dollars en 2026 de 10.7 milliards de dollars en 2020 à un TCAC de 16.8 %.

Voyons tous les moyens ou points efficaces à garder à l'esprit avant de personnaliser le collecte de données vocales .

Langues et démographie
Taille de la collecte
Structure du scénario
Exigences et formats audio
Exigences de livraison et de traitement
Autres points cruciaux à noter

Langues et démographie

Le projet doit d'abord spécifier les langues cibles et la cible démographique.

Langues et dialecte
Commencez par garder à l'esprit les exigences du projet - les langues pour lesquelles l'ensemble de données vocales est collecté et personnalisé. Aussi, comprenez l'exigence de compétence spécifique. Par exemple, le participant doit-il être un locuteur natif ou un locuteur non natif ?
Par exemple – Locuteurs natifs anglais
Le dialecte suit de très près le langage. Pour s'assurer que l'ensemble de données ne souffre pas de biais, il est conseillé d'introduire intentionnellement des dialectes pour tenir compte de la diversité des participants.
Par exemple – Locuteurs australiens à l'accent anglais
Pays
Avant de personnaliser, il est important de savoir s'il existe une exigence spécifique selon laquelle les participants doivent provenir de pays spécifiques. Et, si les participants doivent actuellement vivre dans un pays spécifique.
Par exemple – Le pendjabi est parlé différemment en Inde et au Pakistan.
Démographie
Outre la langue et la géographie, la personnalisation peut également être effectuée en fonction de la démographie. Il est également possible de cibler la répartition des participants en fonction de leur âge, de leur sexe, de leur diplôme, etc.
Par exemple – Adultes contre enfants ou éduqués contre non éduqués

Taille de la collection

Votre ensemble de données aura un impact sur les performances de votre projet de données. Cependant, la taille des données de collecte dont vous avez besoin déterminera également les participants requis.

Le nombre total de répondants
Déterminez le nombre total de participants qui seront nécessaires pour le projet. Dans le cas où le projet nécessite une langue collecte de données audio, vous devez analyser le nombre total de participants requis par langue ciblée.
Par exemple – 50% anglophones américains et 50% anglophones australiens
Le nombre total d'énoncés
Pour construire la collecte de données vocales, déterminez le nombre total d'énoncés ou de répétitions par participant ou le nombre total de répétitions nécessaires.
Par exemple – 50 participants avec 25 énoncés par participant = 1250 répétitions

Structure du script

Le script peut également être personnalisé pour répondre aux besoins du projet, il est donc conseillé de demander l'aide de orthophonistes pour concevoir le flux de texte. Si le modèle ML doit être formé sur des données bien structurées, il doit prendre en considération le script et le workflow.

Scripté vs non scénarisé
Vous pouvez choisir d'utiliser un texte scénarisé ou un texte naturel ou non scénarisé à lire par les participants.
Dans un discours textuel scénarisé, les participants lisent ce qui est affiché à l'écran. Cette méthode est, la plupart du temps, utilisée pour enregistrer des commandes ou des instructions.
Par exemple – 'Éteignez la musique', 'Appuyez sur 1 pour enregistrer.'
Dans le discours non scénarisé, les participants reçoivent des scénarios et sont invités à formuler leurs phrases et à parler aussi naturellement que possible.
Par exemple – 'Pouvez-vous s'il vous plaît me dire où se trouve la prochaine station-service ?'
Collection d'énoncés / Mots d'éveil
Dans le cas où un texte scripté est utilisé, vous devez décider du nombre de scripts qui seront utilisés et si chaque participant lira un script unique ou un groupe de scripts. Déterminez également si le script contient une collection de mots et de commandes d'activation.
Par exemple -
Commande 1:
"Alexa, quelle est la recette d'un cupcake au chocolat ?"
"Ok Google, quelle est la recette d'un cupcake au chocolat ?"
« Siri, quelle est la recette d'un cupcake au chocolat ?
Commande 2:
"Alexa, quand est le vol pour New York ?"
"Google, quand est le vol pour New York ?"
« Siri, quand est le vol pour New York ?

Exigences et formats audio

La qualité audio joue un rôle crucial dans la reconnaissance vocale collecte de données processus. Les bruits de fond gênants peuvent avoir un impact négatif sur la qualité des notes vocales collectées. Cela pourrait également diminuer l'efficacité de l'algorithme de reconnaissance vocale.

Qualité audio
La qualité des enregistrements et la présence de bruit de fond peuvent impacter le résultat du projet. Mais certaines collectes de données vocales acceptent la présence de bruit. Cependant, il est conseillé d'avoir une meilleure compréhension des exigences en termes de débit binaire, de rapport signal sur bruit, d'amplitude, etc.
Format
Le format de fichier, points de données, la structure du contenu, la compression et les exigences de post-traitement déterminent également la qualité des enregistrements vocaux.
La raison de l'importance des formats de fichiers est que le modèle doit identifier la sortie du fichier et être formé pour reconnaître cette qualité sonore particulière.
Définir les exigences audio personnalisées
Les exigences audio personnalisées doivent être mentionnées avant le début du processus de collecte. Les clients peuvent choisir des fichiers audio personnalisés dans lesquels des fichiers spécifiques sont regroupés.

Exigences de livraison et de traitement

Une fois les données vocales recueillies, les clients peuvent choisir de les faire livrer en fonction de leurs besoins.

Exigence de transcription et d'annotation
Certains clients exigent la transcription et l'étiquetage des données avant la livraison. En outre, ils peuvent également nécessiter des formes spécifiques d'étiquetage et de segmentation.
Parfois, il vaut mieux chercher orthophonistes et des experts pour aider à transcrire le discours dans différentes langues afin de maintenir l'authenticité de la langue cible.
Conventions de nommage des fichiers
La formulaires de collecte de données doit spécifier toute convention de nommage de fichier à suivre. Si la convention de nommage est complexe ou dépasse la portée standard du processus, elle pourrait entraîner des coûts de développement supplémentaires.
Consignes de livraison
Les directives de sécurité et de livraison doivent être suivies comme spécifié dans les exigences du projet. De plus, si les données doivent être livrées en petites étapes ou sous la forme d'un ensemble complet à la fois, il convient de le spécifier. Les clients préfèrent également les délais suivi des progrès mises à jour afin qu'ils puissent suivre l'état du projet.

Autres points cruciaux à noter

Les personnalisations auront un impact sur la façon dont,

Méthodes de collecte de données d'utiliser
Le recrutement des participants
Le délai de livraison
Le coût provisoire du projet

Lors de la sélection du bon fournisseur, vous devez vous assurer que vous choisissez quelqu'un qui a à la fois l'expérience nécessaire pour offrir des choix de personnalisation et la flexibilité nécessaire pour faire évoluer le projet sans effort. La nature de la collecte de données vocales est qu'elle évolue et que les complexités changent avec le temps, et le bon fournisseur doit être capable de suivre le rythme.

Lorsque vous n'avez besoin que de flexibilité et d'évolutivité, Shaip est le bon choix. Nous offrons des services personnalisables en fonction des exigences spécifiques de votre projet. Nous proposons des solutions évolutives et flexibles solutions de collecte de données pour des projets multilingues à des prix compétitifs. Discutez avec nos experts pour savoir comment nos techniques de collecte et de personnalisation de données vocales fonctionnent dans le développement de l'IA conversationnelle.

[A également lu: Données d'entraînement à la reconnaissance vocale - Types, collecte de données et applications]

Parlez à un expert

Prénom*
Nom de famille*
Email*
Téléphone*
Entreprise*
Pays*
Pays
Commentaires*
En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d'utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.
CAPTCHA

Télécharger le livre gratuit

Vous aimeriez aussi

6 méthodes éprouvées pour personnaliser la collecte de données vocales

Langues et démographie

Langues et dialecte

Pays

Démographie

Taille de la collection

Le nombre total de répondants

Le nombre total d'énoncés

Structure du script

Scripté vs non scénarisé

Collection d'énoncés / Mots d'éveil

Exigences et formats audio

Qualité audio

Format

Définir les exigences audio personnalisées

Exigences de livraison et de traitement

Exigence de transcription et d'annotation

Conventions de nommage des fichiers

Consignes de livraison

Autres points cruciaux à noter

Partager

Parlez à un expert

L'essor des assistants vocaux basés sur l'IA pour améliorer la qualité des soins de santé

4 pratiques d'IA conversationnelles efficaces pour un retour sur investissement maximal

Pourquoi votre IA conversationnelle a-t-elle besoin de bonnes données d'énoncé ?

Services de données IA

Spécialité

Industrie

Produits

Entreprise

Ressources

Contactez-Nous