French Speechdat(II) FDB-1000

View resource name in all available languages

Base de données SpeechDat(II) FDB-1000 du Français

ID:

ELRA-S0061

This French SpeechDat(II) FDB-1000 database contains the recordings of 1,017 French speakers recorded over the fixed telephone network. This speech database was sponsored by the European Commission (CEC DGXIII), under the project LE2-4001. The database is partitioned into CD-ROMs

Speech samples are stored as sequence of 8-bit, 8kHz A-law and are uncompressed. Each prompt utterance is stored within a separate file (file extension FRA) and has an accompanying ASCII SAM label file (file extension FRO).

It contains 48 utterances (40 mandatory and 8 optional items) for 1,017 different speakers, 17 speakers have been added to the original 1,000 speakers to fit the requirements of the database. The main content of the database is speech and orthographic transcription files.

The database was validated by SPEX (the Netherlands) to assess its compliance with the SpeechDat format and content specifications.

It is designed for development and assessment of French speech recognizers.

Each speaker uttered the following items:

* 5 application words
* 1 sequence of 10 isolated digits
* 4 connected digits: 1 sheet number (5+ digits), 1 telephone number (9-11 digits), 1 credit card number (14-16 digits), 1 PIN code (6 digits)
* 3 dates: 1 spontaneous date (e.g. birthday), 1 prompted date (word style), 1 relative and general date exp.
* 2 word spotting phrases using an application word (embedded)
* 1 isolated digit
* 3 spelled words (letter sequences): 1 spontaneous, e.g. own forename, 1 spelling of direct. city name, 1 real/artificial for coverage
* 1 currency money amount
* 1 natural number
* 5 directory assistance names + 1 spelled name: 1 spontaneous, e.g. own forename, 1 city of birth / growing up (spont), 1 most frequent cities (set of 500), 1 most frequent company/agency (set of 500), 1 "forename surname", 1 spelled city of birth
* 2 questions, including "fuzzy" yes/no: 1 predominantly "yes" question, 1 predominantly "no" question
* 9 phonetically rich sentences
* 2 time phrases: 1 time of day (spontaneous), 1 time phrase (word style)
* 8 phonetically rich words

View resource description in all available languages

Cette base de données téléphonique du français a été conçue pour le développement et la validation de systèmes de reconnaissance de la parole. Elle comprend 48 occurrences (40 obligatoires et 8 optionnelles) pour 1 017 locuteurs différents, collectés à travers le réseau téléphonique fixe. Cette base a été sponsorisée par la Commission européenne (CEC DGXIII), sous le projet LE2-4001. 17 locuteurs ont été ajoutés au 1 000 locuteurs d'origine afin de correspondre aux besoins de la base. La base de données respecte les spécifications du projet SpeechDat(II). Elle contient principalement des fichiers de parole et leur transcription orthographique.

Les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A avec un en-tête de fichier de 16 bytes et ne sont pas compressés, selon les spécifications de SpeechDat.

Chaque énoncé est stocké dans un fichier séparé (extension de fichier FRA) et est accompagné d'un fichier d'étiquetage ASCII SAM (extension de fichier FRO).

Contenu du corpus :

* 5 mots de commande
* 1 séquence de 10 chiffres isolés
* 4 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (5+ chiffres), 1 numéro de téléphone (9-11 chiffres), 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres)
* 3 dates: 1 date spontanée (ex. anniversaire), 1 date lue, 1 date relative et générale
* 2 expressions utilisant un mot de commande
* 1 chiffre isolé
* 3 mots épelés (séquences de lettres) : 1 spontané, ex. prénom du locuteur, 1 nom de ville, 1 mot réel/artificiel pour couverture
* 1 montant en devises
* 1 nombre entier naturel
* 5 noms provenant d'un annuaire de renseignements téléphoniques + 1 nom épelé : 1 spontané, ex. prénom du locuteur, 1 ville de naissance/d'origine du locuteur (spontané), 1 nom de ville parmi les plus fréquentes (ensemble de 500), 1 nom de compagnie parmi les plus fréquentes (ensemble de 500), 1 répétition de "prénom nom", 1 ville de naissance épelée
* 2 questions, incluant des oui/non "vagues" : 1 question à prédominance "oui", 1 question à prédominance "non"
* 9 phrases phonétiquement riches
* 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps
* 8 mots phonétiquement riches

You don’t have the permission to edit this resource.