Swiss-French SpeechDat(II) FDB-3000

View resource name in all available languages

Base de données SpeechDat(II) du suisse-romand FDB-3000

ID:

ELRA-S0104

The Swiss-French SpeechDat(II) FDB-3000 comprises 3000 Swiss-French speakers (1500 males, 1500 females) recorded over the Swiss fixed telephone network. This database is partitioned into 6 CDs, each of which comprises 500 speakers sessions. The speech databases made within the SpeechDat(II) project were validated by SPEX, the Netherlands, to assess their compliance with the SpeechDat format and content specifications.
Speech samples are stored as sequences of 8-bit 8 kHz A-law. Each prompted utterance is stored in a separate file. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.
The following items were recorded:
- 5 application words
- 1 sequence of 6 isolated digits including the hash (#) and the star (*)
- 3 connected digits: 1 sheet number, 1 telephone, 1 credit card number (16 digits)
- 2 dates: 1 spontaneous date, e.g. birthday, 1 prompted date, word style
- 3 spelled words from a list of name and titles
- 2 currency money amounts
- 2 numbers: 1 natural number, 1 quantity number (prompted)
- 1 place (province of longest residence)
- 7 optional item: 1 name (spelling table), 1 city name, 1 mother tongue of speaker (spontaneous), 1 education level of speaker (out of 3 choices), 1 type of telephone used, 1 query to telephone directory
- 1 free comment on session
- 1 yes/no question
- 10 phonetically rich sentences
- 1 time phrase (word style)
The following age distribution has been obtained: 69 speakers are below 16 years old, 1006 speakers are between 16 and 30, 944 speakers are between 31 and 45, 629 speakers are between 46 and 60, 311 speakers are over 60, and 41 speakers whose age is unknown.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat(II) FDB-3000 du suisse-romand contient les enregistrements de 3000 locuteurs suisses romands (1500 hommes, 1500 femmes), enregistrés à travers le réseau téléphonique fixe suisse. Cette base est répartie sur 6 CD-ROM, comprenant chacun les sessions de 500 locuteurs. Les bases de données SpeechDat(II) ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.

Les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A.

Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.Les éléments suivants ont été enregistrés :

* 5 mots de commande ;
* 1 séquence de 6 chiffres isolés qui inclut les signes (*) et (#) ;
* 3 séquences de chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt, 1 numéro de téléphone, et un numéro de carte de crédit à 16 chiffres ;
* 2 dates : 1 date spontanée (ex., un anniversaire), et une date lue ;
* 3 mots épelés, extraits d'une liste de noms et titres ;
* 2 montants en devises ;
* 2 nombres : 1 nombre entier et 1 quantité (lue) ;
* 1 nom de lieu (province ou lieu de résidence) ;
* 6 éléments optionnels : 1 nom, 1 nom de ville, la langue maternelle du locuteur (spontané), un niveau d'éducation du locuteur (3 choix proposés), 1 type de téléphone utilisé, 1 requête adressée aux renseignements téléphoniques ;
* 1 commentaire libre sur la session.
* 1 question oui/non ;
* 10 phrases phonétiquement riches ;
* 1 phrase comportant une notion de temps (lue);

Les classes d'âge sont réparties comme suit : 69 locuteurs de moins de 16 ans, 1006 locuteurs entre 16 et 30 ans, 944 locuteurs entre 31 et 45 ans, 629 locuteurs entre 46 et 60 ans, 311 locuteurs de plus de 60 ans, et 41 locuteurs dont l'âge est inconnu.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following: