Swiss-French SpeechDat(M)

View resource name in all available languages

Base de données SpeechDat(M) du suisse-romand

ID:

ELRA-S0103

The Swiss-French SpeechDat(M) project comprises 1000 recorded Swiss-French speakers (575 female and 425 male speakers) . The corpus contains phonetically rich sentences & application oriented utterances such as keywords, digits, etc..
Speech samples are stored as sequences of 8-bit 8 kHz A-law speech samples (before compression). Each prompted utterance is stored in a separate file. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.
The following items were recorded:
- 1 sequence of 6 single digits including the hash (#) and the star (*) symbols
- 1 sheet id number (5 connected digits / 1 natural number)
- 1 telephone number (spontaneous)
- 1 16-digit credit card number
- 2 natural numbers (1 + sheet id)
- 2 money amounts
- 1 quantity
- 3 spelled words
- 1 time phrase (prompted, word style)
- 1 date (spontaneous)
- 1 date (prompted)
- 1 yes/no question
- 1 city name (prompted)
- 1 city name (spontaneous)
- 5 function words
- 1 name (spelling table)
- 1 mother tongue (spontaneous)
- 1 education level (out of 3 choices)
- 1 telephone type (out of 6 choices)
- 10 sentences (read)
- 1 query to telephone directory (given the name and the city of subject)
- 1 free comment on the session

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat(M) du suisse-romand comprend des enregistrements téléphoniques de 1000 locuteurs suisses romands (425 hommes et 575 femmes) enregistrés directement à travers le réseau téléphonique fixe suisse.

Le stockage des fichiers de parole suit les standards du projet ESPRIT SAM. Les fichiers de parole ont été échantillonnés à 8 kHz, enregistrés en séquences de 8 bits, loi-A, et ensuite compressés. Chaque énoncé a été stocké dans un fichier séparé. Chaque fichier signal est accompagné d'un fichier d'en-tête au format ASCII SAM qui contient la description du fichier parole correspondant.

Les éléments suivants ont été enregistrés :

* 1 séquence de 6 chiffres qui inclut les signes (*) et (#) ;
* 1 numéro d’identification à 5 chiffres connectés et un nombre entier
* 1 numéro de téléphone (spontané)
* 1 numéro de carte de crédit à 16 chiffres
* 2 nombres entiers naturels ;
* 2 montants en devises ;
* 1 quantité
* 3 mots épelés ;
* 1 phrase comportant une notion de temps (lue);
* 1 date (spontanée) ;
* 1 date (lue) ;
* 1 question oui/non ;
* 1 nom de ville (lu) ;
* 1 nom de ville (spontané) ;
* 5 mots de commande ;
* 1 nom (épelé) ;
* 1 langue maternelle (spontanée) ;
* 1 niveau d'éducation (3 choix proposés) ;
* 1 type de téléphone (6 choix proposés) ;
* 10 phrases lues ;
* 1 requête adressée aux renseignements téléphoniques (nom et lieu d'habitation du sujet connus) ;
* 1 commentaire libre sur la session.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following: