SpeechDat(M) Italian Mobile Network Speech Database

View resource name in all available languages

Base de données orale SpeechDat(M) italien en réseau mobile

ID:

ELRA-S0304

The SpeechDat(M) Italian Mobile Network Speech Database contains the recordings of 342 speakers (156 males, 186 females) of Italian recorded over the mobile telephone network. This database is distributed on 1 CD-ROM. The database complies with the common specifications created in the SpeechDat project.

Speech samples are stored as sequences of 8-bit 8 kHz A-law. Each prompted utterance is stored in a separate file. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.

Each speaker uttered the following items:

• 6 application words
• 3 digit strings : prompt sheet number, telephone number, credit card number,
• 3 dates : 1 spontaneous calling date, 2 prompted dates (word style)
• 3 application word phrases
• 1 isolated digit
• 3 spelled word : city name, forename, surname
• 2 money amounts
• 3 natural numbers
• 1 place: city of birth
• 3 spontaneous yes/no questions
• 9 phonetically rich sentences
• 3 time phrases : 1 time of day (spontaneous), 2 time phrases (prompted)

The following age distribution has been obtained: 8 speakers are under 16, 191 are between 16 and 30, 85 are between 31 and 45, 49 are between 46 and 60, and 9 speakers are over 60.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données orale SpeechDat(M) italien en réseau mobile comprend les enregistrements de 342 locuteurs italiens (156 hommes, 186 femmes) enregistrés à travers le réseau téléphonique mobile italien. La base de données est répartie sur 3 CD-ROM. Cette base est conforme aux spécifications du projet SpeechDat.

Les fichiers de parole sont stockés en séquences d’échantillons au format 8bit, 8 kHz, A-law, et décompressés. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Chaque locuteur a prononcé les éléments suivants :
• 6 mots de commande
• 3 séries de chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt, 1 numéro de téléphone, 1 numéro de carte de crédit
• 3 dates : une date d’appel spontanée, 2 dates lues
• 3 expressions utilisant un mot de commande
• 1 chiffre isolé
• 3 mots épelés : nom de ville, prénom, nom
• 2 montants en devises
• 3 nombres naturels
• 1 lieu : villes de naissance
• 3 questions oui / non spontanées
• 9 phrases phonétiquement riches
• 3 expressions comportant une notion de temps : 1 moment de la journée (spontané), 2 expressions (lues)

Les classes d’âge sont réparties comme suit : 8 locuteurs ont moins de 16 ans, 191 locuteurs ont entre 16 et 30 ans, 85 locuteurs entre 31 et 45 ans, 49 locuteurs entre 46 et 60 ans, 9 locuteurs de plus de 60 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.