Siemens Chile Spanish FDB-250

View resource name in all available languages

Base de données FDB-500 du chilien

ID:

ELRA-S0054

The Chilean Spanish FDB-500 database contains the recordings of 507 Chilean speakers (272 males, 235 females) recorded over the fixed telephone network. This speech database gathers Spanish data as spoken in Chile. Each speaker uttered 24 items. Orthographic transliteration for all 12,168 utterances including 4 categories of non-speech acoustic events is included.

The corpus consists of read speech, including digits and application words for teleservices, recorded through an ISDN card. Speech sampled are stored as sequences of 8 bits 8 kHz A-law. Data are stored in a SAM file format.

The following age distribution has been obtained: 33 speakers are under 16, 215 speakers are between 16 and 30, 207 speakers are between 31 and 45, 51 speakers are between 46 and 60, and 1 speaker is over 60.

A phonetic lexicon with canonical transcription in SAMPA is also included.

View resource description in all available languages

Cette base orale regroupe des données de l'espagnol tel qu'il est parlé au Chili. Tous les locuteurs ont pour langue maternelle le chilien. Le corpus comprend de la parole lue, y compris des chiffres et des mots de commandes pour les services télématiques, enregistrés au moyen d'une carte ISDN. La base contient 24 énoncés par locuteur, pour un total de 507 locuteurs (272 hommes, 235 femmes). Les classes d'âge sont réparties comme suit : 33 locuteurs de moins de 16 ans, 215 locuteurs entre 16 et 30 ans, 207 locuteurs entre 31 et 45 ans, 51 locuteurs entre 46 et 60 ans et 1 locuteur de plus de 60 ans.

Chaque locuteur a prononcé 74 éléments différents : chiffres isolés, oui/non, mots de commande courants.

Une transcription orthographique est fournie pour les 12 168 répétitions, ainsi que 4 catégories d'événements acoustiques clairement audibles. Un lexique phonétique comprenant une transcription canonique en SAMPA est également fourni.

Les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A. Les données sont stockées sous un format de fichier SAM.

You don’t have the permission to edit this resource.