Colombian Spanish Speech Database

ID:

ELRA-S0064

The Colombian Spanish speech database contains the recordings of 1,065 speakers (563 males and 502 females) recorded over the fixed telephone network using an E-1 interface.

The speech data were collected from Colombia.

Speech samples are stored as sequences of 8-bit 8 kHz A-law, and uncompressed (CCITT G.711 recommendation). Each prompted utterance is stored within a separate file. Each speech file has an accompanying ASCII SAM label file. Speech file format and SAM label files follow the specifications given by the SpeechDat project.

The recording platform used an ISDN basic access (BR1) interface.

The speakers were mainly recruited from Siemens personnel, students from several Colombian universities, and their relatives.

The following sex and age distribution has been obtained: 56 speakers are under 16 (38 males, 18 females), 542 speakers are between 16 and 30 (277 males, 265 females), 347 speakers are between 31 and 45 (178 males, 169 females), 99 speakers are between 46 and 60 (59 males, 40 females) and 21 speakers are over 60 (11 males, 10 females).

The transcription included in this database is an orthographic transcription with a few details that represent audible acoustic events (speech and non speech) present in the corresponding waveform files. A lexicon is also provided.

Non-Speech Acoustic Events have been arranged into 4 categories (filled pause, speaker noise, stationary noise and intermittent noise) and are transcribed.

Type of resource : Speech recordings (Acoustic)
Speech mode : Read
Recording conditions: ISDN telephone interface
Language: Colombian Spanish
Sex and number of speakers: 1,065 speakers (563 males and 502 females)
Linguistic annotation: Orthographic (+ transcription of audible noises)
File format: 8 bits, A-law
Standard in use: SAM
Phoeme set: SAMPA
Sampling rate (kHz): 8 kHz
Distribution media: 1 CD-ROM
Related resources: SpeechDat family. Other languages available.

View resource description in all available languages

Cette base de données contient des enregistrements collectés en Colombie.

Cette base de données est composée d'enregistrements téléphoniques de 1065 locuteurs (563 locuteurs hommes et 502 locuteurs femmes) enregistrés directement à travers le réseau téléphonique fixe colombien, et utilisant une plate-forme d'enregistrement avec une interface ISDN (interface E-1).

Les fichiers de parole ont été échantillonnés à 8 kHz, et enregistrés en séquences de 8 bits, loi-A, sans compression (Recommandation CCITT G.711). Chaque énoncé est stocké dans un fichier séparé. Chaque fichier est accompagné d'un fichier d'en-tête au format SAM. Le format des fichiers de parole et des fichiers d'en-têtes SAM suivent les spécifications du projet SpeechDat.

Les locuteurs ont été principalement recrutés parmi le personnel de Siemens, les étudiants de plusieurs universités de Colombie, et leurs familles. Les classes d'âge sont réparties comme suit : 56 locuteurs de moins de 16 ans (38 hommes, 18 femmes), 542 locuteurs entre 16 et 30 ans (277 hommes, 265 femmes), 347 locuteurs entre 31 et 45 ans (178 hommes, 169 femmes), 99 locuteurs entre 46 et 60 ans (59 hommes, 40 femmes) et 21 locuteurs de plus de 60 ans (11 hommes, 10 femmes).

La base contient une transcription orthographique qui donne des informations sur les événements acoustiques (parole ou non parole) présents dans les fichiers d'enregistrements correspondants. Un lexique est également fourni.

Les événements acoustiques de non parole ont été classés en 4 catégories (hésitation, bruit émis par le locuteur, bruit de fond "permanent" - ex : bruit de voiture - et bruit de fond intermittent - ex : claquement de porte) et ont été transcrits.

CARACTERISTIQUES :
Type de ressource : Enregistrements de parole (acoustique)
Mode de parole : Lu
Conditions d'enregistrement : Réseau téléphonique fixe
Langue : Espagnol colombien
Sexe et nombre de locuteurs : 1065 locuteurs (563 hommes et 502 femmes)
Annotation linguistique : Orthographique (+ transcription des bruits audibles)
Format de fichier : 8 bits, loi A
Standard utilisé : SAM
Ensemble phonétique: SAMPA
Fréquence d'échantillonnage (kHz) : 8 kHz
Mode de distribution : 1 CD-ROM
Ressources connexes : Famille SpeechDat. D'autres langues sont également disponibles à ELRA

You don’t have the permission to edit this resource.