Siemens Shanghai Mandarin FDB-1000

View resource name in all available languages

Base de données FDB-1000 du mandarin de Shanghai

ID:

ELRA-S0057

The Shanghai Mandarin FDB-1000 database contains the recordings of 1,000 speakers (500 males, 500 females) recorded over the fixed telephone network. This acoustic database gathers Mandarin data, as spoken in Shanghai as a first or second Chinese dialect/language.

The corpus consists of read speech, including digits and application words for teleservices, recorded through an ISDN card. Chinese characters and English translation are included, as well as canonical Pinyin transcription including tone markers, and several categories of non-speech events.

Speech samples are stored as sequences of 8 bits 8 kHz A-law. Signal and annotation files are stored separately.

Each speaker uttered about 70 items, which consist of isolated digits, yes/no questions, common application words and phrases.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

Cette base orale contient des données du mandarin, tel qu'il est parlé à Shanghai en première ou deuxième langue/dialecte chinois. Le corpus comprend de la parole lue, y compris des chiffres et des mots de commandes choisis pour la réalisation de services télématiques. La base a été enregistrée au moyen d'une carte ISDN. Un total de 70 énoncés a été enregistré par chacun des quelques 1000 locuteurs (500 hommes, 500 femmes).

Chaque locuteur a prononcé les éléments suivants :

* chiffres isolés,
* oui/non,
* mots et phrases de commande courants.

La bases de données est fournie avec les caractères chinois et leur traduction en anglais, une transcription canonique en Pinyin et les marqueurs de tons, ainsi que plusieurs catégories d'événements acoustiques clairement audibles.

Les fichiers de parole sont stockés en séquences d'échantillons de 8 bits, 8 kHz, loi-A. Les fichiers d'annotation et de signaux sont stockés séparément.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.