TC-STAR male baseline voice: Ian

View resource name in all available languages

Voix d’homme de référence TC-STAR: Ian

ID:

ELRA-S0303

Ian was created within the scope of the TC-STAR project (IST- FP6-506738) funded by the European Commission.

Ian contains the recordings of one male English (British) speaker recorded in a noise-reduced room through a headset microphone. It consists of the recordings and annotations of read text material of approximately 10 hours of speech for baseline applications (Text-to-Speech systems). This database is distributed on 9 DVDs. The database complies with the common specifications created in the TC-STAR project.

The annotation of the database includes manual orthographic transcriptions, the automatic segmentation into phonemes and automatic generation of pitch marks. A certain percentage of phonetic segments and pitch marks has been manually checked. A pronunciation lexicon in SAMPA with POS, lemma and phonetic transcription of all the words prompted and spoken is also provided.

Speech samples are stored as sequences of 24-bit 96 kHz with the least significant byte first (“lohi” or Intel format) as (signed) integers. Each prompted utterance is stored in a separate file. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.

The TC-STAR female baseline voice: Laura is also available via ELRA under reference ELRA-S0302.

View resource description in all available languages

Ian a été créé dans le cadre du projet TC-STAR (IST- FP6-506738) financé par la Commission européenne.

Ian comprend les enregistrements d’un locuteur anglais (britannique) homme enregistré par micro-casque dans une salle à bruit réduit. Il consiste en des enregistrements et annotations de matériel textuel lu pour environ 10 heures de parole pour des applications de référence (systèmes texte-parole). Cette base de données est distribuée sur 9 DVD. Elle respecte les spécifications communes créées dans le projet TC-STAR.

L’annotation de la base de données inclut les transcriptions orthographiques réalisées manuellement, la segmentation automatique en phonèmes et la génération automatiques des marques de pitch. Un certain pourcentage de segments phonétiques et de marques de pitch a été vérifié manuellement. Un lexique de prononciation en SAMPA avec partie du discours, lemmes et transcription phonétique de tous les mots lus et prononcés est également fourni.

Les fichiers de parole sont stockés en séquences d’échantillons de 24-bit 96 kHz avec l’octet le moins significatif en premier (“lohi” ou format Intel) en entiers (signés). Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

La voix de femme de référence TC-STAR: Laura est également disponible via ELRA sous la référence ELRA-S0302.

You don’t have the permission to edit this resource.