Base de données de transcriptions de TED (Translanguage English Database)



LDC reference:

The Translanguage English Database (TED) Transcripts corpus contains transcriptions of thirty-nine of the 188 speeches of the TED Corpus made at Eurospeech'93 in Berlin. The thirty-nine transcripts in this publication are in Universal Transcription Format (UTF) and were prepared by the LDC. All utf files in the transcript publication were validated against an included utf.dtd. Tables containing speaker demographic information and a cross-reference of file names from the TED audio corpus are included.

Référence LDC :

Le corpus de transcriptions de TED (Translanguage English Database) comprend les transcriptions de 39 des 188 présentations du corpus TED (réf. ELRA : ELRA-S0031 ; réf LDC : LDC2002S04) et réalisé à Eurospeech'93 à Berlin. Les 39 transcriptions de cette publication sont au format UTF (Universal Transcription Format) et ont été préparées par LDC. Chaque fichier utf de la version transcrite a été validé et est en conformité avec la DTD utf incluse. Les tables contenant les informations démographiques des locuteurs et de référence croisée des noms de fichier avec le corpus audio TED sont fournies.

