Karl May Korpus (KMK)



The "Karl-May-Korpus" is a monolingual German corpus, available in an SGML-tagged ASCII text format. It contains the works of the German author Karl May (1842-1912) and consists of around 1.6 million words (divided into 9 subcorpora of about 180,000 words each). The corpus was created between 1993 and 1997.

Each word form is tagged with a word class (1 out of 43 classes) and appropriate lemma.

File format: Text
Standard in use: SGML
Character set: 8-bit ASCII

Le Karl-May-Korpus est un corpus allemand monolingue, sous format texte ASCII balisé SGML. Il contient les oeuvres de l'auteur allemand Karl May (1842-1912) et comprend environ 1,6 million de mots (9 sous-corpus de 180 000 mots chacun environ). Le corpus a été créé entre 1993 et 1997.

Chaque forme de mot est balisée avec la classe de mot (1 sur 43 classes) et le lemme appropriés.

Format de fichier : Texte
Standard utilisé : SGML
Jeu de caractères : ASCII 8-bit

