British English Source Lexicon (BESL) version 2.2

View resource name in all available languages

Lexique source de l’anglais britannique (British English Source Lexicon - BESL) version 2.2

ID:

ELRA-L0058

BESL is a complete database of the English lexicon. It consists of over 230,000 lemmas, over 350,000 word forms, 60,000 proper nouns, 3,000 abbreviations, and 58,000 multi-word compound nouns. Each headword is provided with a full listing of all inflected forms and other morphological variation. Every word form is marked for part of speech (using Penn TreeBank notation). Most single-word forms include a representation of IPA pronunciation. BESL covers both British and American English, and other spelling variants, with cross-references between corresponding forms. Each lemma is graded on a scale between 1 and 9 to indicate frequency, based on corpus evidence. Lemmas are also classified by domain, where appropriate (e.g. Computing, Religion). Obscene or offensive lemmas are marked using a 2-grade system. Proper name lemmas in BESL include personal names, surnames, place names, and brand names. BESL is provided in XML.

View resource description in all available languages

BESL est une base de données lexicale de l'anglais très complète et comprend plus de 230 000 lemmes, plus de 350 000 formes, 60 000 noms propres, 3 000 abréviations, et 58 000 mots composés. Chaque entrée est fournie avec une liste complète de toutes les formes fléchies, ainsi que d’autres variantes morphologiques. Chaque forme de mot est marquée sur la partie du discours (au moyen du système de notation du Penn TreeBank). La plupart des formes de mots simples incluent une représentation de leur prononciation en IPA. Le BESL couvre à la fois l’anglais britannique et l’anglais américain, ainsi que d’autres variantes de prononciation, et les références croisées entre les formes correspondantes. Chaque lemme est noté sur une échelle de 1 à 9 pour indiquer la fréquence, en fonction de sa présence dans le corpus. Les lemmes sont également classés par domaine (Informatique, Religion, par exemple). Les lemmes à caractère « obscène » ou « injurieux » sont marqués en utilisant un système d’échelle à 2 niveaux. Les noms propres du BESL comprennent des noms de personnes, prénoms, lieux et noms de marques. Le BESL est fourni en XML.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following: