El buscador diacrónico de la Biblioteca Virtual Miguel de Cervantes permite realizar búsquedas en las variantes de las palabras a través del tiempo. El corpus contiene 86 obras pertenecientes a la Biblioteca Virtual Miguel de Cervantes e impresas entre los años 1482 y 1647; cubre una variedad representativa de autores y géneros. Este corpus es una de las pocas colecciones de español histórico disponible bajo licencia abierta en la web de IMPACT. El corpus diacrónico del español compila alrededor de cien obras, con un total de 2 millones de palabras. Aproximadamente el 27% de las palabras en el corpus han sido anotadas con su lema, categoría gramatical (part of speech) y su forma moderna equivalente. Las categorías que han sido consideradas son abreviatura, adjetivo, adverbio, conjunción, determinante, interjección, nombre, nombre propio, número, preposición, pronombre, pronombre relativo y verbo. El interfaz con el buscador está accesible en el siguiente enlace. Cada término puede ir precedido de un prefijo:
- Si no se añade prefijo, el término denota una forma diacrónica.
- El prefijo modern# denota una forma moderna.
- El prefijo lemma# denota un lema.
- El prefijo pos# denota la categoría gramatical (part-of-speech).
No hay comentarios:
Publicar un comentario