Spelling Normalisation of Basque Historical Texts
Normalización de Textos Históricos Vascos
Abstract
This paper presents a computational method and its evaluation in a real scenario with the aim of normalising Basque historical texts in order to be analysed using standard Natural Language Processing tools (NLP). This normalisation work is part of a more general ongoing project called Basque in the Making (BIM): A Historical Look at a European Language Isolate, whose main objective is the systematic and diachronic study of a number of grammatical features of the Basque language.
En este artículo se presenta y evalua en un entorno real un método computacional con el objetivo de normalizar textos históricos vascos para que, una vez normalizados, puedan ser analizados con herramientas estándar de Procesamiento
del Lenguaje Natural (PLN). Este trabajo de normalización forma parte de un proyecto en curso más general llamado Basque in the Making (BIM): A Historical Look at a European Language Isolate, cuyo objetivo principal es el estudio sistemático y diacrónico de ciertas características gramaticales de la lengua vasca.