Dialectometric Treatment of the Bourciez Corpus from 1895 - Archive ouverte HAL Access content directly
Journal Articles Géolinguistique Year : 2017

Dialectometric Treatment of the Bourciez Corpus from 1895

Le traitement dialectométrique du corpus Bourciez de 1895

(1) , (2)
1
2

Abstract

This contribution shows the way to carry out the geolinguistic exploitation of texts gathered in 19th century by É. Bourciez, using different automatic tools. After typing the manuscript in a word processor, we used “Simple Concordance Program” to create the list of words of the 150 Basque texts of the collection. Afterwards, we introduced all of the words in a database and we did the lemmatisation process, with a program made ad hoc, to use in a geolinguistic way. And the final step was to exploit the data in the dialectometric way using the VDM program conceived by Hans Goebl.
Cette contribution montre la manière d’exploiter à l’aide de la géolinguistique des textes recueillis au xixe siècle par É. Bourciez en utilisant différents outils automatiques. Après avoir tapé le manuscrit dans un traitement de texte, nous avons utilisé « Simple Concordance Program » pour créer la liste de mots des 150 textes basques de la collection. Ensuite, nous avons introduit tous les mots dans une base de données et nous avons fait le processus de lemmatisation, avec un programme créé ad hoc, utilisé de manière géolinguistique. Et la dernière étape a consisté à exploiter les données de manière dialectométrique à l’aide du programme VDM conçu par Hans Goebl.

Dates and versions

hal-02553924 , version 1 (24-04-2020)

Identifiers

Cite

Charles Xarles, C., X. Videgain, Gotzon Aurrekoetxea. Le traitement dialectométrique du corpus Bourciez de 1895. Géolinguistique, 2017, Varia, 17, pp.49--98. ⟨10.4000/geolinguistique.431⟩. ⟨hal-02553924⟩
22 View
0 Download

Altmetric

Share

Gmail Facebook Twitter LinkedIn More