Abstract
We intend on developing electronic dictionaries and Finite State Transducers for the automatic processing of the Albanian Language. We describe some peculiarities of this language and we explain how FST and generally speaking NooJ’s graphs enable to treat them. We point out agglutinated words, mixed words or ‘XY’ words that are not (or cannot be) listed into dictionaries and we use FST for their dynamic treatment. We take into consideration the problem of unknown words in a lately reformed language and the evolving of features in the dictionaries.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
References
Boitet, Chr.: Méthode d’Acquisition lexicale en TAO: des dictionnaires spécialisés propriétaires aux bases lexicales généralistes et ouvertes. TALN, 8E Conf. Sur le TALN. Tours, pp. 249–265 (2001)
Carré, R., Degrémont, J.F., Gross, M., Pierrel, J.-M., Sabah, G.: Langage Humain et Machine, Paris, Presses du CNRS (1991)
Gdaniec, C., Manandise, E., McCord, M.: Derivational Morphology to the rescue: How It Can Help Resolve Unfound Words in MT. In: Proceedings, Santiago de Compostela, Spain, pp. 129–131 (2001)
Gut, Chr., Brunet-Gut, A., Përnaska, R.: Parlons Albanais Paris L’Harmattan Paris (1999)
Habert, B., Nazarenko, A., Zweigenbaum, P., Bouaud, J.: Extending an existing specialized semantic lexicon. In: Rubio, A., Gallardo, N., Castro, R., Tejada, A. (eds.) First International Conference on Language Resources and Evaluation, Granada, pp. 663–668 (1998)
Hasani, Z.: Le Déclin de la Langue Albanaise? In: Shekulli (12 Novembre 2002)
Lagji, K.: Etude sur le Statut du Mot en Albanais dans le Cadre des Traitements Automatiques des Langues. In: Annotation Automatique de Relations Sémantiques et Recherche d’Informations: vers de Nouveaux Accès aux Savoirs. Université Paris-Sorbonne, 27-28 October, Paris (2006)
Murzaku, A.: Albanian Inverse Dictionary 32,005 words, http://www.lissus.com/resources_download.htm
Piton, O., Përnaska, R.: Etude de l’Albanais en Vue de Construire des Outils pour son Traitement Automatique, Journées NooJ Besançon (2005)
Piton, O., Përnaska, R.: Constitution de Dictionnaires Electroniques pour l’Albanais, et Grammaire du Groupe Nominal avec Nooj, Belgrade (2006)
Silberztein, M.: Dictionnaires électroniques et analyse automatique de textes. Le système INTEX. Masson Ed. Paris Milan Barcelone Bonn (1993)
Silberztein, M.: NooJ’s dictionaries. In: Proceedings of LTC, Poznan University (2005)
Tsoukermann, E., Jacquemin, Chr.: Analyse Automatique de la Morphologie Dérivationnelle, et Filtrage de Mots Possibles, Mots possibles et mots existants, Silexicales (28-29 april 1997), pp. 251–259 (1995)
Véronis, J., Ide, N.: Encodage des dictionnaires électroniques: problèmes et propositions de la TEI. In: Piotrowsky, D. (ed.) Lexicographie et informatique - Autour de l’informatisation du Trésor de la Langue Française. Actes du Colloque International de Nancy (29, 30, 31 mai 1995), pp. 239–261 (1995)
Wehrli, E.: L’analyse syntaxique des langues naturelles. Problèmes et Méthodes, Masson Ed. Paris Milan Barcelone (1997)
Author information
Authors and Affiliations
Editor information
Rights and permissions
Copyright information
© 2007 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Piton, O., Lagji, K., Përnaska, R. (2007). Electronic Dictionaries and Transducers for Automatic Processing of the Albanian Language. In: Kedad, Z., Lammari, N., Métais, E., Meziane, F., Rezgui, Y. (eds) Natural Language Processing and Information Systems. NLDB 2007. Lecture Notes in Computer Science, vol 4592. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-73351-5_38
Download citation
DOI: https://doi.org/10.1007/978-3-540-73351-5_38
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-73350-8
Online ISBN: 978-3-540-73351-5
eBook Packages: Computer ScienceComputer Science (R0)