Guía de técnicas, estrategias y herramientas en el diseño y desarrollo de generadores automáticos del lenguaje
DOI:
https://doi.org/10.17561/rilex.6.3.8087Palabras clave:
generadores automáticos del lenguaje natural, WordNet, ontología, significado relacional y categorialResumen
Este capítulo aborda la descripción de diferentes técnicas, métodos y herramientas desarrolladas y aplicadas para el diseño de la cadena de generadores descrita en el capítulo 1 de este volumen. Tanto el método combinado, como los generadores y el conjunto de recursos que los soportan se asientan en principios de sostenibilidad, interoperabilidad y retroalimentación de datos.
Descargas
Referencias
Álvez, J., Atserias, J., Carrera, J., Climent, S., Laparra, E., Oliver, A. & Rigau, G. (2008). Complete and consistent annotation of wordnet using the top concept ontology. En N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis & D. Tapias (eds.) Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08) (pp. 1529–1534). European Language Resources Association (ELRA). https://adimen.si.ehu.es/~rigau/publications/gwc08-tco.pdf
Atkins, B. T. S. & Rundell, M. (2008). The Oxford Guide to Practical Lexicography. Oxford University Press.
Bentivogli, L., Forner, P., Magnini, B. & Pianta, E. (2004). Revising WordNet Domains Hierarchy: semantics, coverage, and balancing. Proceedings of the Workshop on Multilingual Linguistic Ressources. MLR ’04 (pp. 101–108). Association for Computational Linguistics. https://doi.org/10.3115/1706238.1706254
Domínguez Vázquez, M.ª J. (2011). Kontrastive Grammatik und Lexikographie: spanisch-deutsches Wörterbuch zur Valenz des Nomens. Iudicium.
Domínguez Vázquez, M.ª J. (2021). Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis zum automatischen Wörterbuch. Lexikos, 31, 20–50. https://doi.org/10.5788/31-1-1623
Domínguez Vázquez, M.ª J. (2022). Contribución de la semántica combinatoria al desarrollo de herramientas digitales multilingües. Círculo de Lingüística Aplicada a la Comunicación, 90, 171–18.
Domínguez Vázquez, M.ª J., Bardanca Outeiriño, D. & Simões, A. (2021). Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2021 conference (pp. 269–287). Lexical Computing CZ. https://elex.link/elex2021/wp-content/uploads/2021/08/eLex_2021_16_pp269-287.pdf
Domínguez Vázquez, M.ª J., Solla Portela, M. A. & Valcárcel Riveiro, C. (2019). Resources interoperability: Exploiting lexicographic data to automatically generate dictionary examples. En I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreria, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek S. & C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference (pp. 51–71). Lexical Computing CZ. https://elex.link/elex2019/wp-content/uploads/2019/09/eLex_2019_4.pdf
Domínguez Vázquez, M.ª J. & Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Rivero (eds.), Studies on multilingual lexicography (pp. 135–158). De Gruyter. https://doi.org/10.1515/9783110607659-008
Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. Iudicium.
Gómez Guinovart, X. (2011). Galnet: WordNet 3.0 do galego. Linguamática, 3(1), 61–67.
Gómez Guinovart, X. & Solla Portela, M. A. (2018). Construyendo el WordNet gallego: métodos y aplicaciones. Recursos y evaluación de idiomas, 52(1), 317–339.
González Agirre, A., Laparra, E. & Rigau, G. (2012). Multilingual Central Repository version 3.0: upgrading a very large lexical knowledge base. Proceedings of the Sixth International Global WordNet Conference (GWC’12). Japón. https://adimen.si.ehu.es/~rigau/publications/gwc12-glr.pdf
Hashimoto, T., Zhang, H. & Liang, P. (2019). Unifying Human and Statistical Evaluation for Natural Language Generation. En J. Burstein, C. Doran & T. Solorio (eds.), Proceedings of the 2019 Conference of the North American Association for Computational Linguistics: Human Language Technologies. Vol I. (pp. 1689–1701). Association for Computational Linguistics. https://doi.org/10.18653/v1/N19-1169
Izquierdo Beviá, R. Suárez Cueto, A. & Rigau, G. (2007). Exploring the automatic selection of basic level concepts. En R. Mitkov, G. Angelova & K. Bontcheva (eds.), Proceedings of the International Conference on Recent Advances in Natural Language Processing (pp. 298–302). Shoumen. https://adimen.si.ehu.es/~rigau/publications/ranlp07-isr.pdf
Mikolov, T., Chen, K., Corrado, G. & Dean, J. (2013). Efficient estimation of word representations in vector space. En Y. Bengio & Y. LeCun (eds.), Proceeding of the International Conference on Learning Representations. Workshop Track (pp. 1–12). Conference Track Proceedings. https://arxiv.org/pdf/1301.3781.pdf
Miller, G. A, Beckwith, R., Fellbaum, C., Gross, D. & Miller, K. J. (1990). Introduction to WordNet: an on-line lexical database. International Journal of Lexicography, 3(4), 235–244. https://doi.org/10.1093/ijl/3.4.235
Niles, I. & Pease, A. (2001). Towards a standard upper ontology. FOIS ’01. Proceedings of the International Conference on Formal Ontology in Information Systems (pp. 2–9). ACM. https://doi.org/10.1145/505168.505170
Pennington, J., Socher, R. & Manning, C. (2014). GloVe: Global Vectors for Word Representation. En A. Moschitti, B. Pang & W. Daelemans (eds.), Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) (pp. 1532–1543). Association for Computational Linguistics. https://doi.org/10.3115/v1/D14-1162
Simões, A. & Gómez Guinovart, X. (2014). Bootstrapping a Portuguese WordNet from Galician, Spanish and English Wordnets. En J. L Navarro Mesa, A. Ortega, A. Teixeira, E. Hernández Pérez, P. Quintana Morales, A. Ravelo García, I. Guerra Moreno, D. T. Toledano (eds.), Advances in Speech and Language Technologies for Iberian Languages (pp. 239–248). Springer. https://doi.org/10.1007/978-3-319-13623-3_25
Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En M.ª J. Domínguez Vázquez & S. Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía (pp. 193–207). De Gruyter. https://doi.org/10.1515/9783110420784-015
Recursos propios
CombiContext = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. & Pino Serrano, L. (2021). CombiContext. Prototipo online para la generación automática de contextos frasales y oraciones de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/combinatoria/verbal
Combina = Recuperado el 28 de noviembre de 2022, de http://portlex.usc.gal/develop/combina.php
Combinatoria = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. & Pino Serrano, L. (2020). Combinatoria. Prototipo online para la generación biargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Instituto da Lingua Galega. Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/combinatoria/usuario
Flexiona = Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/develop/flexiona.php
Flexionador = Consultado el 28 de noviembre de 2022. https://ilg.usc.gal/flexionador/
Lematiza = Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/develop/lematiza/
Ontología léxica = Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Bardanca Outeiriño, D. (2021). Ontología léxica. Universidade de Santiago de Compostela. Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/ontologia/
Portlex = M.ª J. Domínguez Vázquez (dir.), Valcárcel Riveiro, C., Mirazo Balsa, M., Sanmarco Bande, M. T., Simões, A. & Vale, M. J. (2018). Portlex. Diccionario multilingüe de la valencia del nombre. Universidade de Santiago de Compostela. Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/portlex/
TraduWord = Consultado el 28 de noviembre de 2022. https://ilg.usc.gal/es/proxectos/interoperabilidad-de-recursos-y-produccion-automatica-de-lenguaje-natural-0
Xera = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. & Pino Serrano, L. (2020). Xera. Prototipo online para la generación automática monoargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Consultado el 28 de noviembre de 2022. http://portlex.usc.gal/combinatoria/usuario
XeraWord = Domínguez Vázquez, M.ª J. (dir.), Bardanca Outeiriño, D., Caíña Hurtado, M., Gómez Guinovart, X., Iglesias Allones, J. J., Simões, A., Valcárcel Riveiro, C., Álvarez de la Granja, M. & Cidrás Escaneo, F. A. (2020). XeraWord. Prototipo de xeración automática da argumentación da frase nominal en galego e portugués. Santiago de Compostela: Instituto da Lingua Galega. Consultado el 28 de noviembre de 2022. http://ilg.usc.gal/xeraword/
Recursos externos
Open Multilingual Wordnet = Bond, F. & Foster, R. (2013). Linking and Extending an Open Multilingual Wordnet. En H. Schuetze, P. Fung, M. Poesio (eds.), 51st Annual Meeting of the Association for Computational Linguistics: ACL-2013 (pp. 1352–1362). Association for Computational Linguistics.
FreeLing = Consultado el 28 de noviembre de 2022. http://nlp.lsi.upc.edu/freeling/
Galnet = Consultado el 28 de noviembre de 2022 http://sli.uvigo.gal/galnet/
MCR = Multilingual Central Repository. Consultado el 28 de noviembre de 2022. https://adimen.si.ehu.es/web/MCR
MyMemmory = Consultado el 28 de noviembre de 2022. https://mymemory.translated.net/
PULO = Consultado el 28 de noviembre de 2022. http://wordnet.pt/
Spacy = Consultado el 28 de noviembre de 2022. https://spacy.io/; Honnibal, M., & Montani, I. (2017). spaCy 2: Natural language understanding with Bloom embeddings, convolutional neural networks and incremental parsing, 411–420.
Sketch Engine = Consultado el 28 de noviembre de 2022. https://www.sketchengine.eu
PULO = Consultado el 28 de noviembre de 2022. http://wordnet.pt/
UWN/MENTA = de Melo, G. & Weikum, G. (2010). Towards Universal Multilingual Knowledge Bases. En P. Bhattacharyya, C. Fellbaum & P. T. J. M. Vossen (eds.) (2010), Principles, construction and application of Multilingual Wordnets. Proceedings of the Fifth Global WordNet Conference (pp. 149–156). Narosa Publishing House. https://doi.org/10.1145/1871437.1871577
Wikimedia = Consultado el 28 de noviembre de 2022. https://commons.wikimedia.org/wiki/Main_Page
WOLF = Wordnet Libre du Français – Sagot, B. & Fišer, D. (2008). Building a free French wordnet from multilingual resources. En N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis, D. Tapias (eds.), Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08). European Language Resources Association (ELRA).
WordNet = https://wordnet.princeton.edu/
Publicado
Número
Sección
Licencia
Derechos de autor 2023 Daniel Bardanca Outeiriño, María José Domínguez Vázquez
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
1. Política propuesta para revistas que ofrecen acceso abierto
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cual estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación en esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto).