Universitat Politècnica de Catalunya. Institut de Ciències de l'Educació
Hernandez Fernandez, Antoni
Catala Roig, Neus
2025-07-01
La lingüística quantitativa és un camp de la lingüística matemàtica àmpliament estudiat des del segle passat. Aquest projecte se centra en l'anàlisi de diverses lleis lingüístiques en el context del procés d'adquisició d'una llengua, en aquest cas, el català. Mitjançant tècniques de Processament del Llenguatge Natural (PLN) i l'ús d'eines computacionals, s'han investigat aquestes lleis en corpus de parlants en desenvolupament, des de la infància fins a l'adolescència avançada. Es distingeixen, d'una banda, les lleis relacionades amb la freqüència, el rang i la durada de les paraules, i de l'altra, les lleis semàntiques, que tenen en compte informació addicional com el nombre de significats. Finalment, s'analitza també el concepte de semanticitat, una mesura orientada a l'estudi de les xarxes lingüístiques i la seva estructura semàntica.
Quantitative linguistics is a field of Mathematical Linguistics that has been widely studied since the last century. This project focuses on the analysis of various linguistic laws in the context of language acquisition, specifically in Catalan. Using Natural Language Processing (NLP) techniques and computational tools, these laws have been investigated in corpora of developing speakers, ranging from early childhood to late adolescence. A distinction is made between laws related to frequency, rank, and duration of words, and semantic laws, which consider additional information such as the number of meanings. Finally, the concept of semanticity is also analyzed-a measure aimed at studying linguistic networks and their semantic structure.
La lingüística cuantitativa es un campo de la lingüística matemática ampliamente estudiado desde el siglo pasado. Este proyecto se centra en el análisis de diversas leyes lingüísticas en el contexto de la adquisición del lenguaje, específicamente en catalán. Mediante técnicas de Procesamiento del Lenguaje Natural (PLN) y herramientas computacionales, se han investigado dichas leyes en corpus de hablantes en desarrollo, desde la infancia hasta la adolescencia avanzada. Se distingue entre las leyes relacionadas con la frecuencia, el rango y la duración de las palabras, y las leyes semánticas, que consideran información adicional como el número de significados. Finalmente, también se analiza el concepto de semanticidad, una medida orientada al estudio de las redes lingüísticas y su estructura semántica.
Bachelor thesis
English
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Llenguatge natural; Natural language processing (Computer science); Mathematical linguistics; Lingüística quantitativa; Corpus; Freqüència; Rang; Semanticitat; Paraules de funció; Paraules de contingut; Quantitative linguistics; Rank; Semanticity; Function words; Content words; Content words; Tractament del llenguatge natural (Informàtica); Lingüística matemàtica
Universitat Politècnica de Catalunya
Open Access
Treballs acadèmics [82538]