ADN-classifier: automatically assigning denotation types to nominalizations

Inici | Què és? | Contacte

English | Castellano

Consultar RECERCAT

Per comunitats i
col·leccions Per data Per autors Per títols Per matèries

Consultar col·lecció

Per data Per autors Per títols Per matèries

Estadístiques

Del document Tot RECERCAT

El meu RECERCAT

Entrar Alertes per correu-e

Directori d’altres repositoris

Pàgina inicial del RECERCAT > Universitat Politècnica de Catalunya > Documents de recerca > Visualitza document

Per accedir als documents amb el text complet, si us plau, seguiu el següent enllaç: http://hdl.handle.net/2117/10374

Títol:	ADN-classifier: automatically assigning denotation types to nominalizations
Autor/a:	Peris, Aina; Taulé, Mariona; Boleda Torrent, Gemma; Rodríguez Hontoria, Horacio
Altres autors:	Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics; Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural
Abstract:	This paper presents the ADN-Classifier, an Automatic classification system of Spanish Deverbal Nominalizations aimed at identifying its semantic denotation (i.e. event, result, underspecified, or lexicalized). The classifier can be used for NLP tasks such as coreference resolution or paraphrase detection. To our knowledge, the ADN-Classifier is the first effort in acquisition of denotations for nominalizations using Machine Learning.We compare the results of the classifier when using a decreasing number of Knowledge Sources, namely (1) the complete nominal lexicon (AnCora-Nom) that includes sense distictions, (2) the nominal lexicon (AnCora-Nom) removing the sense-specific information, (3) nominalizations’ context information obtained from a treebank corpus (AnCora-Es) and (4) the combination of the previous linguistic resources. In a realistic scenario, that is, without sense distinction, the best results achieved are those taking into account the information declared in the lexicon (89.40% accuracy). This shows that the lexicon contains crucial information (such as argument structure) that corpus-derived features cannot substitute for.
Abstract:	Peer Reviewed
Matèries:	-Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Llenguatge natural -Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic -Spanish Deverbal Nominalizations (Classification system) -ADN-Classifier (Automatic classification system) -Natural language processing (Computer science) -Computational linguistics -- Research -Lingüística computacional -Corpus (Lingüística) -Castellà -- Lexicografia
Drets:
Tipus de document:	Article - Versió publicada Objecte de conferència
Compartir:

Mostra el registre complet del document

Documents relacionats

Altres documents del mateix autor/a

Semantic annotation of deverbal nominalizations in the Spanish corpus AnCora

Peris, Aina; Taulé, Mariona; Rodríguez Hontoria, Horacio

IARG-AnCora: Annotating the AnCora corpus with implicit arguments

Peris, Aina; Taulé, Mariona; Rodríguez Hontoria, Horacio

SemEval-2010 Task 1: coreference resolution in multiple languages

Recasens Potau, Marta; Martí, Toni; Taulé, Mariona; Màrquez Villodre, Lluís; Sapena Masip, Emilio

Towards a VRQS representation

Taulé, Mariona

Mental processes in the oral production of non-native spanish speakers: pauses and self-correction

Enríquez, Núria; Díaz Rodríguez, Lourdes, 1964-; Taulé, Mariona

Accessibilitat | Avís legal | Política de Cookies | Documents d'ús intern

Coordinació

Patrocini