Discurse Marker Characterisation Via Clustering: Extrapolation from Supervised to Unsupervised Corpora

Data de publicació

2019-03-11T15:10:09Z

2019-03-11T15:10:09Z

2002

2019-03-11T15:10:10Z

Resum

In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.

Tipus de document

Article


Versió publicada

Llengua

Anglès

Publicat per

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documents relacionats

Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3257

Procesamiento del lenguaje natural , 2002, num. 29, p. 223-230

Citació recomanada

Aquesta citació s'ha generat automàticament.

Drets

(c) Alonso, Laura et al., 2002

Aquest element apareix en la col·lecció o col·leccions següent(s)