Análisis de la riqueza léxica en el contexto de la clasificación de atributos demográficos latentes

Fecha de publicación

2019-03-14T08:54:49Z

2019-03-14T08:54:49Z

2012-06-01

2019-03-14T08:54:49Z

Resumen

In this paper we analyse the utility of lexical richness measures for predicting latent user attributes from Spanish opinionated texts. Our aim is to know how useful could be lexical richness to predict user's gender, age and regional origin. To this end, we applied 32 lexical richness measures over 1911 previously labeled texts with demographic information. This approach has the advantage that it is domain-independent with modest computational cost.

Tipo de documento

Artículo


Versión publicada

Lengua

Castellano

Publicado por

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documentos relacionados

Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4493

Procesamiento del lenguaje natural , 2012, num. 48, p. 97-104

Citación recomendada

Esta citación se ha generado automáticamente.

Derechos

(c) Roberto, John et al., 2012

Este ítem aparece en la(s) siguiente(s) colección(ones)