dc.contributor |
Universitat Oberta de Catalunya |
dc.contributor.author |
Castaño Ribes, Rafel |
dc.date |
2011-06-28T14:31:16Z |
dc.date |
2011-06-28T14:31:16Z |
dc.date |
2011-06-15 |
dc.date.accessioned |
2011-07-26T12:14:08Z |
dc.date.available |
2011-07-26T12:14:08Z |
dc.date.issued |
2011-07-26T12:14:08Z |
dc.identifier.uri |
http://hdl.handle.net/10609/8016 |
dc.language.iso |
cat |
dc.publisher |
Universitat Oberta de Catalunya |
dc.rights |
http://www.gnu.org/licenses/gpl.html |
dc.subject |
anotacions semàntiques |
dc.subject |
normalització d'etiquetes |
dc.subject |
anàlisi de notícies |
dc.subject |
anotaciones semánticas |
dc.subject |
semantic annotations |
dc.subject |
normalización de etiquetas |
dc.subject |
standard tags |
dc.subject |
análisis de noticias |
dc.subject |
news analysis |
dc.subject |
Electronic newspapers |
dc.subject |
Mass media |
dc.subject |
Premsa electrònica -- Innovacions tecnològiques |
dc.subject |
Mitjans de comunicació de massa |
dc.subject |
Prensa electrónica -- Innovaciones tecnológicas |
dc.subject |
Medios de comunicación de masas |
dc.title |
NewsAnalyzer : un analitzador de notícies etiquetades |
dc.type |
Bachelor thesis |
dc.description.abstract |
En aquest treball es pretén abordar la problemàtica de confirmar o refutar si determinades fonts de notícies online mostren algun tipus de biaix que a priori un lector podria detectar per simple intuïció. Per simplificar les tasques d'anàlisi es treballa amb fonts de notícies que disposen d'APIs d'accés als seus articles i que, a més a més, proporcionen anotacions semàntiques (etiquetes) associades a cada notícia a mode de classificació d'aquestes. Per complir amb els objectius plantejats s'analitza i millora un mètode descrit en la bibliografia que permet dur a terme una anàlisi de les etiquetes per tal d'obtenir i aplicar un vocabulari comú a les diferents fonts (procediment de normalització). El programari resultant es presenta com una aplicació implementada en Java i MySQL que recol·lecta notícies anotades semànticament de diferents fonts de notícies online (els diaris The Guardian i The New York Times), les analitza i permet visualitzar els resultats en funció del vocabulari normalitzat per tal d'extreure conclusions sobre quins són els temes més tractats per cada font. Finalment, s'analitzen els resultats obtinguts, es discuteixen i s'extreuen una sèrie de conclusions sobre el mètode de normalització i classificació emprats i es proposen possibles millores per al futur de l'aplicació. |
dc.description.abstract |
En este trabajo se pretende abordar la problemática de confirmar o refutar si determinadas fuentes de noticias online muestran algún tipo de sesgo que a priori un lector podría detectar por simple intuición. Para simplificar las tareas de análisis se trabaja con fuentes de noticias que disponen de APIs de acceso a sus artículos y que, además, proporcionan anotaciones semánticas (etiquetas) asociadas a cada noticia a modo de clasificación de las mismas. Para cumplir con los objetivos planteados se analiza y mejora un método descrito en la bibliografía que permite llevar a cabo un análisis de las etiquetas para obtener y aplicar un vocabulario común a las diferentes fuentes (procedimiento de normalización). El software resultante se presenta como una aplicación implementada en Java y MySQL que recolecta noticias anotadas semánticamente de diferentes fuentes de noticias online (los diarios The Guardian y The New York Times), las analiza y permite visualizar los resultados en función del vocabulario normalizado para extraer conclusiones sobre cuáles son los temas más tratados por cada fuente. Finalmente, se analizan los resultados obtenidos, se discuten y se extraen una serie de conclusiones sobre el método de normalización y clasificación utilizados y se proponen posibles mejoras para el futuro de la aplicación. |
dc.description.abstract |
This paper aims to tackle the problem of confirming or refuting whether certain online newspapers show some kind of a priori bias that a reader could detect by simple intuition. |