Title:
|
Analysis of twitter traffic based on renewal densities; Análisis del tráfico de Twitter basado en densidades de renovación; Anàlisi del tràfic de Twitter basat en densitats de renovació
|
Author:
|
Esteban Zarza, Ángel Javier
|
Other authors:
|
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; University of Southern California; Ortega, Antonio |
Abstract:
|
[ANGLÈS] We propose a novel approach for Twitter traffic analysis based on renewal theory. Even though Twitter datasets are of increasing interest to researchers, extracting information from message timing remains somewhat unexplored. Our approach, extending our prior work on anomaly detection, makes it possible to characterize levels of correlation within a message stream, thus assessing how much interaction there is between those posting messages. Moreover, our method enables us to detect the presence of periodic traffic, which is useful to determine whether there is spam in the message stream. Because our proposed techniques only make use of timing information and are amenable to downsampling, they can be used as low complexity tools for data analysis. |
Abstract:
|
[CASTELLÀ] Proponemos un nuevo enfoque para el análisis de tráfico de Twitter basado en la teoría de la renovación. A pesar de que los conjuntos de datos de Twitter son de creciente interés para los investigadores, la extracción de información del tiempo entre mensajes sigue estando un tanto inexplorada. Nuestro enfoque, que extiende nuestro trabajo previo en la detección de anomalías, permite caracterizar los niveles de correlación dentro de una secuencia de mensajes, por lo tanto evaluar el grado de interacción que hay entre esos el envío de mensajes. Además, nuestro método nos permite detectar la presencia de tráfico periódico, que es útil para determinar si hay spam. Debido a que nuestras técnicas propuestas sólo hacen uso de la información de temporización y son susceptibles de disminución de la resolución, se pueden utilizar como herramientas de baja complejidad para el análisis de datos. |
Abstract:
|
[CATALÀ] Proposem un nou enfocament per a l'anàlisi de tràfic de Twitter basat en la teoria de la renovació. Tot i que els conjunts de dades de Twitter són de creixent interès per als investigadors, l'extracció d'informació del temps entre missatges segueix estant una mica inexplorada. El nostre enfocament, que estén el nostre treball previ en la detecció d'anomalies, permet caracteritzar els nivells de correlació dins d'una seqüència de missatges, per tant avaluar el grau d'interacció que hi ha entre aquests l'enviament de missatges. A més, el nostre mètode ens permet detectar la presència de trànsit periòdic, que és útil per determinar si hi ha spam. A causa que les nostres tècniques propostes només fan ús de la informació de temporització i són susceptibles de disminució de la resolució, es poden utilitzar com a eines de baixa complexitat per a l'anàlisi de dades. |
Subject(s):
|
-Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Telemàtica i xarxes d'ordinadors::Internet -Àrees temàtiques de la UPC::Informàtica::Enginyeria del software -Software engineering -Data mining -Twitter -renewal density -teoría de la renovación -estimació -Internet -Enginyeria de programari -Mineria de dades |
Rights:
|
Attribution-NonCommercial-NoDerivs 3.0 Spain
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Document type:
|
Bachelor Thesis |
Published by:
|
Universitat Politècnica de Catalunya
|
Share:
|
|