Frames in places: visual common sense knowledge in context

Inicio | ¿Qué es? | Contacto

English | Català

Consultar RECERCAT

Por comunidades y
colecciones Por fecha Por autores Por títulos Por temas (CDU)

Consultar departamento

Por fecha Por autores Por títulos Por temas (CDU)

Estadisticas

Del documento Todo RECERCAT

Mi RECERCAT

Entrar Alertas por correo-e

Directorio de otros repositorios

RECERCAT Principal > Universitat Politècnica de Catalunya > Tesines i projectes i treballs de final de carrera > Visualizar documento

Para acceder a los documentos con el texto completo, por favor, siga el siguiente enlace: http://hdl.handle.net/2117/87825

Título:	Frames in places: visual common sense knowledge in context
Autor/a:	Puig Fernández, Xavier
Otros autores:	Massachusetts Institute of Technology; Marqués Acosta, Fernando; Torralba, Antonio
Abstract:	One of the goals of Computer Vision is to be able to understand real-world situations at the level humans can do. In order to adapt to a constantly changing world, we use common sense to comprehend and react to events even if we have never experienced them before. Despite progress made in many Computer Vision tasks, a deeper level of visual understanding still needs to be addressed in order to reach these capabilities. In this work, we propose Frames in Places, a dataset inspired by Minsky's Frame Theory which is aimed at harvesting visual common sense knowledge by containing descriptors of situations that are prototypical for a context. We further introduce a system designed to identify the situation happening in a given image and show how it is able to recognize events even when it has not seen them before.
Abstract:	Uno de los objetivos de la Visión por Computador es poder entender situaciones reales al nivel de los humanos. Para poder adaptarnos a un mundo en constante cambio, usamos el sentido común para a entender y reaccionar a eventos incluso cuando nunca antes los hemos experimentado. A pesar del progreso que se ha dado en muchos problemas en Visión por Computador, aún es necesario trabajar en un nivel de comprensión más profundo para poder llegar a estas capacidades. En este trabajo proponemos Frames in Places, una base de datos inspirada en la Teoría de Frames de Minsky cuyo objetivo es almacenar sentido común visual mediante descriptores sobre situaciones que son prototípicas en un contexto dado. Posteriormente, introducimos un sistema diseñado para reconocer estas situaciones en una imagen dada y demostramos como el sistema es capaz de identificar situaciones incluso cuando no han sido vistas anteriormente.
Abstract:	Un dels objectius de la Visió per Computador es poder entendre situacions reals al nivell dels humans. Per tal d’adaptar-nos a un m ́on en constant canvi, utilitzem el sentit comú per a entendre i reaccionar a esdeveniments fins i tot quan no els hem experimentat abans. Malgrat el progrés que s’ha donat en moltes tasques en Visió per Computador, encara és necessari adreçar un nivell de comprensió més profund per tal d’arribar a aquestes capacitats. En aquest treball, proposem Frames in Places, una base de dades inspirada en la Teoria de Frames de Minsky que té com a objectiu emmagatzemar sentit comú visual mitjançant de- scriptors sobre situacions que son prototípiques en un context donat. Posteriorment, introduim un sistema dissenyat per a identificar la situaci ́o que es dona en una imatge donada i demostrem com el sistema es capaç d’identificar situacions fins i tot quan no han sigut vistes abans.
Materia(s):	-Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació::Bases de dades -Computer vision -visual common sense -computer vision -frames -Visió per ordinador
Derechos:
Tipo de documento:	Trabajo/Proyecto fin de carrera
Editor:	Universitat Politècnica de Catalunya
Compartir:

Mostrar el registro completo del ítem

Accesibilidad | Aviso legal | Política de Cookies | Documentos de uso interno

Coordinación

Patrocinio