16.5.08

Curso de Verano en Tecnologías Lingüísticas

TÉCNICAS DE EXTRACCIÓN Y VISUALIZACIÓN DE INFORMACIÓN: APLICACIÓN EN LA CONSTRUCCIÓN DE PORTALES ESPECIALIZADOS

Fecha: 7-11 de julio de 2008
Lugar de celebración: Convento de la Merced, Fundación Duques de Soria, Soria
Dirige: M. Felisa Verdejo
Duración: 30 horas

Hoy en día, dada la ingente cantidad de información disponible en la Web, se hace necesario contar con sistemas permitan proporcionar al usuario un acceso a la información de forma condensada. El presente curso está centrado en extracción y visualización de la información y se ha organizado en dos partes: por un lado, una introducción al estado actual de las tecnologías y, por otro, la presentación de distintas aplicaciones de estas técnicas.

Las ponencias serán impartidas por expertos del ámbito académico e industrial con publicaciones recientes en este campo y experiencia en proyectos internacionales de I+D. Como en ediciones anteriores, para dar a los jóvenes investigadores una oportunidad de difundir y recibir realimentación sobre su trabajo, existe la posibilidad de que los asistentes presenten sus aportaciones durante el curso.

En este curso imparto una sesión dedicada a las aplicaciones de la clasificación de texto en la seguridad de contenidos: email y Web spam, y filtrado de contenidos.

Más información http://www.mavir.net/index.php/Evento/Curso-TL-2008.html
Programa completo: http://www.mavir.net/docs/CursoTecnologiasLing_2008.pdf

2 comentarios:

A.Saz dijo...

Hola José María,

¿Puedes hacer un resumen de lo que vas a exponer o el guión? En principio solo me interesan tu exposición y la de Paulo Villegas, pero me gustaría tener más información antes de darme el paseo hasta Soria.

Gracias,

Antonio

Jose Maria Gomez Hidalgo dijo...

Claro, como no. En unos días pondré un esquema, auqnue aún me faltan algunos detalles por refinar.

La idea global es enfocar las tareas de email spam filtering, web filtering y web spam detection como tareas de categorización de texto, y ver que representaciones de texto, algoritmos de aprendizaje y técnicas de evaluación se han propuesto. En la presentación, de unas dos horas, haré demostraciones con WEKA sobre datasets usados en competiciones, para demostrar los conceptos.