Dónde:    Centro de Modelación y Computación Científica, Universidad de La Frontera (UFRO), Temuco-Chile

Cuándo:  19-22 de enero 2016

 
En la Universidad de la Frontera, queremos aprender sobre las herramientas de HPC utilizadas en el análisis del Big Data. Daremos cursos sobre las GPUs y los procesadores Xeon Phi de Intel como las tecnologías que se usan actualmente para poder procesar enormes grupos de datos así como también nuevas técnicas en Data Mining para mejorar la comprensión y el modelamiento del Big Data.

Nuestros expositores invitados:

  • Federico Meza, Universidad de Talca, Chile
  • Alba Melo, Universidad de Brasilia, Brasil
  • Verónica Gil-Costa, Universidad de San Luis, Argentina
  • Manuel Ujaldón, Universidad de Málaga, España
  • Thomas Fober, Philipps-Universität Marburg, Alemania
  • Ricardo Barrientos, Universidad de La Frontera, Chile
  • Bárbara Russo, Universidad de Bolzano, Italia
  • Tzu-Chiang Shen, ALMA Observatory
  • Martin Cabrera Aguilar, Everis Chile
  • Mauricio Marín, Universidad de Santiago de Chile
  • Óscar Peredo, Telefónica, Chile

 

hpc
 

Algunas de las charlas:

Búsqueda por Similitud en la Era de Big Data por Verónica Gil-Costa

En la actual era de Big Data, se ha incrementado exponencialmente la generación, publicación de datos y contenidos diversos y heterogéneos. No solo datos textuales, sino datos multimediales como videos (ej. En YouTube) e imágenes. Este crecimiento ha tenido su mayor potencialidad debido a las redes sociales y la interacción de los usuarios. En este escenario, la búsqueda por similitud es un proceso que consume mucho tiempo y por lo tanto surgen desafíos de investigación para el desarrollo de técnicas destinadas a indexar y recuperar información en distintas fuentes y formatos, distribuida a través de servidores o computadoras personales. En otras palabras, se desea obtener tecnologías escalables para que la búsqueda por similitud sea eficiente sobre colecciones de datos grandes.

Taller Intel Xeon Phi por Ricardo Barrientos

Desde el año 2012 se ha lanzado al mercado por parte de Intel un coprocesador denominado Xeon Phi. Este coprocesador es usado como un dispositivo de alto rendimiento, especializado en maximizar las operaciones en punto flotante por segundo. La Xeon Phi está compuesto de hasta 61 núcleos conectados mediante un anillo bidireccional.
En el taller se mostrarán los distintos componentes de la arquitectura en una Intel Xeon Phi. También, se verán ejemplos y ejercicios para darle al asistente una visión y formación introductoria a la programación en Xeon Phi.
Es recomendable que el asistente tenga conocimientos de lenguaje C.

Procesamiento de Big Graph mediante Apache Giraph por Federico Meza

Los analistas de Big Data tratan de extraer información de utilidad a partir de grandes volúmenes de datos generados dinámicamente. En muchos de estos casos se quiere aprovechar además las conexiones existentes entre entidades de datos que han sido modeladas como estructuras de grafos. Sin embargo, analizar grafos es más costoso computacionalmente y las herramientas existentes como Hadoop no se adaptan adecuadamente a los algoritmos iterativos que es necesario ejecutar, ni al carácter exploratorio de estos algoritmos.
Apache Giraph puede ser visto como una implementación libre de Google Pregel, que corre como un job de sólo map sobre Hadoop. Los programas siguen un modelo de programación centrado en los vértices («think like a vertex»), que hace que el programador deba especificar el comportamiento de los vértices del grafo, mientras intercambian mensajes con otros vértices en un entorno sincronizado como el modelo BSP (Bulk Synchronous Parallel). Giraph provee al programador de un framework que le permite ejecutar algoritmos iterativos sobre grafos de escala masiva, los que pueden paralelizarse fácilmente sobre clusters de bajo costo, entregando además un alto nivel de tolerancia a fallas.
En esta charla se introduce Apache Giraph y los problemas a los que está orientado, su arquitectura y cómo se ejecuta en el ecosistema de Hadoop. Además, se presenta la estructura de una aplicación en función de la API disponible y se muestran ejemplos de programas reales sobre grafos.

Movilidad urbana con datos de telefonía: desafíos en Big Data y HPC por Óscar Peredo

Desde hace aproximadamente una década, diversos grupos de investigación multi-disciplinarios han estudiado la movilidad urbana utilizando datos de telefonía cuyo uso original era para realizar facturación. Recientemente, Telefónica ha comenzado a analizar este tipo de datos (Movistar) para inferir patrones de comportamiento de los usuarios de la red. En esta charla se presentará una descripción de los datos utilizados (voz y datos) y algunos modelos descriptivos/predictivos construidos para distintas ciudades de Chile.
 
Revisa el programa aquí
Para más información visita el website del evento aquí
Fuente: UFRO.CL