Información general de la asignatura

PROCESAMIENTO DISTRIBUIDO DE DATOS MASIVOS

  • 010683
  • 3
  • ÁREA ACADÉMICA INDUSTRIAS Y TECNOLOGÍAS DIGITALES

PRESENTACIÓN

Las Bases de Datos Relacionales (BD) se consideran una tecnología genérica, y su éxito se evidencia en la utilización de las mismas. Prácticamente todas las actividades económicas requieren el procesamiento de información. Sin embargo, el auge en el uso de Internet desde el principio de
este siglo, y otros factores como el uso de dispositivos que generan datos todo el tiempo, ha creado desafíos en tres dimensiones: volumen, velocidad y variedad (denominados lastres Vs), aunque a menudo se hablan de más.
El volumen es un factor clave ya que en el mundo se generan 2.5 quintillones de bytes de datos
diariamente. Debido al incremento en el volumen de datos que se están generando (sobre todo de
forma automatizada), el 90% de los datos que existen en el mundo han sido creados en los últimos
2 años. La velocidad se debe a que es necesario procesar flujos de datos (streams) sin demora y de forma confiable (por ejemplo, para detectar fraude en las transacciones de las tarjetas de crédito).
La variedad se refiere al hecho que los datos generados hoy-en-día son cada vez más heterogéneos
y complejos: comprenden texto libre, datos semi-estructurados, BD relacionales e incluso flujos de video.
Las herramientas convencionales, aunque siguen siendo vigentes para la mayoría de los casos de
uso, se ven limitadas ante semejantes desafíos.

OBJETIVO DE APRENDIZAJE

Aprender de temas avanzados de BDs relacionales, en especial las distribuidas, y finalizarse con tecnologías NoSQL, que representan un nuevo paradigma en el almacenamiento y la recuperación de la información.

Reconocimiento personería jurídica: Resolución 2613 del 14 de agosto de 1959 Minjusticia.

Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.