Objetivo:

Transmitir al participante conocimientos y habilidades indispensables para abordar las últimas tendencias en métodos y técnicas que le permitan identificar, analizar, gestionar, modelar y predecir, de forma ágil y eficaz, patrones orientados hacia la búsqueda y el desarrollo de soluciones a problemas prácticos que enfrentan las organizaciones, relativas al manejo de grandes volúmenes de información, y dominar áreas clave en materia de inteligencia de negocios.

Dirigido a:

Profesionales y personas interesadas en obtener conocimientos acerca del uso de métodos y herramientas utilizadas en la extracción y procesamiento de grandes volúmenes de información, así como aquellos vinculados a la generación de modelos descriptivos y predictivos que contribuyan a visualizar de manera clara y sencilla el análisis de los datos, y los relacionados con el desarrollo de proyectos de big data, inteligencia de negocios y toma de decisiones.

Contenido:

Fundamentos de desarrollo y gestión de bases de datos - Database Management System.

·         Fundamentos conceptuales de la creación de bases de datos, formulación de consultas, modelado y normalización de datos. Evolución y estado actual de los sistemas de información para la resolución de problemas y toma de decisiones organizacionales. Roles organizacionales en el desarrollo y gestión de bases de datos y oportunidades ocupacionales. Herramientas de consulta visual, desarrollo de formularios e informes. Lenguaje de base de datos integrado dentro de un lenguaje de programación host.

·         Introducción a SQL (Structured Query Language), creación de tablas (relaciones de tipo 1-M, primary keys y foreign keys, sujeto a restricciones). Integración de entidades y referencial. Sentencias SELECT avanzadas, unión y manipulación de datos, problemas de recuperación de datos.

·         Consultas de resúmenes comunes en inteligencia de negocios (GROUP BY, HAVING) y algunos cálculos analíticos (rankings y distribuciones acumulativas). Usos del operador UNION en consultas de inteligencia empresarial. Modificación de entidades, inserción, actualización y eliminación de filas.

·         Errores de sintaxis, semántica y de redundancia.

·         Notación ERD (Entity Relationship Diagram), identificación de dependencias, relaciones M-N con atributos, relaciones M-way y relaciones jerárquicas. Errores de consistencia en las relaciones de dependencia. Notación Crow´s Foot. Utilización de ER Assistant y Visual Paradigm para la creación de diagramas de relaciones entre entidades. Transformación de modelado de datos y verificación de coherencia. Resolución de errores de diagramación.

·         Reglas de conversión, dependencias funcionales, Boyce Codd (BCNF) forma normal. Normalización y problemas de conversión y normalización.

Almacenaje de datos (Data warehouse), conceptos, diseño e integración de datos.

·         Niveles jerárquicos y requerimientos de información para la toma de decisiones. Diferencias entre bases de datos operacionales (Online Transactions Processing Databases) y los almacenes de información (Data Warehouses) basados en sistemas OLAP (Online-Analytical Processing). Diferentes enfoques en arquitectura de datos (Top-Down y Bootom-Up). Ciclo de maduración de los sistemas de información y efectos de aprendizaje.

·         Cubos OLAP para el procesamiento analítico de bases de datos relacionales multidimensionales. Operadores de cubos OLAP (SliceDiceDrill-downRoll-upPivot). Diferentes lenguajes y herramientas comerciales para el manejo de cubos OLAP (Microsoft MDX, Servicios SQL y tablas dinámicas de Excel, Hyperion, IBM, SAP, JPIVOT, PIVOT4J, Pentaho).

·         Representación de bases de datos multidimensionales. SQL vs. MDX.

·         Granularidad, cardinalidad y agregación en tablas de hechos (fact tables). Esquemas de modelado de bases de datos (tipo estrella, estructura estelar y copo de nieve).

·         Resolución de relaciones incompletas, estrictas y no estrictas entre dimensiones y hechos.

·         Problemas en la calidad de las fuentes utilizadas en la integración de bases de datos (multiplicidad de identificadores, diferentes nombres para un mismo campo, unidades diferentes, valores perdidos, transacciones huérfanas, campos multipropósito, datos contradictorios, diferentes tiempos de actualización).

·         Técnicas de limpieza de bases de datos relacionales: Parsing, corrección de valores y estandarización. Funciones para contar, reemplazar y encontrar patrones de texto.

·         Record linkage para la detección de duplicados de entidades, consolidación y vinculación. Uso de cuasi-identificadores para la compatibilización de entidades.

·         Diferencias entre arquitectura ETL y ELT.

·         Entorno de desarrollo integrado (IDE) para la integración y transformación de bases de datos (Pentaho y Talend Open Studio).

Bases de datos relacionales para almacenaje de datos.

·         Operadores de subtotales de SQL.

·         Modelo de procesamiento para funciones analíticas. Elementos de sintaxis básicos para funciones analíticas de SQL. Funciones analíticas ampliadas para comparaciones de ventanas y clasificación cuantitativa.

·         Definición y procesamiento de vistas materializadas. Práctica y principios de reescritura de consultas. Herramientas de diseño y de integración de datos de Oracle.

·         Conceptos y procesos de gobernanza de datos.

Inteligencia de negocios (BI), conceptos, herramientas y aplicaciones.

·         Diferentes tipos de decisiones que enfrentan los gerentes y el proceso a través del cual toman decisiones. Estrategias y enfoques comunes de los tomadores de decisiones. Papel de los sistemas de apoyo a la toma de decisiones (Decision Support Systems).

·         Arquitectura de BI y su relación con los sistemas DSS. Componentes básicos, estructura y tipos de informes comerciales. Sistemas OLAP y sus aplicaciones. Diferencias entre sistemas OLAP y OLTP. Utilización de MicroStrategy para el análisis y visualización de datos.

·         Diferentes tipos de datos que se pueden representar visualmente. Tipos de gráficos básicos y compuestos. Mejores prácticas para el diseño de visualizaciones de datos. Características comunes de un tablero. Tipos de tableros y atributos de lista de métricas que generalmente seincluyen en los tableros. Pautas para el diseño de tableros y errores comunes de diseño.

·         Empleo de herramientas de BI para la gestión del rendimiento empresarial (Business Process Management). Componentes principales del BPM. Fases del ciclo del BPM y su implementación.

·         Sistemas de medición del desempeño y definición de indicadores clave de desempeño (KPI). Las cuatro perspectivas del Balanced Scorecard (BSC) y sus diferencias con la metodología Six Sigma.

·         Papel de la analítica visual de negocios (BA) en BI y su aplicación para la creación de tableros en combinación con datos externos. Capacidades de visualización y búsqueda de información rápida.

·         Introducción a las métricas de entrenamiento para la creación de diferentes modelos predictivos.

Requerimiento técnico: Durante el desarrollo del diplomado, los participantes obtendrán un número importante de archivos contentivos de bases de datos, tanto para prácticas como para la resolución de planteamientos que forman parte de la evaluación, y que consisten en transformaciones que se realizan con los respectivos programas. El participante debe contar con una VPN (red privada virtual). Se requiere una capacidad computacional ideal de 8G. En caso de que su equipo tenga una capacidad menor, se recomienda utilizar un disco duro externo para la instalación de los programas.

Docentes - 

Coordinador académico: Dr. Natan Lederman. Profesor de Pregrado y Postgrado en la Universidad Metropolitana; Consultor Internacional; Máster en Administración de Empresas (Universidad de Illinois, Urbana Champaign);  Certificado Profesional en Data Science (Universidad de Harvard) y Especialización en Business Intelligence (Universidad de Colorado, Denver).

Duración: 144 horas académicas

Modalidad: No Presencial

Fecha: Del 8 de marzo al 20 de septiembre de 2022.