Post on 09-Feb-2016
transcript
Introducción a Pentaho BI: Enterprise & Community.
Componentes de la Plataforma Pentaho Reporting Análisis de Datos (Mondrian – JPIVOT) Dashboard Pentaho Data Integration Data Mining - WEKA
Instalación y Administración de Pentaho BI Comunity: Consola administrativa:
Definición de Datasource Usuarios y Roles Repositorio
Consola de Usuario Taller Pentaho Junio 2011
UNNOBA
¿Qué es Business Intelligence? “Inteligencia de Negocios es el proceso de
convertir datos en conocimientos y el conocimiento en acción, para la toma de decisiones”
DATOS ANÁLISIS CONOCIMIENTO
Tecnologías involucradas: Data Warehouse Reporting Análisis OLAP (On-line Analytical Processing) Dashboards Integración de datos (ETL – Extract, Transform and load) Minería de datos
Taller Pentaho Junio 2011UNNOBA
Círculo virtuoso de la información
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
¿Qué pasó? - ¿Qué pasa ahora? - ¿Por qué pasó? - ¿Qué pasará?
Beneficios
ATOS ANÁLISIS CONOCIMIENTO
Crear un círculo virtuoso de la información ( datos – información – mejores decisiones – generan nuevos datos)
Permite una visión única, histórica, persistente y de calidad de la información.
Crear, manejar y mantener KPI (indicadores de rendimiento) y KGI (indicadores de metas).
Aporta información actualizada. Reduce la brecha de orientación de negocios entre el
departamento de IT y la organización. Mejorar la competitividad como resultado de ser capaces
de: Diferenciar lo relevante de lo superfluo Acceder más rápido a la información Tener mayor agilidad en la toma de decisiones.
Taller Pentaho Junio 2011UNNOBA
¿Cuándo es necesaria la inteligencia de negocio?
ATOS ANÁLISIS CONOCIMIENTO
La toma de decisiones es realizada en forma intuitiva.
Se detectan problemas de calidad de información.
Excel Caos = uso intensivo de Excel como herramienta de análisis. Cada usuario con un archivo personalizado, por lo que la información es inconsistente entre las áreas y el costo de sincronización elevado.
Necesidad de cruzar información entre áreas.
Se ha alcanzado una masa crítica de datos.
Es necesario automatizar los procesos de extracción y distribución de la información.Taller Pentaho Junio 2011
UNNOBA
¿Cómo detectar que no existe una estrategia de BI?
ATOS ANÁLISIS CONOCIMIENTO
Los usuarios identifican al departamento de IT como origen de sus problemas de inteligencia de negocios.
El nivel jerárquico más alto considera que BI representa otro centro de costo.
El departamento de IT continúa preguntando a los usuarios finales sobre las necesidades de los reportes.
El sistema de BI está soportado por una Mesa de Ayuda No es posible medir el uso del sistema de BI No hay un plan para desarrollar, contratar, retener y aumentar
el equipo de BI. No existe un responsable funcional (o bien el asignado no es el
adecuado). Existen múltiples soluciones que repiten funcionalidad. Alguien cree que es un éxito que la información consolidada
esté disponible a los usuarios finales al cabo de 2 semanas.
Los usuarios creen que la información en el DW no es correcta.Taller Pentaho Junio 2011UNNOBA
Fases de un Proceso BI
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Fase 1: recolectar los requerimientos de información específicos Fase 2: extraer de las diferentes fuentes de información. Fase 3: se integran y cargan los datos en crudo en un formato
utilizable para el análisis. Fase 4: se obtendrán las respuestas a las preguntas, mediante la
creación de reportes, indicadores de rendimiento, cuadros de mando, gráficos estadísticos, etc.
Fase 5: explorar los datos de manera sencilla e intuitiva.
¿Porqué Open Source BI?
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
La solución elegida debería ser evaluada según los siguientes criterios: Adaptabilidad a todos los entornos. Sin costos de licencias Independencia del proveedor Garantías de permanencia. Upgrades y mejoras
frecuentes Tendencia a la calidad y utilización de
estándares (XML – MDX) Dedicación full a los servicios y a la solución de
negocios. Gran aprovechamiento de Web Services. La comunidad del software libre
Plataforma Pentaho Open Source BI
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Características más importantes: Aplicación web desarrollada en J2EE. Modular. Servidor Web: puede correr en servidores
compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.
Base de datos: vía JDBC, DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, Firebird, etc.
Sistema operativo: Multiplataforma. Repositorio de datos basado en XML. Todos los componentes están expuestos vía
Web Services Incluye: ETL, Reporting, OLAP, Data mining,
Dashboards, etc. Licencia: GNU GPL.
Plataforma Pentaho Open Source BI
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Estrategia “open core”: a partir de un núcleo open source se ofrecen servicios y módulos mejorados.
Existen dos versiones disponibles de Pentaho:
Pentaho Community EditionPentaho Community EditionCompletamente gratuita
Pentaho Enterprise EditionPentaho Enterprise EditionSe ofrece bajo modalidad de subscripción
Plataforma Pentaho Open Source BI
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Pentaho Community EditionPentaho Community EditionV
ersión comunitaria, sin costos de licencia, sin servicios de soporte asociados.
Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de BI.
AfPentaho soló la recomienda para:
Aficionados al BI Académicos Programadores de Software Abierto
Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU.
http://community.pentaho.com/
Plataforma Pentaho Open Source BI
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Pentaho Enterprise EditionPentaho Enterprise Edition
Versión empresarial, sin costos de licencia.
Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual.
Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control.
http://www.pentaho.com
Componentes de la Plataforma
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Existen productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. Pentaho Report Designer: Contiene dos
componentes: Un editor basado con prestaciones
profesionales destinado a desarrolladores. Un Wizard que facilita el trabajo y permite a
los usuarios obtener resultados de forma inmediata. Está destinada a usuarios con menos conocimientos técnicos.
Web ad-hoc Reporting: es un Wizard vía Web basado en metadatos que extiende la capacidad de los usuarios finales para la creación de informes sencillos.
Pentaho Reporting
Componentes de la Plataforma
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Carácterísticas Generales: Modelado Multi Dimensional de Datos:
Utiliza MONDRIAN como servidor OLAP de tipo ROLAP.
El modelo de los cubos se guarda en archivos XML Lenguaje de consulta MDX
Navegación y Exploración de Datos: utiliza JPIVOT, el cual permite análisis Ad-Hoc de los
cubos de Mondrian. Este componente como otros puede ser reemplazado
por otras soluciones que se integran a Pentaho, p.e. PAT
Pentaho Análisis OLAP de Datos
Componentes de la Plataforma
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Pentaho Análisis OLAP de Datos
Componentes de la Plataforma
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Todos los componentes del modulo Pentaho Reporting y Pentaho Analysis (JPIVOT) pueden formar parte de un Dashboard. Identificación de Indicadores (KPI’s, Key
Performance Indicators) Monitoreo / Métricas
Investigar detalles subyacentes Drill a reportes de soporte
Seguimiento de excepciones Alertas basadas en reglas del negocio
Pentaho Dashboard
Componentes de la Plataforma
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Poderosa herramienta de ETL (Extracción, Transformación y Carga del DW).
Entorno gráfico de desarrollo . Multiplataforma Basado en dos tipos de objetos: Transformaciones
(colección de pasos en un proceso ETL) y trabajos (colección de transformaciones)
Incluye cuatro herramientas: SPOON: para diseñar transformaciones usando el
entorno gráfico PAN: para ejecutar transformaciones diseñadas con
SPOON. CHEF: para crear trabajos KITCHEN: para ejecutar trabajos
Pentaho Data Integration
Componentes de la Plataforma
DATOS
Taller Pentaho Junio 2011UNNOBA
Se utiliza para: Descubrir patrones ocultos y correlaciónales en los
datos Prevenir eventos futuros basados en patrones
históricos
Data Mining - WEKA
Instalación
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
¿Qué necesitamos descargar para poder ver la solución propuesta? El servidor BI:
http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/3.6.0-stable/ Biserver-ce-3.6.0-stable.zip para Windows Biserver-ce-3.6.0-stable.tar.gz para Linux
El motor Postgresql 8.3 o superior y su correspondiente JDBC
Pentaho Data Integration 4.1.0:http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0-stable/ Pdi-ce-4.1.0-stable.zip para Windows Pdi-ce-41.0-stable.tar.gz para Linux
Instalación
DATOS ANÁLISIS
Taller Pentaho Junio 2011UNNOBA
Al descomprimir el bi-server tendrán los siguientes directorios:
Pentaho/administrationconsole/biserver-ce/
Necesitarán configurar la siguiente variable de entorno: SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre
en windows Y copiar el driver jdbc de postgresql a:
C:\pentaho360\administration-console\jdbc en Windows
Verificar que también esté el driver en: c:\pentaho360\biserver-ce\tomcat\lib en
Windows
Referencias Bibliográficas y Otros…. Introducción al Business Intelligence – Josep Curto Díaz – ISBN: 978-84-
9788-886-8 – Mayo 2010
Pentaho 3.2 Data Integration – María Carina Roldán - ISBN 978-1-847199-54-6 – 2010
“Proyecto de implementación de un Data Warehouse para universidades nacionales “ - Trabajo Final De Grado - Del Giudice Glenda, Della Mea (principalmente el Anexo 1)
Toda la documentación producida por el Ing. Darío Bernabeu.
Pentaho Solutions Business Intelligence and Data Warehousing with Pentaho and MySQL – Parte III - Roland Bouman, Jos van Dongen - ISBN: 978-0-470-48432-6
http://kettle.pentaho.org/ de la Community.
http://Sourceforge.net/projects/pentaho/filesTaller Pentaho Junio 2011 UNNOBA