• Neil Chagas

Ferramentas Open Source para o Desenvolvimento de Business Intelligence - BI

Atualizado: Jul 29


Enquanto o BI para os gestores e administradores é apenas um conjunto de ferramentas de administração, considerado um grande facilitador da vida dos gestores, gerando informações para a tomada de decisões que antes demoravam diversos dias para ficar prontas, com o BI pode demorar algumas horas, chegando até segundos. Para os desenvolvedores e profissionais de TI, o BI é um conjunto de técnicas de extração, transformação e visualização de informações inteligentes sobre o negócio da empresa e utiliza um conjunto de ferramentas para o processo de captura e transformação de dados em informações.

Utilizando como princípio o ETL - Extract, Transform and Load, ou seja, a extração, transformação e a carga dos dados, o BI necessita primeiramente do desenvolvimento do armazém de dados, o DW - Data Warehouse, onde ficarão a disposição dos usuários para a sua visualização através de ferramentas específicas de visualização em painéis gráficos e serviços web.

O Pentaho Data Integration:

Trata-se da ferramenta mais popular e madura de integração de dados, com mais de 17 anos de existência, com sua versão Community sendo aprimorada periodicamente para atender as necessidades tecnológicas e de mercado. Atualmente adquirido pela Hitachi.

Desenvolvido desde 2004 pela Pentaho Corporation o software foi considerado uma das melhores aplicações para inteligência empresarial em 2008 pela InfoWorld.

Tendo basicamente todas as ferramentas para a implementação e visualização, é poderoso o suficiente para suprir toda a demanda de BI de uma organização, com isso evitaria a instalação de vários softwares para atingir um objetivo final.

A suíte Pentaho é formada por um conjunto de softwares voltados para construção de soluções de BI de ponta a ponta, que inclui programas para extração de dados dos sistemas de origem em uma empresa, gravá-los em um DW, limpá-los, prepará-los e entregá-los a outros sistemas de destino ou mesmo a outros componentes da própria suíte para estudar ou dar acesso aos dados ao usuário final.

A suíte Pentaho é um conjunto de ferramentas compostas pelas plataformas:


- PUC - Pentaho User Console: ferramenta de visualização de painéis gráficos de visão estratégica, administração e gerenciamento de usuários e papéis, conexões com as fontes de dados e acesso e ao CDE (abaixo), sem limite de usuários;


- PDI - Pentaho Data Integration: onde são desenvolvidas as etapas de captação, transformação e carga de dados no banco BI (DW);


- Report Designer: Desenvolvimento e edição de relatórios e gráficos;


- Schema Workbanch: permite criar, editar e testar visualmente o arquivo Mondrian.XML dos esquemas de cubos do OLAP;


- Sayku Analics: análises e visualização de dados em cubos OLAP - Online Analytical Processing;


- Self Service BI: ferramenta que permite ao próprio usuário a criação, edição e visualização de dados através de gráficos, painéis e indicadores;


- Pentaho CDE - Community Dashboard Editor, ferramenta de desenvolvimento e edição de painéis (dashboards) que se divide em três ambientes:


Ambiente de layout (.wcdf): muito versátil para recursos JavaScripts, html, e recursos para o desenvolvimento de gráficos highcharts e pentaho (protovis);

Ambiente de componentes (.cdfde): parâmetros, seletores de filtros, painéis, tabelas, etc

Ambiente de querys (.cde): Sql’s de busca dos gráficos e dos filtros e suas devidas conexões com o BD (ex: JNDI). Em conjunto com o Pentaho Community Edition, utilizamos também as seguintes ferramentas de apoio, todas Open Source, para o desenvolvimento do BI, que podem ser facilmente substituídas por outras com as mesmas finalidades, conforme a preferência de cada desenvolvedor:

DBeaver Community: Ferramenta gratuita de banco de dados multiplataforma para desenvolvedores, administradores de banco de dados, analistas e todas as pessoas que precisam trabalhar com bancos de dados. Suporta todos os bancos de dados populares: MySQL, PostgreSQL, SQLite, Oracle, DB2, SQL Server, Sybase, MS Access, Teradata, Firebird, Apache Hive, Phoenix, Presto, etc.

Visual Studio Code: ferramenta e ambiente de desenvolvimento e edição dos códigos javaScript, HTML, Json e onde são colocados os recursos utilizados no desenvolvimento dos painéis do Pentaho e Highcharts. Gitblit: é um servidor de repositório para versionamento de arquivos (VCS) . É construido com uma stack Java de código aberto para gerenciar, visualizar e hospedar repositórios Git. Com isso vemos a possibilidade de desenvolver um BI completo, desde a extração dos dados dos sistemas ERP's da sua empresa ou cliente, transformação e tratamento, desenvolvimento do DW para o armazenamento e atualizações, até a etapa final de visualização dos painéis gráficos para a tomada de decisões, utilizando ferramentas versáteis, eficientes e totalmente Open Souce, sem custos com licenças e sem limite de usuários. Melhorando ainda mais o desempenho, a performance, a economia e a segurança, é de extrema importância o servidor Linux que é construído com o sistema operacional de código aberto Linux, oferecendo às empresas uma opção econômica de fornecimento de conteúdo, aplicativos e serviços aos clientes. Como o código do Linux é aberto, os usuários também se beneficiam de sua forte comunidade de recursos e defensores e também a infraestrutura de nuvem é, normalmente, baseada no Linux.

Pentaho Community Edition: https://community.hitachivantara.com/s/pentaho

DBeaver Community : https://dbeaver.io

Visual Studio Code: https://code.visualstudio.com Gitblit: http://gitblit.github.io/gitblit/



Neil Carlos Chagas

Analista e Desenvolvedor Business Intelligence

Linkedin MentorsTec

37 visualizações0 comentário