Pentaho Data Integration e DW

Carga Horaria 16 h/a

    

Data prevista: 2 dias de treinamento

Horário: 08:30 às 17:30h (1 hora de almoço)

Turmas reduzidas: mínimo 5 e máximo 8 alunos.

Investimento: sob consulta (contato@mentorstec.com.br)

Material didático, apostilas e exercícios totalmente desenvolvidos para o curso.

 

Instrutor: Neimar Chagas (mais de 8 anos de experiência com Pentaho)

Currículo: https://br.linkedin.com/in/neimarchagas/pt

Módulo Fundamental

Tempo de ministração estimado 10h

  • Conceitos de BI, Modelagem Dimensional e DW.

  • Apresentação e Histórico do Kettle/ PDI

  • Download, Instalação e Configurações iniciais

  • Componentes do Kettle (Transformações, Jobs, Steps e Hops)

  • Programas: Spoon, Kitchen e Pan

  • Repositórios e compartilhamento de conexões

  • O processo de ETL (do inglês Extract, Transform and Load);

  • Uso dos principais steps do PDI;

  • Entendendo corretamente o Fluxo dos dados e junções

  • Uso de variáveis e de constantes

  • Populando uma Staging Area

  • Implementação de SCD (Slowly Changing Dimension para histórico dos dados);

  • Carga de dados de outros Bancos, Planilhas, Arquivos csv, txt, etc. (exemplo dados do IBGE)

  • Lidando com erros em tempo de execução

  • Orquestrando processos de ETL

  • Criando tabelas de Agregação (Resumo)

  • Enviando e-mail de sucesso e/ou falha com Logs do processo

  • Execução do processo via linha de comandos (Windows e Linux)

  • Agendamento e Controle dos Jobs com o Jenkins

Módulo Avançado

Tempo de ministração estimado 6h

  • Monitorar e otimizar e desempenho de processos no ETL

  • Uso de sub-transformações

  • Trabalhando com grandes volumes de dados

  • Aspectos avançados (Acesso a API Rest, etc)

  • Utilizando o PDI como um Web Service (Carte)

  • Criando Transformações Dinâmicas que mudam em tempo de execução