iceranto.dev / log

Qual a importância do ETL e como essa metodologia é utilizada

O que é ETL

ETL (Extract-Transform-Load) é uma metodologia de data integration cujo objetivo é unificar dados extraídos de diferentes fontes. Popularizada nos anos 70, atendia organizações que precisavam consolidar sistemas distintos, como RH e contabilidade, em uma visão única.

Hoje, ferramentas modernas como o Microsoft Power BI Desktop já trazem o processo de ETL integrado nativamente, suportando APIs, arquivos e bancos de dados relacionais e não relacionais (NoSQL).

Extração

  1. Abrir o Power BI Desktop - ao iniciar, o acesso à integração de dados já está disponível.
  2. Conectar à fonte de dados - use a opção Obter Dados para se conectar a diversas origens.
  3. Fornecer detalhes da conexão - caminho de arquivo, credenciais, URL de API, etc., conforme a fonte escolhida.

Transformação

Após a extração, o Editor de Consultas é aberto automaticamente. Nele é possível:

  • Filtrar e limpar registros
  • Renomear colunas
  • Criar colunas calculadas
  • Converter tipos de dados

Após os ajustes, as transformações são aplicadas ao conjunto de dados principal.

Carga

Duas modalidades disponíveis:

ModalidadeDescrição
ImportarDados armazenados dentro do próprio arquivo .pbix
Conexão DiretaPower BI consulta a fonte em tempo real, sem armazenar localmente

Após a carga, o ambiente principal do Power BI está pronto para a criação de visualizações e relatórios.

Atualizações agendadas

Para manter o dashboard sempre atualizado, configure atualizações automáticas. O Power BI irá re-executar o ETL nos intervalos definidos, sem intervenção manual.

Pontos que ainda quero aprofundar

  • ETL com fontes NoSQL (MongoDB, Cosmos DB)
  • Transformações avançadas com Power Query M
  • Diferenças entre Import Mode e DirectQuery em produção