O que é ETL
ETL (Extract-Transform-Load) é uma metodologia de data integration cujo objetivo é unificar dados extraídos de diferentes fontes. Popularizada nos anos 70, atendia organizações que precisavam consolidar sistemas distintos, como RH e contabilidade, em uma visão única.
Hoje, ferramentas modernas como o Microsoft Power BI Desktop já trazem o processo de ETL integrado nativamente, suportando APIs, arquivos e bancos de dados relacionais e não relacionais (NoSQL).
Extração
- Abrir o Power BI Desktop - ao iniciar, o acesso à integração de dados já está disponível.
- Conectar à fonte de dados - use a opção Obter Dados para se conectar a diversas origens.
- Fornecer detalhes da conexão - caminho de arquivo, credenciais, URL de API, etc., conforme a fonte escolhida.
Transformação
Após a extração, o Editor de Consultas é aberto automaticamente. Nele é possível:
- Filtrar e limpar registros
- Renomear colunas
- Criar colunas calculadas
- Converter tipos de dados
Após os ajustes, as transformações são aplicadas ao conjunto de dados principal.
Carga
Duas modalidades disponíveis:
| Modalidade | Descrição |
|---|---|
| Importar | Dados armazenados dentro do próprio arquivo .pbix |
| Conexão Direta | Power BI consulta a fonte em tempo real, sem armazenar localmente |
Após a carga, o ambiente principal do Power BI está pronto para a criação de visualizações e relatórios.
Atualizações agendadas
Para manter o dashboard sempre atualizado, configure atualizações automáticas. O Power BI irá re-executar o ETL nos intervalos definidos, sem intervenção manual.
Pontos que ainda quero aprofundar
- ETL com fontes NoSQL (MongoDB, Cosmos DB)
- Transformações avançadas com Power Query M
- Diferenças entre Import Mode e DirectQuery em produção