Sobre
Meu nome é Thais Vaz. Sou engenheira de dados há mais de 8 anos.
Comecei no Itaú, onde ganhei o Prêmio Mérito por trabalho em qualidade de dados. Passei pela EBANX quando ela ainda era uma fintech em crescimento acelerado, e construí pipelines ETL que processavam mais de 100 milhões de transações por dia. Liderei uma equipe internacional na HCL Technologies em projetos para a Apple em Silicon Valley, com mais de 500 milhões de eventos diários. Hoje sou engenheira de dados sênior no Bradesco.
Minha stack principal é Databricks. Não porque li um tutorial. Porque é o que roda em produção nos lugares onde trabalhei.
Por que esse blog existe
Em 2024 entrei no mestrado em Métodos Numéricos em Engenharia na UFPR. Minha pesquisa é sobre monitoramento preditivo baseado em IA usando LLMs pra sistemas operacionais.
No meio desse caminho eu percebi uma coisa que me incomodava. Quase ninguém estava escrevendo sobre engenharia de dados de produção em português. Não do jeito que eu queria ler: com profundidade, vindo de quem construiu de verdade, num banco real, com restrições reais de LGPD, SLA e conformidade regulatória.
Então comecei a escrever.
O que você vai encontrar aqui
A primeira frente é engenharia de dados de produção. Databricks, Delta Lake, Spark, dbt, Airflow. Decisões reais de arquitetura, erros que cometi e o que aprendi com eles. Contexto brasileiro onde for relevante.
A segunda é o agente de IA pra cripto, construído em público. Arquitetura, código, backtesting, análise on-chain. Cada etapa documentada. Se der errado, você vai saber por quê.
A terceira é o mestrado traduzido pra prática. O que a pesquisa acadêmica tem a dizer sobre os problemas que você enfrenta todo dia, sem filtro.
Publicações em português e inglês, toda semana.
Onde me encontrar
- Newsletter no Substack: vazdeng.substack.com, resumo do que sai aqui direto no seu email
- GitHub: @thaiscvaz
- LinkedIn: thacvaz
- Contato: responde qualquer post ou me chama no LinkedIn