Meu nome é Thais Vaz. Sou engenheira de dados há mais de 8 anos.
Comecei no Itaú, onde ganhei o Prêmio Mérito por trabalho em qualidade de dados. Passei pela EBANX construindo pipelines ETL em escala. Atuei no projeto da Apple em Silicon Valley pela HCL Technologies. Hoje sou engenheira de dados sênior no Bradesco.
Minha stack principal é Databricks. Não porque li um tutorial. Porque é o que roda em produção nos lugares onde trabalhei.
Por que esse blog existe
Em 2025 entrei como aluna ouvinte no programa de Métodos Numéricos em Engenharia na UFPR e em 2026 ingressei oficialmente como mestranda. Minha pesquisa é sobre monitoramento preditivo baseado em IA usando LLMs pra sistemas operacionais.
No meio desse caminho eu percebi uma coisa que me incomodava. Quase ninguém estava escrevendo sobre engenharia de dados de produção em português. Não do jeito que eu queria ler: com profundidade, vindo de quem construiu de verdade, num banco real, com restrições reais de LGPD, SLA e conformidade regulatória.
Então comecei a escrever.
O que você vai encontrar aqui
A primeira frente é engenharia de dados de produção. Databricks, Delta Lake, Spark, dbt, Airflow. Decisões reais de arquitetura, erros que cometi e o que aprendi com eles. Contexto brasileiro onde for relevante.
A segunda é o agente de IA pra cripto, construído em público. Arquitetura, código, backtesting, análise on-chain. Cada etapa documentada. Se der errado, você vai saber por quê.
A terceira é o mestrado traduzido pra prática. O que a pesquisa acadêmica tem a dizer sobre os problemas que você enfrenta todo dia, sem filtro.
Publicações em português e inglês, toda semana.
Onde me encontrar
- Newsletter no Substack: vazdeng.substack.com, resumo do que sai aqui direto no seu email
- GitHub: @thaiscvaz
- LinkedIn: thacvaz
- Contato: responde qualquer post ou me chama no LinkedIn