Olá, eu sou
Diogo Jacomini

Software Engineer & Data Engineer

Sobre Mim

Engenheiro de Dados com experiência em arquitetura, desenvolvimento e automação de pipelines de dados em ambientes de grande escala, principalmente no setor bancário. Com atuação de desenvolvimento de soluções end-to-end com foco em performance, confiabilidade e governança.

Tenho domínio em ferramentas de Big Data (Spark, Airflow, Databricks) além de aplicar práticas DevOps no dia a dia (Docker, GitHub Actions, Terraform) e trabalhar com ambientes em nuvem como AWS e Azure.

Habilidades Técnicas

Engenharia de Dados

Apache Spark Apache Airflow dbt Snowflake Delta Lake

Linguagens & Frameworks

Python SQL Scala Java Flask FastAPI

Cloud & DevOps

AWS Azure Docker Kubernetes Terraform Jenkins

Formação Acadêmica

Pós-Graduação em Software Architecture

FIAP · Julho 2025 - Em andamento

Formação foco em desenvolvimento de sistemas distribuídos, escaláveis e seguros. Abrange temas de arquitetura em microsserviços, DDD, containers com Docker, orquestração com Kubernetes, Clean Architecture, serverless, DevOps, engenharia de dados, segurança da informação e LGPD.

Bacharelado em Ciência de Dados

Anhembi Morumbi · Janeiro 2020 - Janeiro 2024

Graduação na área de dados que fornece habilidades e conhecimentos essenciais em ciência de dados, análise e inteligência artificial.

Experiência Profissional

Engenheiro de Dados

F1RST | Santander · Janeiro 2024 - Presente

Projetos de migração de dados e desenvolvimento de arquiteturas cloud, focando em otimização de pipelines.

  • Execução de projetos de migração de dados de ambientes on-premises para a cloud
  • Planejamento e desenvolvimento de arquiteturas de dados na cloud
  • Otimização e automação de pipelines, reduzindo tarefas manuais
  • Monitoramento e gerenciamento de pipelines em ambientes cloud
  • Desenvolvimento e resolução de problemas de desempenho em jobs de pipeline

Engenheiro de Dados

BRQ | Santander · Maio 2023 - Janeiro 2024

Desenvolvimento de arquiteturas para ingestão de dados e processamento Big Data, com foco em otimização de processos legados e orquestração de pipelines.

  • Desenvolvimento de arquiteturas para ingestão de dados
  • Construção de tarefas de processamento de Big Data com PySpark
  • Transcrição e otimização de processos legados
  • Orquestração e monitoramento de pipelines com o Control-M

Cientista de Dados

Banco Modal · Setembro 2021 - Janeiro 2023

Desenvolvimento de modelos de machine learning e engenharia de atributos, colaborando com diferentes áreas de negócios para soluções baseadas em dados.

  • Preparação de dados: limpeza e transformação para facilitar análises
  • Engenharia de atributos: seleção, transformação e criação de features
  • Modelagem: machine learning, regressão, classificação, árvores de decisão
  • Desenvolvimento de redes neurais, análise de sentimento e segmentação
  • Model Tuning: otimização de modelos para melhor desempenho

Cientista de Dados Júnior

Refinaria de Dados · Setembro 2020 - Setembro 2021

Projetos focados em coleta, ingestão e construção de modelos de machine learning.

  • Coleta e ingestão de dados de várias fontes: bancos, planilhas, APIs e web scraping
  • Construção e manutenção de pipelines de dados utilizando ferramentas de ETL
  • Modelos de machine learning: regressão, classificação e clusterização
  • Sistema de recomendação de produtos baseado em filtragem colaborativa
  • Avaliação de modelos para garantir precisão e confiabilidade
  • Otimização de modelos para obter o melhor desempenho possível

Certificações

Databricks Fundamentals Badge

Databricks Academy Accreditation

Databricks Fundamentals

Projetos em Destaque

World Football Data Pipeline

Pipeline de dados completo para extração, transformação e carregamento de dados do Campeonato Brasileiro Série A.

Python Azure ETL Data Lake API

Education Management System

Sistema distribuído para gerenciamento educacional desenvolvido em Java para gestão completa de alunos, professores, cursos e finanças.

Cliente-Servidor Java MVC Socket TCP Multi-threading

Product Recommendation System API

API de recomendação de produtos desenvolvida com FastAPI, implementando arquitetura REST, desenvolvimento em Python e validação automática de dados.

Python FastAPI Pydantic REST API SQLAlchemy

Vamos Conversar?

Estou sempre aberto a discutir novas oportunidades, projetos interessantes ou apenas bater um papo sobre dados e tecnologia.