João Vitor Spiller
João Vitor Spiller
Cientista de Dados · Engenheiro de Dados · Passo Fundo, RS

Cientista de Dados com experiência prática em coleta, limpeza, modelagem e visualização de dados operacionais e comerciais, com foco no segmento agrícola. Atuo no desenvolvimento de modelos preditivos, pipelines de dados e dashboards interativos, conectando análise técnica a decisões de negócio.

Tenho especial interesse em Machine Learning aplicado, Engenharia de Dados e projetos que combinam IoT com Visão Computacional. Busco oportunidades onde possa transformar dados em insights reais e gerar impacto mensurável.

Python Machine Learning SQL Power BI Pipelines ETL Visão Computacional DuckDB Streamlit IoT AWS
Projetos
Engenharia de Dados Analytics
IBGE Lakehouse — Pipeline End-to-End
Arquitetura Medallion · DuckDB · Streamlit · Prefect · API SIDRA/IBGE
Ver no GitHub
  • Pipeline completo com arquitetura Medallion (Bronze → Silver → Gold) consumindo dados reais da API pública SIDRA/IBGE via Python, sem necessidade de cadastro ou token.
  • Camada Gold com tabelas analíticas em DuckDB prontas para consulta; orquestração de todo o fluxo com Prefect garantindo rastreabilidade e reexecução controlada.
  • Dashboard interativo com Streamlit e Plotly expondo PIB per capita municipal e estadual, IPCA histórico e rankings econômicos com filtros dinâmicos.
  • Insights gerados: Canaã dos Carajás (PA) lidera PIB per capita municipal — sede da Mina S11D da Vale; SP representa ~30% do PIB nacional; RS no top 5 em PIB total.
Python DuckDB Parquet Prefect Streamlit Plotly API REST ETL/ELT pandas
Machine Learning IoT · Agronegócio
FungoEye — Detecção de Fungos com Visão Computacional
CNN · Raspberry Pi · Flask · TensorFlow · Projeto Acadêmico ATITUS Educação
Ver no GitHub
  • Modelo de Rede Neural Convolucional (CNN) treinado para classificar a presença de fungos em bananas, com aplicação direta ao monitoramento de qualidade no agronegócio.
  • Arquitetura Cliente-Servidor distribuída: Raspberry Pi com Flask para captura de imagens e leitura de sensores DHT11/DHT22; PC realiza a inferência do modelo e exibe resultados.
  • Pipeline automatizado: captura → predição CNN → arquivamento com timestamp e resultado em CSV, permitindo análise histórica de tendências ambientais e de saúde das plantas.
  • Interface gráfica com três abas — monitoramento em tempo real, relatórios históricos com gráficos interativos, e painel de configurações do sistema.
TensorFlow / Keras CNN OpenCV Raspberry Pi Arduino Flask Python IoT
Competências técnicas
Linguagens
Python SQL
Machine Learning & IA
scikit-learn TensorFlow Keras CNN pandas
Engenharia de Dados
ETL / ELT DuckDB Parquet Prefect API REST
Visualização
Power BI Streamlit Plotly matplotlib
Cloud & Ferramentas
AWS Git / GitHub Flask Excel
Hardware & IoT
Raspberry Pi Arduino DHT11 / DHT22 OpenCV
Experiência profissional
Cientista de Dados Júnior
Spiller Peças e Serviços
2024 – 2026
  • Coleta, limpeza e transformação de dados operacionais e comerciais com Python e SQL
  • Modelos preditivos para tendências de vendas, estoque e desempenho de serviços
  • Dashboards interativos no Power BI para as áreas de operações e comercial
  • Pipelines de dados com pandas, scikit-learn e matplotlib para análise avançada
Estagiário em Suporte de Tecnologia
Caixa Econômica Federal
2022 – 2023
  • Suporte técnico a usuários internos e triagem de chamados
  • Apoio no processamento de demandas de FGTS e crédito consignado
  • Organização e análise de planilhas operacionais no Excel
Formação
Bacharelado em Ciência da Computação
ATITUS Educação · Passo Fundo, RS · 2024 – 2028
Certificações
Dados em Excel, SQL, Python e AWS
Udemy Academy
2026
Limpar, carregar e transformar dados no Power BI
Microsoft Learn
2026
Dados em Power BI
Microsoft Learn
2025
CyberSegurança e riscos tecnológicos
Cisco Academy
2025