João Vitor Spiller — Cientista de Dados

João Vitor Spiller

Cientista de Dados · Engenheiro de Dados · Passo Fundo, RS

Cientista de Dados com experiência prática em coleta, limpeza, modelagem e visualização de dados operacionais e comerciais, com foco no segmento agrícola. Atuo no desenvolvimento de modelos preditivos, pipelines de dados e dashboards interativos, conectando análise técnica a decisões de negócio.

Tenho especial interesse em Machine Learning aplicado, Engenharia de Dados e projetos que combinam IoT com Visão Computacional. Busco oportunidades onde possa transformar dados em insights reais e gerar impacto mensurável.

joaovspiller1@gmail.com github.com/vitorspiller LinkedIn (54) 99928-2014

Python Machine Learning SQL Power BI Pipelines ETL Visão Computacional DuckDB Streamlit IoT AWS

Projetos

Engenharia de Dados Analytics

IBGE Lakehouse — Pipeline End-to-End

Arquitetura Medallion · DuckDB · Streamlit · Prefect · API SIDRA/IBGE

Ver no GitHub

Pipeline completo com arquitetura Medallion (Bronze → Silver → Gold) consumindo dados reais da API pública SIDRA/IBGE via Python, sem necessidade de cadastro ou token.
Camada Gold com tabelas analíticas em DuckDB prontas para consulta; orquestração de todo o fluxo com Prefect garantindo rastreabilidade e reexecução controlada.
Dashboard interativo com Streamlit e Plotly expondo PIB per capita municipal e estadual, IPCA histórico e rankings econômicos com filtros dinâmicos.
Insights gerados: Canaã dos Carajás (PA) lidera PIB per capita municipal — sede da Mina S11D da Vale; SP representa ~30% do PIB nacional; RS no top 5 em PIB total.

Python DuckDB Parquet Prefect Streamlit Plotly API REST ETL/ELT pandas

Machine Learning IoT · Agronegócio

FungoEye — Detecção de Fungos com Visão Computacional

CNN · Raspberry Pi · Flask · TensorFlow · Projeto Acadêmico ATITUS Educação

Ver no GitHub

Modelo de Rede Neural Convolucional (CNN) treinado para classificar a presença de fungos em bananas, com aplicação direta ao monitoramento de qualidade no agronegócio.
Arquitetura Cliente-Servidor distribuída: Raspberry Pi com Flask para captura de imagens e leitura de sensores DHT11/DHT22; PC realiza a inferência do modelo e exibe resultados.
Pipeline automatizado: captura → predição CNN → arquivamento com timestamp e resultado em CSV, permitindo análise histórica de tendências ambientais e de saúde das plantas.
Interface gráfica com três abas — monitoramento em tempo real, relatórios históricos com gráficos interativos, e painel de configurações do sistema.

TensorFlow / Keras CNN OpenCV Raspberry Pi Arduino Flask Python IoT

Competências técnicas

Linguagens

Python SQL

Machine Learning & IA

scikit-learn TensorFlow Keras CNN pandas

Engenharia de Dados

ETL / ELT DuckDB Parquet Prefect API REST

Visualização

Power BI Streamlit Plotly matplotlib

Cloud & Ferramentas

AWS Git / GitHub Flask Excel

Hardware & IoT

Raspberry Pi Arduino DHT11 / DHT22 OpenCV

Experiência profissional

Cientista de Dados Júnior

Spiller Peças e Serviços

2024 – 2026

Coleta, limpeza e transformação de dados operacionais e comerciais com Python e SQL
Modelos preditivos para tendências de vendas, estoque e desempenho de serviços
Dashboards interativos no Power BI para as áreas de operações e comercial
Pipelines de dados com pandas, scikit-learn e matplotlib para análise avançada

Estagiário em Suporte de Tecnologia

Caixa Econômica Federal

2022 – 2023

Suporte técnico a usuários internos e triagem de chamados
Apoio no processamento de demandas de FGTS e crédito consignado
Organização e análise de planilhas operacionais no Excel

Formação

Bacharelado em Ciência da Computação

ATITUS Educação · Passo Fundo, RS · 2024 – 2028

Certificações

Dados em Excel, SQL, Python e AWS

Udemy Academy

2026

Limpar, carregar e transformar dados no Power BI

Microsoft Learn

2026

Dados em Power BI

Microsoft Learn

2025

CyberSegurança e riscos tecnológicos

Cisco Academy

2025