Comecei a explorar a área de Ciência de Dados 02 anos atrás, valendo da minha longa experiência com Python. Gradualmente, evolui minhas habilidades e passei a aplicá-las em todos os projetos viáveis, concluindo desafios no Kaggle, projetos para a faculdade, e participando em um projeto de Iniciação Científica voltado para o assunto. Busco aplicar minhas habilidades em um contexto profissional.
Objetivo Profissional
Conjunto de Habilidades
Python
Pandas
Scikit-Learn
Seaborn
MongoDB
PosgtresSQL
Matplotlib
FastAPI
Flask
Django
Tensorflow
Idiomas
Inglês:
Profissional
Projetos
SIA - Sistema Inteligente da AgroConnect
Agosto 2023 - Novembro 2023
Habilidades Utilizadas: Docker | FastAPI | Machine Learning (Scikit, Pandas...) | React | Flask | Arduino
Fazendo uso de conjuntos de dados públicos do Kaggle, desenvolvi 06 classificadores capazes de auxiliar pequenos agricultores em sua produtividade, oferecendo serviços de agricultura de precisão. Assim, servi os modelos via uma API Flask, e construí uma aplicação React que consume o serviço para oferecer as predições aos usuários. A coleta de dados para os modelos fica por parte de estações meteorológicas construídas em Arduino, oferecidas para os usuários.
Competição Santander (Kaggle)
Habilidades Utilizadas: Pandas | Scikit-Learn | Tensorflow
Múltiplas tentativas feitas na competição organizada pelo Santander no Kaggle. Tentativas subsequentes tentam explorar novas ferramentas e classificadores, bem como abordagens para a criação de modelos.
Cardio Check
undefined 2023 - undefined 2023
Habilidades Utilizadas: Machine Learning (Scikit, Pandas...)| Streamlit
Fazendo uso de um conjunto de dados público, dois classificadores foram criados para a triagem de pacientes em consultas cardíacas, gerando uma ordem de prioridade com base nos sintomas e outros fatores. Os modelos foram servidos via uma aplicação Streamlit.
Classificação da Satisfação de Clientes
Outubro 2023 - Agora
Habilidades Utilizadas: Undersampling | Oversampling | Redução de Dimensionalidade | Treinamento de Modelos com Cross-Validation | Limpeza de Dados | Otimização de Hiperparâmetros
Múltiplas tentativas de solucionar uma competição da plataforma Kaggle, patrocinada pela Santander, para a criação de modelos de análise da Satisfação de Clientes com base em múltiplos fatores. Por trás de cada tentativa, está a história e o processo de criação de um modelo confiável de aprendizado de máquina, avaliando erros passados e explorando todos os meios.
Análise de Evasão de Clientes
Habilidades Utilizadas: Limpeza de Dados | Análise de Dados | Visualização Gráfica | Treinamento de Modelos de Machine Learning | Otimização de Hiperparâmetros.
Análise de um conjunto de dados de uma empresa de telefonia, com o objetivo da investigação por detrás dos potenciais motivos de evasão de clientes. Ao fim do estudo da base de dados, uma conclusão é traçada, e um modelo preditivo treinado para produção.
AgroConnect
Maio 2022 - Junho 2022
Tecnologias Utilizadas: Flask | PostgresSQL | Javascript | HTML | CSS
Plataforma online construída com o objetivo de conectar diferentes agentes dentro do mercado agrícola. Produtores e Vendedores poderiam oferecer seus produtos em um catálogo, com possíveis compradores analisando as opções existentes antes de escolher a origem de sua compra.
Financial Control API
Julho 2022 - Agosto 2022
A Django REST API created for familiar financial control.
Music Recommendation
Janeiro 2023 - Janeiro 2023
Após a coleta de uma base de dados do Spotify pela sua API, foi concluído um trabalho de agrupamento, que, ao fim, levou a uma aplicação de recomendação de músicas com base nas características semelhantes entre as músicas da base.
AgroNetwork
Abril 2023 - Maio 2023
Após criar uma API em Go capaz de coletar post de feeds RSS, eu decidi criar uma interface gráfica para a aplicação, permitindo ao usuário acessar os resultados por uma plataforma web, usando Vue.js.
Para os que não conhecem, feeds RSS, ou Really Simple Sindication são uma forma de disponibilizar seu conteúdo em um formato de fácil acesso e interatividade para outras aplicações. O conteúdo é disponibilizado em formato XML, fazendo uso de tags padronizadas para facilitar a coleta de conteúdo. Assim, o usuário pode ter acesso aos principais posts dos seus feeds favoritos em um só lugar, evitando a busca em cada plataforma.
Educação
Universidade Jorge Amado - UNIJORGE
Ciências da Computação - Ensino Superior
2021 - 2024
Cursos e Certificados
Inglês Avançado para Devs
Grupo Alura
Formação Machine Learning
Alura
Formação Django REST APIs
Alura
Formação PostgreSQL
Alura
Formação Modelagem de dados
Alura
Espanhol Iniciante
Grupo Alura
Espanhol Básico
Grupo Alura
Espanhol Pré-Intermediário
Grupo Alura
Publicações
As formas de se fazer IA
Explicando paradigmas de Machine Learning em uma publicação no Medium.
Métricas de Agrupamento: Coeficiente de Silhueta, Índice de Davies-Bouldin e Índice de Calinski-Harabasz
Uma explicação sobre as seguintes métricas de agrupamento: Coeficiente de Silhueta, Índice Calinski-Harabasz e Índice de Davies-Bouldin.
Técnicas de Clustering: K-Means, Mean Shift e DBSCAN
Uma explicação detalhada sobre o funcionamentos dos seguintes algoritmos de clustering: K-Means, Mean Shift, DBSCAN.