Objetivo Profissional

Comecei a explorar a área de Ciência de Dados 02 anos atrás, valendo da minha longa experiência com Python. Gradualmente, evolui minhas habilidades e passei a aplicá-las em todos os projetos viáveis, concluindo desafios no Kaggle, projetos para a faculdade, e participando em um projeto de Iniciação Científica voltado para o assunto. Busco aplicar minhas habilidades em um contexto profissional.

Conjunto de Habilidades

  • Python

    Pandas

    Scikit-Learn

    Seaborn

    MongoDB

    PosgtresSQL

    Matplotlib

    FastAPI

    Flask

    Django

    Tensorflow

Idiomas

Language

Inglês

Profissional

Projetos

SIA - Sistema Inteligente da AgroConnect

Agosto 2023 - Novembro 2023

Habilidades Utilizadas: Docker | FastAPI | Machine Learning (Scikit, Pandas...) | React | Flask | Arduino

Fazendo uso de conjuntos de dados públicos do Kaggle, desenvolvi 06 classificadores capazes de auxiliar pequenos agricultores em sua produtividade, oferecendo serviços de agricultura de precisão. Assim, servi os modelos via uma API Flask, e construí uma aplicação React que consume o serviço para oferecer as predições aos usuários. A coleta de dados para os modelos fica por parte de estações meteorológicas construídas em Arduino, oferecidas para os usuários.

Competição Santander (Kaggle)

Habilidades Utilizadas: Pandas | Scikit-Learn | Tensorflow

Múltiplas tentativas feitas na competição organizada pelo Santander no Kaggle. Tentativas subsequentes tentam explorar novas ferramentas e classificadores, bem como abordagens para a criação de modelos.

Cardio Check

undefined 2023 - undefined 2023

Habilidades Utilizadas: Machine Learning (Scikit, Pandas...)| Streamlit

Fazendo uso de um conjunto de dados público, dois classificadores foram criados para a triagem de pacientes em consultas cardíacas, gerando uma ordem de prioridade com base nos sintomas e outros fatores. Os modelos foram servidos via uma aplicação Streamlit.

Classificação da Satisfação de Clientes

Outubro 2023 - Agora

Habilidades Utilizadas: Undersampling | Oversampling | Redução de Dimensionalidade | Treinamento de Modelos com Cross-Validation | Limpeza de Dados | Otimização de Hiperparâmetros

Múltiplas tentativas de solucionar uma competição da plataforma Kaggle, patrocinada pela Santander, para a criação de modelos de análise da Satisfação de Clientes com base em múltiplos fatores. Por trás de cada tentativa, está a história e o processo de criação de um modelo confiável de aprendizado de máquina, avaliando erros passados e explorando todos os meios.

Análise de Evasão de Clientes

Habilidades Utilizadas: Limpeza de Dados | Análise de Dados | Visualização Gráfica | Treinamento de Modelos de Machine Learning | Otimização de Hiperparâmetros.

Análise de um conjunto de dados de uma empresa de telefonia, com o objetivo da investigação por detrás dos potenciais motivos de evasão de clientes. Ao fim do estudo da base de dados, uma conclusão é traçada, e um modelo preditivo treinado para produção.

AgroConnect

Maio 2022 - Junho 2022

Tecnologias Utilizadas: Flask | PostgresSQL | Javascript | HTML | CSS

Plataforma online construída com o objetivo de conectar diferentes agentes dentro do mercado agrícola. Produtores e Vendedores poderiam oferecer seus produtos em um catálogo, com possíveis compradores analisando as opções existentes antes de escolher a origem de sua compra.

Financial Control API

Julho 2022 - Agosto 2022

A Django REST API created for familiar financial control.

Music Recommendation

Janeiro 2023 - Janeiro 2023

Após a coleta de uma base de dados do Spotify pela sua API, foi concluído um trabalho de agrupamento, que, ao fim, levou a uma aplicação de recomendação de músicas com base nas características semelhantes entre as músicas da base.

AgroNetwork

Abril 2023 - Maio 2023

Após criar uma API em Go capaz de coletar post de feeds RSS, eu decidi criar uma interface gráfica para a aplicação, permitindo ao usuário acessar os resultados por uma plataforma web, usando Vue.js.

Para os que não conhecem, feeds RSS, ou Really Simple Sindication são uma forma de disponibilizar seu conteúdo em um formato de fácil acesso e interatividade para outras aplicações. O conteúdo é disponibilizado em formato XML, fazendo uso de tags padronizadas para facilitar a coleta de conteúdo. Assim, o usuário pode ter acesso aos principais posts dos seus feeds favoritos em um só lugar, evitando a busca em cada plataforma.

Educação

Universidade Jorge Amado - UNIJORGE

Ciências da Computação - Ensino Superior

2021 - 2024

Publicações

As formas de se fazer IA

https://medium.com/@kalimarapeleteiro/as-formas-de-se-fazer-ia-3ffa5b90bea5

Explicando paradigmas de Machine Learning em uma publicação no Medium.

Métricas de Agrupamento: Coeficiente de Silhueta, Índice de Davies-Bouldin e Índice de Calinski-Harabasz

https://medium.com/@kalimarapeleteiro/m%C3%A9tricas-de-agrupamento-coeficiente-de-silhueta-%C3%ADndice-de-davies-bouldin-e-%C3%ADndice-de-9462b87ce676

Uma explicação sobre as seguintes métricas de agrupamento: Coeficiente de Silhueta, Índice Calinski-Harabasz e Índice de Davies-Bouldin.

Técnicas de Clustering: K-Means, Mean Shift e DBSCAN

https://medium.com/@kalimarapeleteiro/t%C3%A9cnicas-de-clustering-k-means-mean-shift-e-dbscan-52017e6f0335

Uma explicação detalhada sobre o funcionamentos dos seguintes algoritmos de clustering: K-Means, Mean Shift, DBSCAN.