Skip to content

Guilh-Code/guilh-code

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 

Repository files navigation

👨🏻‍💻 Guilherme Rodrigues Almeida Rosa

Estudante de Análise e Desenvolvimento de Sistemas | Analista de Dados | Data Science


💻 Sobre Mim: Estudante de Análise e Desenvolvimento de Sistemas (2º semestre), com foco em aprender e aplicar conhecimentos em Python, lógica de programação, estruturas de dados, POO e Análise de Dados. Tenho noções iniciais de SQL e busco consolidar a prática por meio de projetos próprios, documentando minha evolução por aqui.

Acesse meu Portfólio


🚀 Meus Projetos de Data Science & Análise de Dados

Esta seção apresenta alguns dos projetos que desenvolvi, demonstrando minhas habilidades em análise de dados e desenvolvimento de soluções baseadas em dados.


📈 Projeto 1: Sistema de Análise e Geração de Relatórios de Vendas para E-commerce

Este é meu primeiro projeto mais profissional, onde apliquei um pipeline completo de Data Science utilizando Python. O objetivo foi transformar dados brutos de vendas em insights acionáveis através de um sistema robusto e modular.

💡 Funcionalidades Chave:

  • Manipulação de Dados (Pandas): Carregamento, pré-processamento, limpeza e criação de métricas (ex: Valor_Total_Venda).
  • Análise e Visualização (Matplotlib, Seaborn): Geração de insights por meio de agrupamentos e criação de gráficos claros para vendas por categoria, região e tendências mensais, com exportação para PNG.
  • Persistência de Dados (SQLite): Implementação de um banco de dados para armazenamento e recuperação de informações, simulando um ambiente real de dados.
  • Arquitetura POO: Estruturação do código em classes (DataManager, DatabaseManager) para modularidade, escalabilidade e fácil manutenção.

Detalhes do Projeto:


---

📉 Projeto 2: Análise de Churn de Cartão de Crédito: Prevenindo o Cancelamento de Clientes

Este projeto foca na identificação e compreensão dos fatores que levam clientes a cancelar seus cartões de crédito em uma grande empresa. Utilizei Python para analisar dados de clientes e extrair insights acionáveis para estratégias de retenção.

🎯 Objetivo Principal:

  • Identificar as principais razões por trás do aumento significativo no número de cancelamentos de cartões.
  • Determinar quais perfis de clientes têm maior tendência a cancelar o cartão.
  • Propor ações estratégicas para evitar o churn e minimizar prejuízos.

💡 Insights e Metodologia:

  • Análise Exploratória de Dados (EDA): Visualização e interpretação de diversos atributos dos clientes (ex: categoria de cartão, tempo de cliente, inatividade, limite de crédito) para identificar padrões de cancelamento.
  • Identificação de Fatores Chave: Descobri que a categoria do cartão (Blue), o tempo de relacionamento (primeiros 35 meses), a inatividade, o número de contatos do banco e o limite de crédito são fatores críticos para o churn.
  • Recomendações Estratégicas: Com base nos insights, foram propostas soluções como revisão de benefícios, programas de retenção, ações de reativação para clientes inativos, otimização da comunicação e revisão da política de limites.

Detalhes do Projeto:


---

✈️ Projeto 3: Previsão do Preço de Passagens Aéreas: Otimizando Custos de Viagem

Este projeto concentra-se no desenvolvimento de um modelo de Machine Learning capaz de prever o preço de passagens aéreas, utilizando Python e bibliotecas como Pandas, Matplotlib, Seaborn e Scikit-learn. O objetivo principal é auxiliar na tomada de decisão estratégica para a compra de passagens, visando a otimização de custos.

🎯 Objetivo Principal:

  • Construir um modelo preditivo robusto para estimar o preço de passagens aéreas com base em características do voo.
  • Identificar os fatores mais influentes na precificação de passagens para fornecer insights de negócio acionáveis.
  • Auxiliar empresas e indivíduos a planejar compras de passagens de forma mais econômica.

💡 Insights e Metodologia:

  • Análise Exploratória de Dados (EDA): Realizamos uma análise aprofundada para entender a distribuição dos preços e o impacto de fatores como companhia aérea, antecedência da compra (days_left), horários de partida e chegada, cidades de origem e destino, e, principalmente, a classe do voo (Economy vs. Business).

    • Insights Chave: Descobrimos que a classe de voo é o fator com maior impacto (Business class é 8-9x mais cara); comprar com pouca antecedência encarece a passagem; e companhias aéreas como Vistara e Air India têm preços significativamente mais altos.
  • Pré-processamento de Dados: Aplicamos técnicas essenciais como transformação logarítmica na variável price (para lidar com a assimetria), One-Hot Encoding para variáveis categóricas e escalonamento para variáveis numéricas. Uma etapa crucial foi a remoção da coluna flight para reduzir a dimensionalidade e otimizar o modelo.

  • Modelagem Preditiva: Desenvolvemos um modelo de Regressão Linear que, mesmo sendo um modelo linear simples, alcançou um R-quadrado (R2 Score) de mais de 91% na escala logarítmica. Na escala original dos preços, o modelo obteve um Erro Médio Absoluto (MAE) de aproximadamente R$ 4.573,64. Este MAE é um excelente resultado, considerando a ampla gama de preços das passagens, indicando que o modelo é altamente preciso para o contexto.

Detalhes do Projeto:



🌱 Atualmente aprendendo:

  • Aprofundamento em Programação Orientada a Objetos e design de software.
  • Técnicas avançadas de Análise e Visualização de Dados.
  • SQL e otimização de consultas de banco de dados.
  • Boas práticas de versionamento com Git para colaboração e organização de projetos.

💬 Vamos conectar! Aberto para colaborações e oportunidades de estágio onde eu possa contribuir e crescer como desenvolvedor.

Instagram Gmail LinkedIn Currículo Profile views


🤖 Linguagens e Tecnologias

HTML     CSS     Python     Git     Pandas     Matplotlib     SQLite


Snake animation


About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published