Projetos-AutoML

Sobre o repositório

Nesse repositório irá constar projetos onde foram aplicadas ferramentas e bibliotecas de automação de processos de data science como modelagem e visualização de dados. Abaixo segue alguns projetos desenvolvidos:

Auto ML para modelar aluguéis (PyCaret): Modelagem do preço de alugueis de casas e apartamentos no Brasil. Foi utilizada a biblioteca PyCaret para todas as etapas do projeto (tratamento, modelagem, avaliação, salvamento e carregamento);

Auto ML para identificação de risco de câncer (PyCaret): Nesse projeto utilizo a biblioteca PyCaret para modelar dados de características de pacientes e suas biópsias, para identificar qual o risco de possuir ou não câncer cervical (ou do colo do útero).

Auto ML segmentação de clientes (PyCaret): Nesse projeto utilizo a biblioteca PyCaret gerar clusters (ou grupos) de clientes de uma empresa de cartão de crédito. Apliquei três algoritmos de machine learning que foram o K-Means, o Agglomerative e o Birch; e cada uma desses algoritmos gerou 4 grupos de clientes, mas com proporções diferentes. Essas técnicas permitiu a identificação de grupos de clientes que possuem maiores balanços (dinheiro guardado para realizar compras), maiores valores de compras e maiores valores de compras a prazo.

Auto ML detecção de anomalias (PyCaret): Nesse projeto utilizo a biblioteca PyCaret identificar anomalias em uma base de cartões de créditos e depois analisar se as anomalias identificadas são ou não fraudes. Foram aplicados três modelos (Iforest, Histogram e PCA) e dos modelos o que gerou um melhor resultado foi o PCA, pois 432 anomalias foram identificadas como fraudes (de um total de 492).

Auto ML para previsão de preços de casas (TPOT): Aplicação da biblioteca TPOT para previsão de preços de casas. Nesse projeto utilizei 4 métodos de seleção de features (por correlação, por Feature Importance do modelo de árvore de regressão, por RFE e por PCA) e o modelo de melhor desempenho foi aquele cuja seleção foi via correlação.

AutoML para previsão Churn de clientes (PyCaret): O melhor modelo foi o que utilizou a algoritmos de reamostragem Instance Hardness Threshold que obtive as melhores métricas de avaliação;

Automatização de visualização de dados (AutoViz): Aplicação da biblioteca AutoViz para automatizar o processo de visualização de uma base de dados de carros usados. Foram gerados os gráficos Scatterplot, Pairwise-plot, Histograma, Boxplots, QQplot, Violinplot, Heatmap, Pivot Table e barplots e, com esses gráficos, foi possíveis identificar:

a relação positiva entre a variável engineSize e o preço (price, variável alvo);
As variáveis contínuas não possuem uma distribuição normal, o que pode ser um problema na hora de passá-las para modelos de machine learning ou de deep learning, pois alguns desses modelos pressupõem normalidade nas variáveis e isso mostra que essas colunas precisam de algum tipo de tratamento (normalização ou padronização). Outra coisa que pode-se notar é a presença de muitos outliers na variável price que pode ser ruim para o treinamento de um modelo, então essa coluna pode requerer um tratamento.

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
Auto ML para classificação de Churn de clientes		Auto ML para classificação de Churn de clientes
Auto ML para identificação de risco de câncer		Auto ML para identificação de risco de câncer
Auto ML para modelar aluguéis-brasil		Auto ML para modelar aluguéis-brasil
Auto ML para previsão de resistência do concreto		Auto ML para previsão de resistência do concreto
Auto ML para segmentação de clientes		Auto ML para segmentação de clientes
AutoML para Classificação Multiclasse		AutoML para Classificação Multiclasse
AutoML para classificação de preços de celulares		AutoML para classificação de preços de celulares
AutoML para detecção de anomalias		AutoML para detecção de anomalias
AutoML para previsão de preços de casas		AutoML para previsão de preços de casas
Automatização de Visualização		Automatização de Visualização
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projetos-AutoML

Sobre o repositório

About

Releases

Packages

Languages

renangarciarosa/Projetos-AutoML

Folders and files

Latest commit

History

Repository files navigation

Projetos-AutoML

Sobre o repositório

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages