Este projeto tem como objetivo aplicar as primeiras etapas do processo KDD (Knowledge Discovery in Databases) utilizando a base de dados State of Data Brazil 2022, uma pesquisa conduzida pela comunidade Data Hackers em parceria com a consultoria Bain & Company. 🎯 Objetivo do Projeto:
Preparar o conjunto de dados para uma futura tarefa de classificação de cargos na área de dados, com base nas características de perfil dos candidatos.
- Seleção dos dados
- Pré-processamento
- Transformação
- Fonte: State of Data Brazil 2022
- Número de instâncias: 4.271
- Número de atributos originais: 353
Para este trabalho, foram utilizados apenas os 12 primeiros atributos (do campo idade até cloud_preferida), que descrevem características demográficas e preferências técnicas dos respondentes.