Projeto Wase
Para obter um modelo com maior poder preditivo, desenvolvi dois modelos diferentes para comparar os resultados: random forest e XGBoost.
Os dados foram divididos em conjuntos de treinamento, validação e teste. Dividir os dados em três maneiras significa que há menos dados disponíveis para treinar o modelo do que dividir apenas duas maneiras. No entanto, realizar a seleção de modelo em um conjunto de validação separado permite testar o modelo campeão por si só no conjunto de teste, o que fornece uma estimativa melhor do desempenho futuro do que dividir os dados de duas maneiras e selecionar um modelo campeão por desempenho nos dados de teste.