Repositório com experimentos, análises e comparações de algoritmos de Machine Learning em diversos datasets. Aqui você encontra:
- Algoritmos de classificação, regressão e clustering
- Comparação de modelos e ajuste de hiperparâmetros
- Aplicação da metodologia CRISP-DM
- Análises exploratórias e código documentado
- Otimização de hiperparâmetros com Optuna
- Rastreamento e gerenciamento de experimentos com MLflow
Para garantir que notebooks, modelos .pkl
e outros arquivos criados no Jupyter sejam salvos na sua máquina, use volumes Docker:
- Crie uma pasta local (ex:
notebooks/
). - Construa a imagem:
docker build -t ml-jupyter .
- Rode o container montando a pasta:
docker run -p 8888:8888 -p 5000:5000 -v "$(pwd)/notebooks":/home/jovyan/work ml-jupyter
- Acesse o Jupyter pelo navegador (link no terminal).
Tudo que for salvo no Jupyter estará disponível na sua pasta local, inclusive arquivos em subdiretórios como models/
.
Dica: Use Git para versionar seus notebooks e adicione arquivos grandes ao
.gitignore
se necessário.
Este projeto utiliza Optuna para otimização automática de hiperparâmetros e MLflow para rastreamento, comparação e gerenciamento dos experimentos de machine learning.
- Optuna permite encontrar os melhores parâmetros para seus modelos de forma eficiente e automatizada.
- MLflow registra métricas, parâmetros, artefatos (como modelos e gráficos) e permite comparar diferentes execuções de experimentos.
Para acessar a interface do MLflow UI:
Execute o comando abaixo dentro do terminal do Jupyter (ou do container):
mlflow ui --host 0.0.0.0 --port 5000
Depois, acesse http://localhost:5000 no seu navegador para visualizar e comparar seus experimentos.
Tipo | Título | Link do Binder |
---|---|---|
Classificação Multiclasse | Classificação Multiclasse com o Dataset Iris: Um Estudo Comparativo |