🪐 Exoplanet Habitability Analysis & KOI Classification

An end-to-end data science project built using Kepler exoplanet data. This project includes data preprocessing, feature engineering, habitability scoring, exploratory analysis, classification modeling, and a fully interactive Streamlit dashboard.

📌 Project Overview

This project aims to explore and classify Kepler Objects of Interest (KOIs) to determine their potential habitability and disposition using scientific metrics and machine learning.

The complete pipeline includes:

🧹 Data Cleaning & Preprocessing
🧪 Exploratory Data Analysis (EDA)
🛠️ Feature Engineering
🌍 Habitability Scoring System
🎯 KOI Disposition Classification (Machine Learning)
📊 Visualizations

🌐 Project Workflow

1. 🧹 Data Cleaning

Loaded KeplerExoRaw.csv
Removed columns with excessive missing values
Handled missing data via imputation
Converted types and removed duplicates

2. 🛠️ Feature Engineering

Created features like:
- pos_diff_mdec, pos_diff_msky: positional differences
- avg_err_mdec: average error
- total_pos_diff: total spatial noise
- Encoded categorical flags
- Extracted vetting year

3. 📈 Exploratory Data Analysis

Distributions of planetary and stellar features
Correlation heatmaps
Trends across vetting years
Comparison of features across KOI classes

4. 🌍 Habitability Scoring System

Planets scored from 0 to 3 based on:

Feature	Ideal Range
Radius	0.5 – 1.5 Earth radii
Equilibrium Temp	200 – 320 Kelvin
Positional Noise	Total diff < 0.1

Each flag contributes 1 point to the habitability_score.

5. 🎯 KOI Disposition Classification

Goal: Predict KOI disposition:
CANDIDATE, CONFIRMED, FALSE POSITIVE, NOT DISPOSITIONED
Features used:
- Engineered features + habitability score
Algorithms:
- Random Forest Classifier
Metrics:
- Confusion Matrix
- Classification Report
- PCA Visualization

🧬 KOI Disposition Classes Explained

CANDIDATE: Probable planet, under review

CONFIRMED: Verified exoplanet

FALSE POSITIVE: Mistaken signal (e.g., stellar noise)

NOT DISPOSITIONED: Unclassified or unreviewed

Classification Report

              precision    recall  f1-score 

    CANDIDATE       0.35      0.19      0.25
    CONFIRMED       0.75      0.87      0.81
  FALSE POSITIVE    0.39      0.19      0.26 
 NOT DISPOSITIONED  0.70      0.68      0.69

📊 Visualisation

Features:

Habitability Mapping (radius vs. temperature) /visual
Confusion Matrix for model performance
PCA plot for numeric feature space

🛠️ Tech Stack

Language: Python 3.x

Libraries:

Pandas, NumPy, Matplotlib, Seaborn

Scikit-learn (modeling + PCA)

📁 Project Structure

📦 exoplanet-habitability ┣ 📄 KeplerExoRaw.csv # Raw data

┣ 📄 cleankepler.csv # Cleaned dataset

┣ 📄 data.csv # Feature-engineered dataset

┣ 📄 featureEngineer.py # Feature engineering script

┣ 📄 model_train.py # ML model training & evaluatio

┣ 📄 README.md

DockerHub Upload

Link : https://hub.docker.com/repository/docker/newbieshubham/shubham-resume/tags/Exoplanet/sha256:ee4eb22206cdbd47dd5d7e0259cf203e1d6359a393863adfaebd05ca64cae75b

📌 Future Enhancements

Hyperparameter tuning for model

SHAP or feature importance analysis

Deployment via Docker or Streamlit Cloud

Integration with real-time exoplanet APIs

🙏 Acknowledgments

NASA Exoplanet Archive

Kepler Mission

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Dockerfile		Dockerfile
Pozo.gif		Pozo.gif
README.md		README.md
Solar.gif		Solar.gif
Telescope.gif		Telescope.gif
cleankepler.csv		cleankepler.csv
data.csv		data.csv
exoplanet_data.csv		exoplanet_data.csv
featureEngineer.py		featureEngineer.py
habitability_and_exoplanet_analysis.py		habitability_and_exoplanet_analysis.py
index.html		index.html
keplerdata.py		keplerdata.py
simple analysis.py		simple analysis.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🪐 Exoplanet Habitability Analysis & KOI Classification

📌 Project Overview

🌐 Project Workflow

1. 🧹 Data Cleaning

2. 🛠️ Feature Engineering

3. 📈 Exploratory Data Analysis

4. 🌍 Habitability Scoring System

5. 🎯 KOI Disposition Classification

🧬 KOI Disposition Classes Explained

Classification Report

📊 Visualisation

Features:

🛠️ Tech Stack

📁 Project Structure

DockerHub Upload

📌 Future Enhancements

🙏 Acknowledgments

About

Uh oh!

Releases

Packages

Languages

ShubhamP1028/Exoplanet-Habitability-Analysis-and-Prediction-Model

Folders and files

Latest commit

History

Repository files navigation

🪐 Exoplanet Habitability Analysis & KOI Classification

📌 Project Overview

🌐 Project Workflow

1. 🧹 Data Cleaning

2. 🛠️ Feature Engineering

3. 📈 Exploratory Data Analysis

4. 🌍 Habitability Scoring System

5. 🎯 KOI Disposition Classification

🧬 KOI Disposition Classes Explained

Classification Report

📊 Visualisation

Features:

🛠️ Tech Stack

📁 Project Structure

DockerHub Upload

📌 Future Enhancements

🙏 Acknowledgments

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages