GitHub - RahulParajuli/Axolotl_QLoRA_LLAMA-3B_MultiGPU_Training

System Requirements

Multi-GPU machine (RunPod, Lambda Labs, AWS, or local)
CUDA-compatible GPUs
Python 3.9+

Finetune Evaluation Weight & Bias

Installation

Install dependencies:

pip install -r requirements.txt

Configure environment variables:

Create a .env file in the repository root:

HF_TOKEN=your-hf-token
HF_USERNAME=your-hf-username
WANDB_API_KEY=your-wandb-key
WANDB_PROJECT=your-project-name
WANDB_DISABLED=false

Getting your tokens:

HF_TOKEN: Create at huggingface.co/settings/tokens
WANDB_API_KEY: Find at wandb.ai/authorize

Accept model license:

For Llama models, accept the license at meta-llama/Llama-3.2-8B

1. Distributed Data Parallelism with Accelerate

Train Llama 3.2 8B with QLoRA across multiple GPUs using Hugging Face Accelerate.

Training

From the repository root:

# 1 GPU (baseline)
accelerate launch --config_file code/configs/accelerate/config_1gpu.yaml code/train_ddp_accelerate.py

# 2 GPUs
accelerate launch --config_file code/configs/accelerate/config_2gpu.yaml code/train_ddp_accelerate.py

# 4 GPUs
accelerate launch --config_file code/configs/accelerate/config_4gpu.yaml code/train_ddp_accelerate.py

Outputs saved to:

data/outputs/accelerate_ddp/<model_name>-1-gpu/
data/outputs/accelerate_ddp/<model_name>-2-gpus/
data/outputs/accelerate_ddp/<model_name>-4-gpus/

Evaluation

After training, evaluate each model (update the model name in the command below). You set it in the code/config.yaml file. Use lowercase for the model name.

# Evaluate 1 GPU model
python code/evaluate_qlora.py --adapter_path data/outputs/accelerate_ddp/<model_name>-1-gpu/lora_adapters

# Evaluate 2 GPU model
python code/evaluate_qlora.py --adapter_path data/outputs/accelerate_ddp/<model_name>-2-gpus/lora_adapters

# Evaluate 4 GPU model
python code/evaluate_qlora.py --adapter_path data/outputs/accelerate_ddp/<model_name>-4-gpus/lora_adapters

Results saved alongside adapters:

eval_results.json - ROUGE scores
predictions.jsonl - Model predictions

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
assets		assets
code		code
data		data
imgs		imgs
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

System Requirements

Finetune Evaluation Weight & Bias

Installation

1. Distributed Data Parallelism with Accelerate

Training

Evaluation

About

Uh oh!

Releases

Packages

Languages

License

RahulParajuli/Axolotl_QLoRA_LLAMA-3B_MultiGPU_Training

Folders and files

Latest commit

History

Repository files navigation

System Requirements

Finetune Evaluation Weight & Bias

Installation

1. Distributed Data Parallelism with Accelerate

Training

Evaluation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages