atorch/examples/llama2/bayes_opt_sg_llama2_entry.sh

#!/bin/bash
source ./dataset_model.sh
pip install GPy
pip install pymoo==0.5.0

NUM_GPUS_PER_NODE=$(nvidia-smi -L | wc -l)
WORLD_SIZE=${WORLD_SIZE:-1}
NUM_GPUS=$((NUM_GPUS_PER_NODE * WORLD_SIZE))
PER_DEVICE_TRAIN_BATCH_SIZE=4
TOTAL_TRAIN_BATCH_SIZE=$((NUM_GPUS_PER_NODE * WORLD_SIZE * PER_DEVICE_TRAIN_BATCH_SIZE))
export BO_SG_MAX_IETR=12
export RANDOM_SAMPLE=4


python -m atorch.distributed.run --nnodes="$WORLD_SIZE" \
    --nproc_per_node="$NUM_GPUS_PER_NODE" \
    bayes_opt_sg_llama2.py \
    --dataset_path $DATASET_PATH \
    --config_name $MODEL_NAME_OR_PATH \
    --tokenizer_name $MODEL_NAME_OR_PATH \
    --total_train_batch_size  $TOTAL_TRAIN_BATCH_SIZE \
    --block_size 2048 \
    --seed 42 \
    --preprocessing_num_workers 12 \
    --ignore_mismatched_sizes \
    2>&1 | tee log_llama2_"${WORLD_SIZE}"n"${NUM_GPUS}"g.txt