makecudad.sh

#!/bin/bash
echo "*** Begin native CUDA C++ library make (clean, debug)"
rm *.o
rm bin/libcodehappycudad.a

CUDA_INC_DIRS="-I/usr/local/cuda/include -I/opt/cuda/include -I/targets/x86_64-linux/include"
CUDA_LIBRARIES="-lcuda -lcublas -lculibos -lcudart -lcublasLt -lpthread -ldl -lrt -L/usr/local/cuda/lib64 -L/opt/cuda/lib64 -L/targets/x86_64-linux/lib"
GGML_GPP_ARGS="-DCODEHAPPY_DEBUG -fPIC -D_XOPEN_SOURCE=600 -D_GNU_SOURCE -D_FORTIFY_SOURCE=2 -Wall -Wextra -Wpedantic -Wcast-qual -Wno-unused-function -Wno-multichar -Wno-cast-qual -pthread -march=native -mtune=native -DGGML_USE_K_QUANTS -DGGML_USE_CUDA -DGGML_CUDA_USE_GRAPHS -DSD_USE_CUBLAS -Wno-unused-parameter -Wno-unused-function -Wno-unused-variable"
GGML_GCC_ARGS="-DCODEHAPPY_DEBUG -fPIC -Wall -Wextra -Wpedantic -Wcast-qual -Wdouble-promotion -Wshadow -Wstrict-prototypes -Wpointer-arith -Wmissing-prototypes -pthread -march=native -mtune=native -DGGML_USE_K_QUANTS -DGGML_USE_CUDA -DGGML_CUDA_USE_GRAPHS -DSD_USE_CUBLAS -D_XOPEN_SOURCE=600 -D_GNU_SOURCE -D_FORTIFY_SOURCE=2 -Wno-unused-parameter -Wno-unused-function -Wno-unused-variable"
GGML_NVCC_ARGS="-DCODEHAPPY_DEBUG --forward-unknown-to-host-compiler -use_fast_math -arch=native -DGGML_CUDA_DMMV_X=32 -DGGML_CUDA_MMV_Y=1 -DK_QUANTS_PER_ITERATION=2 -DGGML_CUDA_MMQ_Y=64 -I. -I./examples -std=c++11 -fPIC -DNDEBUG -Wall -Wextra -Wpedantic -Wcast-qual -Wno-unused-function -Wno-multichar -pthread -march=native -mtune=native -DGGML_USE_K_QUANTS -DGGML_USE_CUDA -DGGML_CUDA_USE_GRAPHS -DSD_USE_CUBLAS -Wno-pedantic -Wno-unused-parameter -Wno-unused-function -Wno-unused-variable -Wno-cast-qual -diag-suppress 177"

echo "*** Build external C libraries (sqlite)"
gcc -g -c -Iinc inc/external/sqlite3.c -o sqlite3.o

echo "*** Build ggml library with CUDA support"
gcc -I. -g -std=c11 $GGML_GCC_ARGS $CUDA_INC_DIRS -c inc/external/ggml/ggml.c -o ggml.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/llama.cpp -o llama.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/common.cpp -o common.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/console.cpp -o console.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/build-info.cpp -o build-info.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/grammar-parser.cpp -o grammar-parser.o
nvcc $CUDA_INC_DIRS $GGML_NVCC_ARGS -g -c inc/external/ggml/ggml-cuda.cu -o ggml-cuda.o
nvcc $CUDA_INC_DIRS $GGML_NVCC_ARGS -g -c inc/external/ggml/all.cu -o all.o
gcc -I. -g -std=c11 $GGML_GCC_ARGS $CUDA_INC_DIRS -c inc/external/ggml/ggml-alloc.c -o ggml-alloc.o
gcc -I. -g -std=c11 $GGML_GCC_ARGS $CUDA_INC_DIRS -c inc/external/ggml/ggml-backend.c -o ggml-backend.o
gcc -I. -g -std=c11 $GGML_GCC_ARGS $CUDA_INC_DIRS -c inc/external/ggml/ggml-quants.c -o ggml-quants.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/sampling.cpp -o sampling.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/train.cpp -o train.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/llava.cpp -o llava.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/clip.cpp -o clip.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/json-schema-to-grammar.cpp -o json-schema-to-grammar.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/ngram-cache.cpp -o ngram-cache.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/sgemm.cpp -o sgemm.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/unicode.cpp -o unicode.o
g++ -I. -g -std=c++11 $GGML_GPP_ARGS $CUDA_INC_DIRS -c inc/external/ggml/unicode-data.cpp -o unicode-data.o

echo "*** Build embedded fonts/patches."
if [ -f "bin/embed_d.o" ]; then
echo "(Using cached version from previous build.)"
cp bin/embed_d.o .
else
g++ -std=c++11 -g -m64 -c -Iinc -DCODEHAPPY_NATIVE -DALL_FONTS src/embed.cpp -o embed_d.o
cp embed_d.o bin
fi

echo "*** Build the C++ library (nice single file build)"
g++ -std=c++11 -g -c -Iinc -Wno-unused-result -DCODEHAPPY_NATIVE -DCODEHAPPY_CUDA -DCODEHAPPY_DEBUG -DALL_FONTS -Wno-deprecated-declarations src/libcodehappy.cpp -o libcodehappy.o

echo "*** Create the library archive"
gcc-ar rcs bin/libcodehappycudad.a *.o

echo "*** Build tests and examples"
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -c examples/llamatok.cpp -o llamatok.o
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -c examples/llamagen.cpp -o llamagen.o
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -c examples/chat.cpp -o chat.o
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -c examples/llamaembed.cpp -o llamaembed.o
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -DCODEHAPPY_CUDA -c examples/sd.cpp -o sd.o
g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -DCODEHAPPY_CUDA -c examples/llava.cpp -o llava.o
g++ -g -m64 llamatok.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o  llamatok
g++ -g -m64 llamagen.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o  llamagen
g++ -g -m64 chat.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o  chat
g++ -g -m64 llamaembed.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o llamaembed
g++ -g -m64 sd.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o sd-cuda
g++ -g -m64 llava.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o  llava

g++ -g -fPIC -pthread -m64 $CUDA_INC_DIRS -Iinc -DCODEHAPPY_CUDA -c examples/sd.cpp -o sd.o
g++ -g sd.o bin/libcodehappycudad.a $CUDA_LIBRARIES -o sd-cuda

echo "*** Cleanup"
rm *.o