add verbosity level

PABannier · PABannier · Feb 13, 2024 · Oct 26, 2023 · Oct 26, 2023 · Oct 26, 2023
commit 5319d26df860d2e5cb9b36083f5c86f970b3a5d5
diff --git a/bark/bark.cpp b/bark/bark.cpp
@@ -46,7 +46,6 @@
 #define COARSE_INFER_TOKEN 12050
 #define COARSE_SEMANTIC_PAD_TOKEN 12048
 
-// static const size_t MB = 1024*1024;
 
 void print_tensor(struct ggml_tensor * a) {
  float sum = 0;
@@ -423,8 +422,10 @@ static void bark_tokenize_input(struct bark_context * ctx, const std::string & t
  printf("\n");
 }
 
-static bool gpt_load_model_weights(const std::string & fname, gpt_model & model) {
- fprintf(stderr, "%s: loading model from '%s'\n", __func__, fname.c_str());
+static bool gpt_load_model_weights(const std::string & fname, gpt_model & model, VerbosityLevel verbosity) {
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ fprintf(stderr, "%s: loading model from '%s'\n", __func__, fname.c_str());
+ }
 
  auto fin = std::ifstream(fname, std::ios::binary);
  if (!fin) {
@@ -459,17 +460,19 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
 
  const int32_t qntvr = hparams.ftype / GGML_QNT_VERSION_FACTOR;
 
- printf("%s: n_in_vocab = %d\n", __func__, hparams.n_in_vocab);
- printf("%s: n_out_vocab = %d\n", __func__, hparams.n_out_vocab);
- printf("%s: block_size = %d\n", __func__, hparams.block_size);
- printf("%s: bias = %d\n", __func__, hparams.bias);
- printf("%s: n_embd = %d\n", __func__, hparams.n_embd);
- printf("%s: n_head = %d\n", __func__, hparams.n_head);
- printf("%s: n_layer = %d\n", __func__, hparams.n_layer);
- printf("%s: n_lm_heads = %d\n", __func__, hparams.n_lm_heads);
- printf("%s: n_wtes = %d\n", __func__, hparams.n_wtes);
- printf("%s: ftype = %d\n", __func__, hparams.ftype);
- printf("%s: qntvr = %d\n", __func__, qntvr);
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("%s: n_in_vocab = %d\n", __func__, hparams.n_in_vocab);
+ printf("%s: n_out_vocab = %d\n", __func__, hparams.n_out_vocab);
+ printf("%s: block_size = %d\n", __func__, hparams.block_size);
+ printf("%s: bias = %d\n", __func__, hparams.bias);
+ printf("%s: n_embd = %d\n", __func__, hparams.n_embd);
+ printf("%s: n_head = %d\n", __func__, hparams.n_head);
+ printf("%s: n_layer = %d\n", __func__, hparams.n_layer);
+ printf("%s: n_lm_heads = %d\n", __func__, hparams.n_lm_heads);
+ printf("%s: n_wtes = %d\n", __func__, hparams.n_wtes);
+ printf("%s: ftype = %d\n", __func__, hparams.ftype);
+ printf("%s: qntvr = %d\n", __func__, qntvr);
+ }
 
  hparams.ftype %= GGML_QNT_VERSION_FACTOR;
  }
@@ -547,8 +550,10 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
  n_tensors += 4 * n_layer; // c_attn_attn_b, c_attn_proj_b, c_mlp_fc_b, c_mlp_proj_b
  }
 
- printf("%s: ggml tensor size = %d bytes\n", __func__, (int) sizeof(ggml_tensor));
- printf("%s: ggml ctx size = %6.2f MB\n", __func__, buffer_size/(1024.0*1024.0));
+ if (verbosity == VerbosityLevel::HIGH) {
+ printf("%s: ggml tensor size = %d bytes\n", __func__, (int) sizeof(ggml_tensor));
+ printf("%s: ggml ctx size = %6.2f MB\n", __func__, buffer_size/(1024.0*1024.0));
+ }
  }
 
  // create the ggml context
@@ -568,12 +573,17 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
 
  if (!model.backend) {
  // fallback to CPU backend
- fprintf(stderr, "%s: no backend specified, using CPU backend\n", __func__);
+ if (verbosity == VerbosityLevel::HIGH) {
+ fprintf(stderr, "%s: no backend specified, using CPU backend\n", __func__);
+ }
  model.backend = ggml_backend_cpu_init();
  }
 
  if (!model.backend) {
- fprintf(stderr, "%s: failed to initialize CPU backend\n", __func__);
+ if (verbosity == VerbosityLevel::HIGH) {
+ fprintf(stderr, "%s: failed to initialize CPU backend\n", __func__);
+ }
+
  return false;
  }
 
@@ -687,7 +697,9 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
 
  const size_t memory_size = ggml_nbytes(model.memory_k) + ggml_nbytes(model.memory_v);
 
- printf("%s: memory size = %8.2f MB, n_mem = %d\n", __func__, memory_size/1024.0/1024.0, n_mem);
+ if (verbosity == VerbosityLevel::HIGH) {
+ printf("%s: memory size = %8.2f MB, n_mem = %d\n", __func__, memory_size/1024.0/1024.0, n_mem);
+ }
 
  // create a backend buffer (can be in host or device memory)
  model.buffer_kv = ggml_backend_alloc_buffer(model.backend, memory_size + 256);
@@ -756,6 +768,7 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
  return false;
  }
 
+
  const size_t bpe = ggml_type_size(ggml_type(ttype));
 
  if ((nelements*bpe)/ggml_blck_size(tensor->type) != ggml_nbytes(tensor)) {
@@ -775,13 +788,19 @@ static bool gpt_load_model_weights(const std::string & fname, gpt_model & model)
  ggml_backend_tensor_set(tensor, read_buf.data(), 0, ggml_nbytes(tensor));
  }
 
- // printf("%48s - [%5d, %5d], type = %6s, %6.2f MB\n", name.data(), ne[0], ne[1], "float", ggml_nbytes(tensor)/1024.0/1024.0);
+ if (verbosity == VerbosityLevel::HIGH) {
+ printf("%48s - [%5d, %5d], type = %6s, %6.2f MB\n", name.data(), ne[0], ne[1], "float", ggml_nbytes(tensor)/1024.0/1024.0);
+ }
 
  total_size += ggml_nbytes(tensor);
  }
 
  ggml_allocr_free(alloc);
- printf("%s: model size = %8.2f MB\n", __func__, total_size/1024.0/1024.0);
+
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("%s: model size = %8.2f MB\n", __func__, total_size/1024.0/1024.0);
+ }
+
  model.memsize = total_size;
  }
 
@@ -1995,7 +2014,7 @@ bool bark_generate_audio(
 
  // Calling Encodec API to generate audio wavefrom from tokens
  const int n_gpu_layers = 0;
- const std::string encodec_model_path = "";
+ const std::string encodec_model_path = "/Users/pbannier/Documents/encodec.cpp/ggml_weights/ggml-model.bin";
 
  struct encodec_context * ectx = encodec_load_model(encodec_model_path, n_gpu_layers);
  if (!ectx) {
@@ -2051,25 +2070,35 @@ void bark_free(struct bark_context * bctx) {
 
 static struct bark_model * bark_load_model_from_file(
  const std::string & dirname,
- struct bark_model * model) {
- printf("%s: loading model from '%s'\n", __func__, dirname.c_str());
+ struct bark_model * model,
+ VerbosityLevel verbosity) {
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("%s: loading model from '%s'\n", __func__, dirname.c_str());
+ }
 
  // text
  {
- printf("%s: reading bark text model\n", __func__);
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("%s: reading bark text model\n", __func__);
+ }
+
  const std::string fname = std::string(dirname) + "/ggml_weights_text.bin";
- if (!gpt_load_model_weights(fname, model->text_model)) {
+ if (!gpt_load_model_weights(fname, model->text_model, verbosity)) {
  fprintf(stderr, "%s: invalid model file '%s' (bad text)\n", __func__, fname.c_str());
  return nullptr;
  }
  }
 
  // vocab
  {
- printf("%s: reading bark vocab\n", __func__);
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("%s: reading bark vocab\n", __func__);
+ }
+
  const std::string fname = std::string(dirname) + "/ggml_vocab.bin";
  const gpt_hparams hparams = model->text_model.hparams;
  const int32_t expected_size = hparams.n_in_vocab - hparams.n_out_vocab - 5;
+
  if (!bark_vocab_load(fname, &model->vocab, expected_size)) {
  fprintf(stderr, "%s: invalid model file '%s' (bad text)\n", __func__, fname.c_str());
  return nullptr;
@@ -2078,19 +2107,27 @@ static struct bark_model * bark_load_model_from_file(
 
  // coarse
  {
- printf("\n%s: reading bark coarse model\n", __func__);
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("\n%s: reading bark coarse model\n", __func__);
+ }
+
  const std::string fname = std::string(dirname) + "/ggml_weights_coarse.bin";
- if (!gpt_load_model_weights(fname, model->coarse_model)) {
+
+ if (!gpt_load_model_weights(fname, model->coarse_model, verbosity)) {
  fprintf(stderr, "%s: invalid model file '%s' (bad coarse)\n", __func__, fname.c_str());
  return nullptr;
  }
  }
 
  // fine
  {
- printf("\n%s: reading bark fine model\n", __func__);
+ if (verbosity == VerbosityLevel::MEDIUM || verbosity == VerbosityLevel::HIGH) {
+ printf("\n%s: reading bark fine model\n", __func__);
+ }
+
  const std::string fname = std::string(dirname) + "/ggml_weights_fine.bin";
- if (!gpt_load_model_weights(fname, model->fine_model)) {
+
+ if (!gpt_load_model_weights(fname, model->fine_model, verbosity)) {
  fprintf(stderr, "%s: invalid model file '%s' (bad fine)\n", __func__, fname.c_str());
  return nullptr;
  }
@@ -2114,13 +2151,13 @@ struct bark_context_params bark_context_default_params() {
  return result;
 }
 
-struct bark_context * bark_load_model(const std::string & model_path) {
+struct bark_context * bark_load_model(const std::string & model_path, VerbosityLevel verbosity) {
  int64_t t_load_start_us = ggml_time_us();
 
  struct bark_context * bctx = new bark_context();
 
  bctx->model = bark_model();
- if (!bark_load_model_from_file(model_path, &bctx->model)) {
+ if (!bark_load_model_from_file(model_path, &bctx->model, verbosity)) {
  fprintf(stderr, "%s: failed to load model weights from '%s'\n", __func__, model_path.c_str());
  return {};
  }

diff --git a/bark/bark.h b/bark/bark.h
@@ -20,6 +20,12 @@
 # define BARK_API
 #endif
 
+enum VerbosityLevel {
+ LOW = 0,
+ MEDIUM = 1,
+ HIGH = 2,
+};
+
 typedef int32_t bark_token;
 
 typedef std::vector<int32_t> bark_sequence;
@@ -122,7 +128,8 @@ struct bark_model {
 };
 
 struct bark_context_params {
- uint32_t seed; // RNG seed
+ // RNG seed
+ uint32_t seed;
 
  // Temperature for sampling (text and coarse encoders)
  float temp;
@@ -135,6 +142,9 @@ struct bark_context_params {
  int sliding_window_size;
  // Max history for coarse encoder
  int max_coarse_history;
+
+ // Verbosity level
+ VerbosityLevel verbosity;
 };
 
 struct bark_context {
@@ -176,11 +186,12 @@ BARK_API struct bark_context_params bark_context_default_params(void);
  * Loads a BARK model from the specified file path with the given parameters.
  *
  * @param model_path The directory path of the bark model to load.
- * @param params The parameters to use when loading the bark model.
+ * @param verbosity The verbosity level when loading the model.
  * @return A pointer to the loaded bark model context.
  */
 BARK_API struct bark_context * bark_load_model(
- const std::string & model_path);
+ const std::string & model_path,
+ VerbosityLevel verbosity);
 
 /**
  * Generates an audio file from the given text using the specified Bark context.
@@ -250,11 +261,11 @@ void bert_tokenize(
 
 /**
  * Encodes the input text using the forward algorithm.
- * 
+ *
  * @param bctx A pointer to the bark context struct.
  * @param n_threads The number of threads to use for encoding.
  * @return Returns true if the encoding was successful, false otherwise.
  */
 bool bark_forward_text_encoder(
- struct bark_context * bctx, 
+ struct bark_context * bctx,
  int n_threads);
diff --git a/bark/examples/common.cpp b/bark/examples/common.cpp
@@ -1,3 +1,4 @@
+#include <iostream>
 #include <string> 
 #include <vector>
 
@@ -25,19 +26,19 @@ void write_wav_on_disk(std::vector<float> & audio_arr, std::string dest_path) {
 }
 
 void bark_print_usage(char ** argv, const bark_params & params) {
- fprintf(stderr, "usage: %s [options]\n", argv[0]);
- fprintf(stderr, "\n");
- fprintf(stderr, "options:\n");
- fprintf(stderr, " -h, --help show this help message and exit\n");
- fprintf(stderr, " -t N, --threads N number of threads to use during computation (default: %d)\n", params.n_threads);
- fprintf(stderr, " -s N, --seed N seed for random number generator (default: %d)\n", params.seed);
- fprintf(stderr, " -p PROMPT, --prompt PROMPT\n");
- fprintf(stderr, " prompt to start generation with (default: random)\n");
- fprintf(stderr, " -m FNAME, --model FNAME\n");
- fprintf(stderr, " model path (default: %s)\n", params.model_path.c_str());
- fprintf(stderr, " -o FNAME, --outwav FNAME\n");
- fprintf(stderr, " output generated wav (default: %s)\n", params.dest_wav_path.c_str());
- fprintf(stderr, "\n");
+ std::cout << "usage: " << argv[0] << " [options]\n"
+  << "\n"
+  << "options:\n"
+  << " -h, --help show this help message and exit\n"
+  << " -t N, --threads N number of threads to use during computation (default: " << params.n_threads << ")\n"
+  << " -s N, --seed N seed for random number generator (default: " << params.seed << ")\n"
+  << " -p PROMPT, --prompt PROMPT\n"
+  << " prompt to start generation with (default: random)\n"
+  << " -m FNAME, --model FNAME\n"
+  << " model path (default: " << params.model_path << ")\n"
+  << " -o FNAME, --outwav FNAME\n"
+  << " output generated wav (default: " << params.dest_wav_path << ")\n"
+  << "\n";
 }
 
 int bark_params_parse(int argc, char ** argv, bark_params & params) {

diff --git a/bark/examples/main/main.cpp b/bark/examples/main/main.cpp
@@ -1,3 +1,4 @@
+#include <iostream>
 #include <tuple>
 
 #include "ggml.h"
@@ -16,8 +17,16 @@ int main(int argc, char **argv) {
  return 1;
  }
 
+ std::cout << R"( __ __ )" << "\n"
+ << R"( / /_ ____ ______/ /__ _________ ____ )" << "\n"
+ << R"( / __ \/ __ `/ ___/ //_/ / ___/ __ \/ __ \)" << "\n"
+ << R"( / /_/ / /_/ / / / ,< _ / /__/ /_/ / /_/ /)" << "\n"
+ << R"(/_.___/\__,_/_/ /_/|_| (_) \___/ .___/ .___/ )" << "\n"
+ << R"( /_/ /_/ )" << "\n"
+ << "\n";
+
  // initialize bark context
- struct bark_context * bctx = bark_load_model(params.model_path);
+ struct bark_context * bctx = bark_load_model(params.model_path, VerbosityLevel::LOW);
  if (!bctx) {
  fprintf(stderr, "%s: Could not load model\n", __func__);
  exit(1);

diff --git a/bark/examples/server/server.cpp b/bark/examples/server/server.cpp
@@ -96,7 +96,7 @@ int main(int argc, char ** argv) {
 
  bark_params_parse(argc, argv, params);
 
- struct bark_context * bctx = bark_load_model(params.model_path.c_str());
+ struct bark_context * bctx = bark_load_model(params.model_path.c_str(), VerbosityLevel::LOW);
  if (!bctx) {
  fprintf(stderr, "%s: Could not load model\n", __func__);
  return 1;

diff --git a/bark/tests/test-forward-semantic.cpp b/bark/tests/test-forward-semantic.cpp
@@ -24,7 +24,7 @@ int main() {
  std::mt19937 rng(0);
 
  // initialize bark context
- struct bark_context * bctx = bark_load_model(dirname);
+ struct bark_context * bctx = bark_load_model(dirname, VerbosityLevel::LOW);
  if (!bctx) {
  fprintf(stderr, "%s: Could not load model\n", __func__);
  exit(1);