diff --git a/include/ggml.h b/include/ggml.h
index d895c9acd..73798c837 100644
--- a/include/ggml.h
+++ b/include/ggml.h
@@ -480,6 +480,7 @@ extern "C" {
         GGML_OP_CONV_TRANSPOSE_2D,
         GGML_OP_POOL_1D,
         GGML_OP_POOL_2D,
+        GGML_OP_PAD_REFLECT_1D,
         GGML_OP_UPSCALE, // nearest interpolate
         GGML_OP_PAD,
         GGML_OP_ARANGE,
@@ -1642,6 +1643,14 @@ extern "C" {
             struct ggml_tensor  * b,
             int                   stride);
 
+
+    GGML_API struct ggml_tensor * ggml_pad_reflect_1d(
+            struct ggml_context * ctx,
+            struct ggml_tensor  * a,
+            int                   p0,
+            int                   p1);
+
+
     enum ggml_op_pool {
         GGML_OP_POOL_MAX,
         GGML_OP_POOL_AVG,
diff --git a/src/ggml-cuda.cu b/src/ggml-cuda.cu
index ed784ea1c..eecde62b0 100644
--- a/src/ggml-cuda.cu
+++ b/src/ggml-cuda.cu
@@ -29,6 +29,7 @@
 #include "ggml-cuda/tsembd.cuh"
 #include "ggml-cuda/unary.cuh"
 #include "ggml-cuda/upscale.cuh"
+#include "ggml-cuda/padreflect.cuh"
 #include "ggml-cuda/conv-transpose-1d.cuh"
 
 #include <algorithm>
@@ -2206,6 +2207,9 @@ static bool ggml_cuda_compute_forward(ggml_backend_cuda_context & ctx, struct gg
         case GGML_OP_UPSCALE:
             ggml_cuda_op_upscale(ctx, dst);
             break;
+        case GGML_OP_PAD_REFLECT_1D:
+            ggml_cuda_op_pad_reflect_1d(ctx, dst);
+            break;
         case GGML_OP_PAD:
             ggml_cuda_op_pad(ctx, dst);
             break;
@@ -2844,6 +2848,7 @@ GGML_CALL static bool ggml_backend_cuda_supports_op(ggml_backend_t backend, cons
         case GGML_OP_ACC:
         case GGML_OP_GROUP_NORM:
         case GGML_OP_UPSCALE:
+        case GGML_OP_PAD_REFLECT_1D:
         case GGML_OP_PAD:
         case GGML_OP_ARANGE:
         case GGML_OP_TIMESTEP_EMBEDDING:
diff --git a/src/ggml-cuda/padreflect.cu b/src/ggml-cuda/padreflect.cu
new file mode 100644
index 000000000..c28799ebc
--- /dev/null
+++ b/src/ggml-cuda/padreflect.cu
@@ -0,0 +1,65 @@
+#include "padreflect.cuh"
+
+static __global__ void pad_reflect_1d_f32(const float * x, float * dst,
+        const int nb00, const int nb01,
+        const int ne10, const int ne11, const int p0,
+        const int p1, const int inp_size, const int dst_size
+        ) {
+    int index = threadIdx.x + blockIdx.x * blockDim.x;
+    if (index >= ne10 * ne11) {
+        return;
+    }
+
+
+    const int row_size = ne10;
+    int column_index = index % row_size;
+    const int row_index = index / row_size;
+
+    if (column_index < p0)
+    {
+        column_index =  p0 - column_index;
+    }
+    else if(column_index < row_size -p1)
+    {
+        column_index = column_index - p0;
+    }
+    else
+    {
+        column_index = (row_size - p1 - p0) - (p1+1-(row_size-column_index)) - 1;
+    }
+
+    int i00 = column_index;
+    int i01 = row_index;
+
+
+
+    dst[index] = *(float *)((char *)x + i01 * nb01 + i00 * nb00);
+}
+
+static void pad_reflect_1d_f32_cuda(const float * x, float * dst,
+        const int nb00, const int nb01,
+        const int ne10, const int ne11, 
+        const int p0, const int p1, 
+        const int inp_size, const int dst_size,
+        cudaStream_t stream) {
+    int num_blocks = (dst_size + CUDA_PAD_REFLECT_BLOCK_SIZE - 1) / CUDA_PAD_REFLECT_BLOCK_SIZE;
+
+    pad_reflect_1d_f32<<<num_blocks, CUDA_PAD_REFLECT_BLOCK_SIZE,0,stream>>>(x, dst, nb00, nb01, ne10, ne11,p0,p1, inp_size,dst_size);
+}
+
+void ggml_cuda_op_pad_reflect_1d(ggml_backend_cuda_context & ctx, ggml_tensor * dst) {
+    const ggml_tensor * src0 = dst->src[0];
+    const float * src0_d = (const float *)src0->data;
+    float * dst_d = (float *)dst->data;
+    cudaStream_t stream = ctx.stream();
+
+    GGML_ASSERT(src0->type == GGML_TYPE_F32);
+    GGML_ASSERT( dst->type == GGML_TYPE_F32);
+
+    const int inp_size = src0->ne[0] * src0->ne[1];
+    const int dst_size = dst->ne[0] * dst->ne[1];
+
+
+
+    pad_reflect_1d_f32_cuda(src0_d, dst_d, src0->nb[0], src0->nb[1], dst->ne[0], dst->ne[1], dst->op_params[0],dst->op_params[1], inp_size,dst_size, stream);
+}
\ No newline at end of file
diff --git a/src/ggml-cuda/padreflect.cuh b/src/ggml-cuda/padreflect.cuh
new file mode 100644
index 000000000..15daf921b
--- /dev/null
+++ b/src/ggml-cuda/padreflect.cuh
@@ -0,0 +1,5 @@
+#include "common.cuh"
+
+#define CUDA_PAD_REFLECT_BLOCK_SIZE 256
+
+void ggml_cuda_op_pad_reflect_1d(ggml_backend_cuda_context & ctx, ggml_tensor * dst);
diff --git a/src/ggml.c b/src/ggml.c
index ae7bee5e3..1e89e88e7 100644
--- a/src/ggml.c
+++ b/src/ggml.c
@@ -2695,7 +2695,7 @@ static const char * GGML_OP_NAME[GGML_OP_COUNT] = {
     "CROSS_ENTROPY_LOSS_BACK",
 };
 
-static_assert(GGML_OP_COUNT == 74, "GGML_OP_COUNT != 74");
+static_assert(GGML_OP_COUNT == 75, "GGML_OP_COUNT != 75");
 
 static const char * GGML_OP_SYMBOL[GGML_OP_COUNT] = {
     "none",
@@ -2757,6 +2757,8 @@ static const char * GGML_OP_SYMBOL[GGML_OP_COUNT] = {
     "argsort(x)",
     "leaky_relu(x)",
 
+    "pad_reflect_1d(x)",
+
     "flash_attn_ext(x)",
     "flash_attn_back(x)",
     "ssm_conv(x)",
@@ -2783,7 +2785,7 @@ static const char * GGML_OP_SYMBOL[GGML_OP_COUNT] = {
     "cross_entropy_loss_back(x,y)",
 };
 
-static_assert(GGML_OP_COUNT == 74, "GGML_OP_COUNT != 74");
+static_assert(GGML_OP_COUNT == 75, "GGML_OP_COUNT != 75");
 
 static_assert(GGML_OP_POOL_COUNT == 2, "GGML_OP_POOL_COUNT != 2");
 
@@ -7274,6 +7276,43 @@ struct ggml_tensor * ggml_get_rel_pos(
     return result;
 }
 
+// ggml_pad_reflect_1d
+
+struct ggml_tensor * ggml_pad_reflect_1d(
+        struct ggml_context * ctx,
+        struct ggml_tensor  * a,
+        int                   p0,
+        int                   p1) {
+
+    bool is_node = false;
+
+    if (a->grad) {
+        GGML_ASSERT(false); // TODO: implement backward
+        is_node = true;
+    }
+
+    GGML_ASSERT(p0 < a->ne[0]); // padding length on each size must be less than the 
+    GGML_ASSERT(p1 < a->ne[0]); // existing length of the dimension being padded
+
+    GGML_ASSERT(a->ne[2] == 1);
+    GGML_ASSERT(a->ne[3] == 1);
+
+    GGML_ASSERT(ggml_is_contiguous(a));
+
+
+    const int64_t ne[2] = { p0 + a->ne[0] + p1, a->ne[1] };
+    struct ggml_tensor * result = ggml_new_tensor(ctx, GGML_TYPE_F32, 2, ne);
+
+    int32_t params[] = { p0, p1 };
+    ggml_set_op_params(result, params, sizeof(params));
+
+    result->op = GGML_OP_PAD_REFLECT_1D;
+    result->grad = is_node ? ggml_dup_tensor(ctx, result) : NULL;
+    result->src[0] = a;
+
+    return result;
+}
+
 // ggml_add_rel_pos
 
 static struct ggml_tensor * ggml_add_rel_pos_impl(
@@ -13409,6 +13448,42 @@ static void ggml_compute_forward_diag_mask_f32(
     }
 }
 
+// ggml_compute_forward_pad_reflect_1d
+
+static void ggml_compute_forward_pad_reflect_1d(
+        const struct ggml_compute_params * params,
+        const struct ggml_tensor * src0,
+              struct ggml_tensor * dst) {
+    GGML_ASSERT(src0->type == GGML_TYPE_F32);
+    GGML_ASSERT( dst->type == GGML_TYPE_F32);
+
+    const int32_t * opts = (const int32_t *) dst->op_params;
+    const int p0 = opts[0];
+    const int p1 = opts[1];
+    GGML_ASSERT(p0 >= 0);
+    GGML_ASSERT(p1 >= 0);
+
+    const int ne00 = src0->ne[0];
+
+    const int nb01 = src0->nb[1];
+
+    const int ne0 = dst->ne[0];
+    const int ne1 = dst->ne[1];
+
+    const int nb0 = dst->nb[0];
+    const int nb1 = dst->nb[1];
+
+    for (int i1 = 0; i1 < ne1; i1++) {
+        float * left  = (float *) ((char *) dst->data + i1*nb1 +         p0*nb0);
+        float * right = (float *) ((char *) dst->data + i1*nb1 + (ne0-p1-1)*nb0);
+
+        ggml_vec_cpy_f32(ne00, left, (float *) ((char *) src0->data + i1*nb01));
+
+        for (int i0 = 1; i0 <= p0; i0++) { left[-i0] = left[i0];   }
+        for (int i0 = 1; i0 <= p1; i0++) { right[i0] = right[-i0]; }
+    }
+}
+
 static void ggml_compute_forward_diag_mask_inf(
         const struct ggml_compute_params * params,
         struct ggml_tensor * dst) {
@@ -16679,6 +16754,10 @@ static void ggml_compute_forward(struct ggml_compute_params * params, struct ggm
             {
                 ggml_compute_forward_conv_transpose_2d(params, tensor);
             } break;
+        case GGML_OP_PAD_REFLECT_1D:
+            {
+                ggml_compute_forward_pad_reflect_1d(params, tensor->src[0], tensor);
+            } break;
         case GGML_OP_POOL_1D:
             {
                 ggml_compute_forward_pool_1d(params, tensor);
@@ -17679,6 +17758,10 @@ static void ggml_compute_backward(struct ggml_context * ctx, struct ggml_tensor
             {
                 GGML_ASSERT(false); // TODO: not implemented
             } break;
+        case GGML_OP_PAD_REFLECT_1D:
+            {
+                GGML_ASSERT(false); // TODO: not implemented
+            } break;
         case GGML_OP_POOL_1D:
             {
                 GGML_ASSERT(false); // TODO: not implemented
@@ -18388,6 +18471,10 @@ static int ggml_get_n_tasks(struct ggml_tensor * node, int n_threads) {
             {
                 n_tasks = n_threads;
             } break;
+        case GGML_OP_PAD_REFLECT_1D:
+            {
+                n_tasks = 1;
+            } break;
         case GGML_OP_POOL_1D:
         case GGML_OP_POOL_2D:
             {
diff --git a/tests/CMakeLists.txt b/tests/CMakeLists.txt
index 2cba62196..684341385 100644
--- a/tests/CMakeLists.txt
+++ b/tests/CMakeLists.txt
@@ -359,6 +359,13 @@ add_executable(${TEST_TARGET} ${TEST_TARGET}.c)
 target_link_libraries(${TEST_TARGET} PRIVATE ggml)
 add_test(NAME ${TEST_TARGET} COMMAND $<TARGET_FILE:${TEST_TARGET}>)
 
+# test-pad-reflect-1d
+
+set(TEST_TARGET test-pad-reflect-1d)
+add_executable(${TEST_TARGET} ${TEST_TARGET}.cpp)
+target_link_libraries(${TEST_TARGET} PRIVATE ggml)
+add_test(NAME ${TEST_TARGET} COMMAND $<TARGET_FILE:${TEST_TARGET}>)
+
 #
 # test-rel-pos
 
diff --git a/tests/test-backend-ops.cpp b/tests/test-backend-ops.cpp
index a1bfc8fdd..cf788eac7 100644
--- a/tests/test-backend-ops.cpp
+++ b/tests/test-backend-ops.cpp
@@ -1535,6 +1535,29 @@ struct test_acc : public test_case {
     }
 };
 
+// GGML_OP_PAD_REFLECT_1D
+struct test_pad_reflect_1d : public test_case {
+    const ggml_type type;
+    const std::array<int64_t, 2> ne_a;
+    const int pad_0;
+    const int pad_1;
+
+    std::string vars() override {
+        return VARS_TO_STR4(type, ne_a, pad_0, pad_1);
+    }
+
+    test_pad_reflect_1d(ggml_type type = GGML_TYPE_F32,
+            std::array<int64_t, 2> ne_a = {512, 10},
+            int pad_0 = 10, int pad_1 = 9)
+        : type(type), ne_a(ne_a), pad_0(pad_0), pad_1(pad_1)  {}
+
+    ggml_tensor * build_graph(ggml_context * ctx) override {
+        ggml_tensor * a = ggml_new_tensor(ctx, type, 2, ne_a.data());
+        ggml_tensor * out = ggml_pad_reflect_1d(ctx, a, pad_0, pad_1);
+        return out;
+    }
+};
+
 // GGML_OP_PAD
 struct test_pad : public test_case {
     const ggml_type type;
@@ -2363,6 +2386,11 @@ static bool test_backend(ggml_backend_t backend, test_mode mode, const char * op
     test_cases.emplace_back(new test_group_norm());
     test_cases.emplace_back(new test_acc());
     test_cases.emplace_back(new test_pad());
+    test_cases.emplace_back(new test_pad_reflect_1d());
+    test_cases.emplace_back(new test_pad_reflect_1d(GGML_TYPE_F32, {1024}, 5 , 6));
+    test_cases.emplace_back(new test_pad_reflect_1d(GGML_TYPE_F32, {2}, 1 , 0));
+    test_cases.emplace_back(new test_pad_reflect_1d(GGML_TYPE_F32, {10}, 7 , 3));
+
     test_cases.emplace_back(new test_arange());
     test_cases.emplace_back(new test_timestep_embedding());
     test_cases.emplace_back(new test_leaky_relu());
diff --git a/tests/test-pad-reflect-1d.cpp b/tests/test-pad-reflect-1d.cpp
new file mode 100644
index 000000000..5b148e7c7
--- /dev/null
+++ b/tests/test-pad-reflect-1d.cpp
@@ -0,0 +1,401 @@
+#include "ggml.h"
+#include "ggml-alloc.h"
+#include "ggml-backend.h"
+
+//#define GGML_CUDA
+
+#ifdef GGML_CUDA
+#include "ggml-cuda.h"
+#endif
+
+#ifdef GGML_USE_METAL
+#include "ggml-metal.h"
+#endif
+
+#include <cstdio>
+#include <cstring>
+#include <fstream>
+#include <map>
+#include <string>
+#include <vector>
+#include <cmath>
+#include <iostream>
+
+static void ggml_log_callback_default(ggml_log_level level, const char * text, void * user_data) {
+    (void) level;
+    (void) user_data;
+    fputs(text, stderr);
+    fflush(stderr);
+}
+
+struct test_model {
+    struct ggml_tensor * a_0;
+    struct ggml_tensor * a_1;
+    struct ggml_tensor * a_2;
+    struct ggml_tensor * a_3;
+
+
+
+
+    ggml_backend_t backend = NULL;
+    ggml_backend_buffer_t buffer;
+    struct ggml_context * ctx;
+};
+
+void load_model(test_model & model, bool use_gpu = false) {
+    
+    
+
+
+    float data[1024];
+    for (int i = 0; i < 1024; ++i) {
+        data[i] = (float)i;
+    }
+
+
+
+ 
+    size_t buffer_size = 0;
+    {
+        buffer_size += 1024* ggml_type_size(GGML_TYPE_F32); // tensor a_0
+        buffer_size += 2* ggml_type_size(GGML_TYPE_F32); // tensor a_0
+        buffer_size += 10* ggml_type_size(GGML_TYPE_F32); // tensor a_0
+        buffer_size += 5* 2 *  ggml_type_size(GGML_TYPE_F32); // tensor a_0
+
+
+
+
+
+    
+        buffer_size += 1024;
+    }
+
+    printf("%s: ggml tensor size    = %d bytes\n", __func__, (int) sizeof(ggml_tensor));
+    printf("%s: backend buffer size = %0.2f MB\n", __func__, (buffer_size/ 1024.f/ 1024.f));
+
+    int num_tensors = 4;
+    struct ggml_init_params params {
+            /*.mem_size   =*/ ggml_tensor_overhead() * num_tensors,
+            /*.mem_buffer =*/ NULL,
+            /*.no_alloc   =*/ true,
+    };
+
+    // initialize the backend
+#ifdef GGML_CUDA
+    if (use_gpu) {
+        fprintf(stderr, "%s: using CUDA backend\n", __func__);
+        model.backend = ggml_backend_cuda_init(0);
+        if (!model.backend) {
+            fprintf(stderr, "%s: ggml_backend_cuda_init() failed\n", __func__);
+        }
+    }
+#endif
+
+#ifdef GGML_USE_METAL
+    if (use_gpu) {
+        fprintf(stderr, "%s: using Metal backend\n", __func__);
+        ggml_backend_metal_log_set_callback(ggml_log_callback_default, nullptr);
+        model.backend = ggml_backend_metal_init();
+        if (!model.backend) {
+            fprintf(stderr, "%s: ggml_backend_metal_init() failed\n", __func__);
+        }
+    }
+#endif
+
+    if(!model.backend) {
+        // fallback to CPU backend
+        model.backend = ggml_backend_cpu_init();
+    }
+
+    model.buffer = ggml_backend_alloc_buffer(model.backend, buffer_size);
+
+    // create context
+    model.ctx = ggml_init(params);
+
+    // create tensors
+    model.a_0 = ggml_new_tensor_1d(model.ctx, GGML_TYPE_F32, 1024);
+    model.a_1 = ggml_new_tensor_1d(model.ctx, GGML_TYPE_F32, 2);
+    model.a_2 = ggml_new_tensor_1d(model.ctx, GGML_TYPE_F32, 10);
+    model.a_3 = ggml_new_tensor_2d(model.ctx, GGML_TYPE_F32, 5,2);
+
+
+
+    // create a allocator
+    ggml_tallocr alloc = ggml_tallocr_new(model.buffer);
+
+    // alloc memory
+    ggml_tallocr_alloc(&alloc, model.a_0);
+
+    // load data to buffer
+    if(ggml_backend_is_cpu(model.backend)) {
+        memcpy(model.a_0->data, data, ggml_nbytes(model.a_0));
+    } else {
+        ggml_backend_tensor_set(model.a_0, data, 0, ggml_nbytes(model.a_0));
+    }
+
+     // alloc memory
+    ggml_tallocr_alloc(&alloc, model.a_1);
+
+    // load data to buffer
+    if(ggml_backend_is_cpu(model.backend)) {
+        memcpy(model.a_1->data, data, ggml_nbytes(model.a_1));
+    } else {
+        ggml_backend_tensor_set(model.a_1, data, 0, ggml_nbytes(model.a_1));
+    }
+
+     // alloc memory
+    ggml_tallocr_alloc(&alloc, model.a_2);
+
+    // load data to buffer
+    if(ggml_backend_is_cpu(model.backend)) {
+        memcpy(model.a_2->data, data, ggml_nbytes(model.a_2));
+    } else {
+        ggml_backend_tensor_set(model.a_2, data, 0, ggml_nbytes(model.a_2));
+    }
+      // alloc memory
+    ggml_tallocr_alloc(&alloc, model.a_3);
+
+    // load data to buffer
+    if(ggml_backend_is_cpu(model.backend)) {
+        memcpy(model.a_3->data, data, ggml_nbytes(model.a_3));
+    } else {
+        ggml_backend_tensor_set(model.a_3, data, 0, ggml_nbytes(model.a_3));
+    }
+
+
+
+}
+
+struct ggml_cgraph * build_graph(const test_model& model) {
+    static size_t buf_size = ggml_tensor_overhead()*GGML_DEFAULT_GRAPH_SIZE + ggml_graph_overhead();
+    static std::vector<uint8_t> buf(buf_size);
+
+    struct ggml_init_params params0 = {
+        /*.mem_size   =*/ buf_size,
+        /*.mem_buffer =*/ buf.data(),
+        /*.no_alloc   =*/ true, // the tensors will be allocated later by ggml_gallocr_alloc_graph()
+    };
+
+    // create a temporally context to build the graph
+    struct ggml_context * ctx0 = ggml_init(params0);
+
+    struct ggml_cgraph  * gf = ggml_new_graph(ctx0);
+
+    int p0 = 5;
+    int p1 = 6;
+
+    struct ggml_tensor* pad_reflect_1d_res_0 = ggml_pad_reflect_1d(ctx0, model.a_0, p0, p1);
+    ggml_set_name(pad_reflect_1d_res_0, "pad_reflect_1d_res_0");
+    ggml_build_forward_expand(gf, pad_reflect_1d_res_0);
+
+    p0 = 1;
+    p1 = 0;
+
+    struct ggml_tensor* pad_reflect_1d_res_1 = ggml_pad_reflect_1d(ctx0, model.a_1, p0, p1);
+    ggml_set_name(pad_reflect_1d_res_1, "pad_reflect_1d_res_1");
+    ggml_build_forward_expand(gf, pad_reflect_1d_res_1);
+
+    p0 = 7;
+    p1 = 3;
+
+    struct ggml_tensor* pad_reflect_1d_res_2 = ggml_pad_reflect_1d(ctx0, model.a_2, p0, p1);
+    ggml_set_name(pad_reflect_1d_res_2, "pad_reflect_1d_res_2");
+    ggml_build_forward_expand(gf, pad_reflect_1d_res_2);
+
+    p0 = 2;
+    p1 = 3;
+
+    struct ggml_tensor* pad_reflect_1d_res_3 = ggml_pad_reflect_1d(ctx0, model.a_3, p0, p1);
+    ggml_set_name(pad_reflect_1d_res_3, "pad_reflect_1d_res_3");
+    ggml_build_forward_expand(gf, pad_reflect_1d_res_3);
+
+
+
+    // delete the temporally context used to build the graph
+    ggml_free(ctx0);
+    return gf;
+}
+
+struct ggml_cgraph* compute_graph(const test_model & model, ggml_gallocr_t allocr) {
+    struct ggml_cgraph * gf = build_graph(model);
+
+    // allocate tensors
+    ggml_gallocr_alloc_graph(allocr, gf);
+    int n_threads = 1;
+
+    if (ggml_backend_is_cpu(model.backend)) {
+        ggml_backend_cpu_set_n_threads(model.backend, n_threads);
+    }
+
+#ifdef GGML_USE_METAL
+    if (ggml_backend_is_metal(model.backend)) {
+        ggml_backend_metal_set_n_cb(model.backend, n_threads);
+    }
+#endif
+
+    ggml_backend_graph_compute(model.backend, gf);
+
+    //ggml_graph_print(gf);
+
+    return gf;
+}
+
+int main(void)
+{
+    ggml_time_init();
+
+    test_model model;
+    load_model(model, true);
+
+    ggml_gallocr_t allocr = NULL;
+
+    {
+        allocr = ggml_gallocr_new(ggml_backend_get_default_buffer_type(model.backend));
+
+        //create the worst case graph for memory usage estimation
+        struct ggml_cgraph * gf = build_graph(model);
+
+        // compute the required memory
+        ggml_gallocr_reserve(allocr, gf);
+        size_t mem_size = ggml_gallocr_get_buffer_size(allocr, 0);
+        fprintf(stderr, "%s: compute buffer size: %.2f MB\n", __func__, mem_size/1024.0f/1024.0f);
+    }
+
+    struct ggml_cgraph * gf_res = compute_graph(model, allocr);
+
+    struct ggml_tensor * pad_reflect_1d_res_0 = NULL;
+
+    for(int i = 0; i < gf_res->n_nodes; i++) {
+       if(strcmp(ggml_get_name(gf_res->nodes[i]), "pad_reflect_1d_res_0") == 0) {
+            pad_reflect_1d_res_0 = gf_res->nodes[i];
+        }
+    }
+
+    float* pad_reflect_1d_data_0 = new float[ggml_nelements(pad_reflect_1d_res_0)];
+
+    ggml_backend_tensor_get(pad_reflect_1d_res_0, pad_reflect_1d_data_0, 0, ggml_nbytes(pad_reflect_1d_res_0));
+
+    const int n_pad_reflect_1d_test_0 = 1035;
+
+    float expected_pad_reflect_0[n_pad_reflect_1d_test_0] = {5.0,4.0,3.0,2.0,1.0,0.0,1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0,11.0,12.0,13.0,14.0,15.0,16.0,17.0,18.0,19.0,20.0,21.0,22.0,23.0,24.0,25.0,26.0,27.0,28.0,29.0,30.0,31.0,32.0,33.0,34.0,35.0,36.0,37.0,38.0,39.0,40.0,41.0,42.0,43.0,44.0,45.0,46.0,47.0,48.0,49.0,50.0,51.0,52.0,53.0,54.0,55.0,56.0,57.0,58.0,59.0,60.0,61.0,62.0,63.0,64.0,65.0,66.0,67.0,68.0,69.0,70.0,71.0,72.0,73.0,74.0,75.0,76.0,77.0,78.0,79.0,80.0,81.0,82.0,83.0,84.0,85.0,86.0,87.0,88.0,89.0,90.0,91.0,92.0,93.0,94.0,95.0,96.0,97.0,98.0,99.0,100.0,101.0,102.0,103.0,104.0,105.0,106.0,107.0,108.0,109.0,110.0,111.0,112.0,113.0,114.0,115.0,116.0,117.0,118.0,119.0,120.0,121.0,122.0,123.0,124.0,125.0,126.0,127.0,128.0,129.0,130.0,131.0,132.0,133.0,134.0,135.0,136.0,137.0,138.0,139.0,140.0,141.0,142.0,143.0,144.0,145.0,146.0,147.0,148.0,149.0,150.0,151.0,152.0,153.0,154.0,155.0,156.0,157.0,158.0,159.0,160.0,161.0,162.0,163.0,164.0,165.0,166.0,167.0,168.0,169.0,170.0,171.0,172.0,173.0,174.0,175.0,176.0,177.0,178.0,179.0,180.0,181.0,182.0,183.0,184.0,185.0,186.0,187.0,188.0,189.0,190.0,191.0,192.0,193.0,194.0,195.0,196.0,197.0,198.0,199.0,200.0,201.0,202.0,203.0,204.0,205.0,206.0,207.0,208.0,209.0,210.0,211.0,212.0,213.0,214.0,215.0,216.0,217.0,218.0,219.0,220.0,221.0,222.0,223.0,224.0,225.0,226.0,227.0,228.0,229.0,230.0,231.0,232.0,233.0,234.0,235.0,236.0,237.0,238.0,239.0,240.0,241.0,242.0,243.0,244.0,245.0,246.0,247.0,248.0,249.0,250.0,251.0,252.0,253.0,254.0,255.0,256.0,257.0,258.0,259.0,260.0,261.0,262.0,263.0,264.0,265.0,266.0,267.0,268.0,269.0,270.0,271.0,272.0,273.0,274.0,275.0,276.0,277.0,278.0,279.0,280.0,281.0,282.0,283.0,284.0,285.0,286.0,287.0,288.0,289.0,290.0,291.0,292.0,293.0,294.0,295.0,296.0,297.0,298.0,299.0,300.0,301.0,302.0,303.0,304.0,305.0,306.0,307.0,308.0,309.0,310.0,311.0,312.0,313.0,314.0,315.0,316.0,317.0,318.0,319.0,320.0,321.0,322.0,323.0,324.0,325.0,326.0,327.0,328.0,329.0,330.0,331.0,332.0,333.0,334.0,335.0,336.0,337.0,338.0,339.0,340.0,341.0,342.0,343.0,344.0,345.0,346.0,347.0,348.0,349.0,350.0,351.0,352.0,353.0,354.0,355.0,356.0,357.0,358.0,359.0,360.0,361.0,362.0,363.0,364.0,365.0,366.0,367.0,368.0,369.0,370.0,371.0,372.0,373.0,374.0,375.0,376.0,377.0,378.0,379.0,380.0,381.0,382.0,383.0,384.0,385.0,386.0,387.0,388.0,389.0,390.0,391.0,392.0,393.0,394.0,395.0,396.0,397.0,398.0,399.0,400.0,401.0,402.0,403.0,404.0,405.0,406.0,407.0,408.0,409.0,410.0,411.0,412.0,413.0,414.0,415.0,416.0,417.0,418.0,419.0,420.0,421.0,422.0,423.0,424.0,425.0,426.0,427.0,428.0,429.0,430.0,431.0,432.0,433.0,434.0,435.0,436.0,437.0,438.0,439.0,440.0,441.0,442.0,443.0,444.0,445.0,446.0,447.0,448.0,449.0,450.0,451.0,452.0,453.0,454.0,455.0,456.0,457.0,458.0,459.0,460.0,461.0,462.0,463.0,464.0,465.0,466.0,467.0,468.0,469.0,470.0,471.0,472.0,473.0,474.0,475.0,476.0,477.0,478.0,479.0,480.0,481.0,482.0,483.0,484.0,485.0,486.0,487.0,488.0,489.0,490.0,491.0,492.0,493.0,494.0,495.0,496.0,497.0,498.0,499.0,500.0,501.0,502.0,503.0,504.0,505.0,506.0,507.0,508.0,509.0,510.0,511.0,512.0,513.0,514.0,515.0,516.0,517.0,518.0,519.0,520.0,521.0,522.0,523.0,524.0,525.0,526.0,527.0,528.0,529.0,530.0,531.0,532.0,533.0,534.0,535.0,536.0,537.0,538.0,539.0,540.0,541.0,542.0,543.0,544.0,545.0,546.0,547.0,548.0,549.0,550.0,551.0,552.0,553.0,554.0,555.0,556.0,557.0,558.0,559.0,560.0,561.0,562.0,563.0,564.0,565.0,566.0,567.0,568.0,569.0,570.0,571.0,572.0,573.0,574.0,575.0,576.0,577.0,578.0,579.0,580.0,581.0,582.0,583.0,584.0,585.0,586.0,587.0,588.0,589.0,590.0,591.0,592.0,593.0,594.0,595.0,596.0,597.0,598.0,599.0,600.0,601.0,602.0,603.0,604.0,605.0,606.0,607.0,608.0,609.0,610.0,611.0,612.0,613.0,614.0,615.0,616.0,617.0,618.0,619.0,620.0,621.0,622.0,623.0,624.0,625.0,626.0,627.0,628.0,629.0,630.0,631.0,632.0,633.0,634.0,635.0,636.0,637.0,638.0,639.0,640.0,641.0,642.0,643.0,644.0,645.0,646.0,647.0,648.0,649.0,650.0,651.0,652.0,653.0,654.0,655.0,656.0,657.0,658.0,659.0,660.0,661.0,662.0,663.0,664.0,665.0,666.0,667.0,668.0,669.0,670.0,671.0,672.0,673.0,674.0,675.0,676.0,677.0,678.0,679.0,680.0,681.0,682.0,683.0,684.0,685.0,686.0,687.0,688.0,689.0,690.0,691.0,692.0,693.0,694.0,695.0,696.0,697.0,698.0,699.0,700.0,701.0,702.0,703.0,704.0,705.0,706.0,707.0,708.0,709.0,710.0,711.0,712.0,713.0,714.0,715.0,716.0,717.0,718.0,719.0,720.0,721.0,722.0,723.0,724.0,725.0,726.0,727.0,728.0,729.0,730.0,731.0,732.0,733.0,734.0,735.0,736.0,737.0,738.0,739.0,740.0,741.0,742.0,743.0,744.0,745.0,746.0,747.0,748.0,749.0,750.0,751.0,752.0,753.0,754.0,755.0,756.0,757.0,758.0,759.0,760.0,761.0,762.0,763.0,764.0,765.0,766.0,767.0,768.0,769.0,770.0,771.0,772.0,773.0,774.0,775.0,776.0,777.0,778.0,779.0,780.0,781.0,782.0,783.0,784.0,785.0,786.0,787.0,788.0,789.0,790.0,791.0,792.0,793.0,794.0,795.0,796.0,797.0,798.0,799.0,800.0,801.0,802.0,803.0,804.0,805.0,806.0,807.0,808.0,809.0,810.0,811.0,812.0,813.0,814.0,815.0,816.0,817.0,818.0,819.0,820.0,821.0,822.0,823.0,824.0,825.0,826.0,827.0,828.0,829.0,830.0,831.0,832.0,833.0,834.0,835.0,836.0,837.0,838.0,839.0,840.0,841.0,842.0,843.0,844.0,845.0,846.0,847.0,848.0,849.0,850.0,851.0,852.0,853.0,854.0,855.0,856.0,857.0,858.0,859.0,860.0,861.0,862.0,863.0,864.0,865.0,866.0,867.0,868.0,869.0,870.0,871.0,872.0,873.0,874.0,875.0,876.0,877.0,878.0,879.0,880.0,881.0,882.0,883.0,884.0,885.0,886.0,887.0,888.0,889.0,890.0,891.0,892.0,893.0,894.0,895.0,896.0,897.0,898.0,899.0,900.0,901.0,902.0,903.0,904.0,905.0,906.0,907.0,908.0,909.0,910.0,911.0,912.0,913.0,914.0,915.0,916.0,917.0,918.0,919.0,920.0,921.0,922.0,923.0,924.0,925.0,926.0,927.0,928.0,929.0,930.0,931.0,932.0,933.0,934.0,935.0,936.0,937.0,938.0,939.0,940.0,941.0,942.0,943.0,944.0,945.0,946.0,947.0,948.0,949.0,950.0,951.0,952.0,953.0,954.0,955.0,956.0,957.0,958.0,959.0,960.0,961.0,962.0,963.0,964.0,965.0,966.0,967.0,968.0,969.0,970.0,971.0,972.0,973.0,974.0,975.0,976.0,977.0,978.0,979.0,980.0,981.0,982.0,983.0,984.0,985.0,986.0,987.0,988.0,989.0,990.0,991.0,992.0,993.0,994.0,995.0,996.0,997.0,998.0,999.0,1000.0,1001.0,1002.0,1003.0,1004.0,1005.0,1006.0,1007.0,1008.0,1009.0,1010.0,1011.0,1012.0,1013.0,1014.0,1015.0,1016.0,1017.0,1018.0,1019.0,1020.0,1021.0,1022.0,1023.0,1022.0,1021.0,1020.0,1019.0,1018.0,1017.0};
+
+
+    struct ggml_tensor * pad_reflect_1d_res_1 = NULL;
+
+    for(int i = 0; i < gf_res->n_nodes; i++) {
+       if(strcmp(ggml_get_name(gf_res->nodes[i]), "pad_reflect_1d_res_1") == 0) {
+            pad_reflect_1d_res_1 = gf_res->nodes[i];
+        }
+    }
+
+    float* pad_reflect_1d_data_1 = new float[ggml_nelements(pad_reflect_1d_res_1)];
+
+    ggml_backend_tensor_get(pad_reflect_1d_res_1, pad_reflect_1d_data_1, 0, ggml_nbytes(pad_reflect_1d_res_1));
+
+    const int n_pad_reflect_1d_test_1 = 3;
+
+    float expected_pad_reflect_1[n_pad_reflect_1d_test_1] = {1.0,0.0,1.0};
+
+    struct ggml_tensor * pad_reflect_1d_res_2 = NULL;
+
+    for(int i = 0; i < gf_res->n_nodes; i++) {
+       if(strcmp(ggml_get_name(gf_res->nodes[i]), "pad_reflect_1d_res_2") == 0) {
+            pad_reflect_1d_res_2 = gf_res->nodes[i];
+        }
+    }
+
+    float* pad_reflect_1d_data_2 = new float[ggml_nelements(pad_reflect_1d_res_2)];
+
+    ggml_backend_tensor_get(pad_reflect_1d_res_2, pad_reflect_1d_data_2, 0, ggml_nbytes(pad_reflect_1d_res_2));
+
+    const int n_pad_reflect_1d_test_2 = 20;
+
+    float expected_pad_reflect_2[n_pad_reflect_1d_test_2] = {7.0,6.0,5.0,4.0,3.0,2.0,1.0,0.0,1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,8.0,7.0,6.0};
+
+    struct ggml_tensor * pad_reflect_1d_res_3 = NULL;
+
+    for(int i = 0; i < gf_res->n_nodes; i++) {
+       if(strcmp(ggml_get_name(gf_res->nodes[i]), "pad_reflect_1d_res_3") == 0) {
+            pad_reflect_1d_res_3 = gf_res->nodes[i];
+        }
+    }
+
+    float* pad_reflect_1d_data_3 = new float[ggml_nelements(pad_reflect_1d_res_3)];
+
+    ggml_backend_tensor_get(pad_reflect_1d_res_3, pad_reflect_1d_data_3, 0, ggml_nbytes(pad_reflect_1d_res_3));
+
+    const int n_pad_reflect_1d_test_3 = 20;
+
+    float expected_pad_reflect_3[n_pad_reflect_1d_test_3] = {2.0,1.0,0.0,1.0,2.0,3.0,4.0,3.0,2.0,1.0,7.0,6.0,5.0,6.0,7.0,8.0,9.0,8.0,7.0,6.0};
+
+
+
+
+
+
+    printf("\nPerforming test:\n");
+
+    bool passed = true;
+    for(int i = 0; i < n_pad_reflect_1d_test_0; i++) {
+        if(
+            pad_reflect_1d_data_0[i] != expected_pad_reflect_0[i]) {
+            std::cout << "index: " << i << std::endl;
+            std::cout << "expected: " << expected_pad_reflect_0[i] << std::endl;
+            std::cout << "actual: " << pad_reflect_1d_data_0[i] << std::endl;
+            passed = false;
+            break;
+        }
+    }
+
+    printf("ggml_pad_reflect_1d (%d): %s\n", (int) ggml_nelements(pad_reflect_1d_res_0), passed && (ggml_nelements(pad_reflect_1d_res_0) == n_pad_reflect_1d_test_0) ? "\033[32mPASSED\033[0m" : "\033[31mFAILED\033[0m");
+    
+    passed = true;
+    for(int i = 0; i < n_pad_reflect_1d_test_1; i++) {
+        if(
+            pad_reflect_1d_data_1[i] != expected_pad_reflect_1[i]) {
+            std::cout << "index: " << i << std::endl;
+            std::cout << "expected: " << expected_pad_reflect_1[i] << std::endl;
+            std::cout << "actual: " << pad_reflect_1d_data_1[i] << std::endl;
+            passed = false;
+            break;
+        }
+    }
+
+    printf("ggml_pad_reflect_1d (%d): %s\n", (int) ggml_nelements(pad_reflect_1d_res_1), passed && (ggml_nelements(pad_reflect_1d_res_1) == n_pad_reflect_1d_test_1) ? "\033[32mPASSED\033[0m" : "\033[31mFAILED\033[0m");
+    
+    passed = true;
+    for(int i = 0; i < n_pad_reflect_1d_test_2; i++) {
+        if(
+            pad_reflect_1d_data_2[i] != expected_pad_reflect_2[i]) {
+            std::cout << "index: " << i << std::endl;
+            std::cout << "expected: " << expected_pad_reflect_2[i] << std::endl;
+            std::cout << "actual: " << pad_reflect_1d_data_2[i] << std::endl;
+            passed = false;
+            break;
+        }
+    }
+
+    printf("ggml_pad_reflect_1d (%d): %s\n", (int) ggml_nelements(pad_reflect_1d_res_2), passed && (ggml_nelements(pad_reflect_1d_res_2) == n_pad_reflect_1d_test_2) ? "\033[32mPASSED\033[0m" : "\033[31mFAILED\033[0m");
+    
+    passed = true;
+    for(int i = 0; i < n_pad_reflect_1d_test_3; i++) {
+        if(
+            pad_reflect_1d_data_3[i] != expected_pad_reflect_3[i]) {
+            std::cout << "index: " << i << std::endl;
+            std::cout << "expected: " << expected_pad_reflect_3[i] << std::endl;
+            std::cout << "actual: " << pad_reflect_1d_data_3[i] << std::endl;
+            passed = false;
+            break;
+        }
+    }
+
+    printf("ggml_pad_reflect_1d (%d): %s\n", (int) ggml_nelements(pad_reflect_1d_res_3), passed && (ggml_nelements(pad_reflect_1d_res_3) == n_pad_reflect_1d_test_3) ? "\033[32mPASSED\033[0m" : "\033[31mFAILED\033[0m");
+
+
+    ggml_free(model.ctx);
+
+    ggml_backend_buffer_free(model.buffer);
+    ggml_backend_free(model.backend);
+    ggml_gallocr_free(allocr);
+    return 0;
+}