# -*-coding:utf-8-*-

from __future__ import print_function
import tensorflow as tf

import numpy as np

import datagenerater_new as dg

from datagenerater_new import *

import scipy.io as sio

from numpy.matlib import repmat

import os

import logging


# a linear layer

def linear(input, output_dim, scope=None, stddev=1.0):
    """
    :called by: GAN.generate, GAN.discriminator_spk, GAN.discriminator_noise
    :param input: tensor
    :param output_dim: output dimension
    :param scope:
    :param stddev: generate param for standard deviation
    :return: output tensor
    """
    norm = tf.random_normal_initializer(stddev=stddev)
    # stddev: 一个python标量或一个标量tensor,标准偏差的随机值生成
    const = tf.constant_initializer(0.0)
    # 初始化w和b
    with tf.variable_scope(scope):
        w = tf.get_variable("w", [input.get_shape()[1], output_dim], initializer=norm)

        b = tf.get_variable("b", [output_dim], initializer=const)

        return tf.matmul(input, w) + b


def batch_norm_wrapper(inputs, is_training, scope=None, decay=0.999):
    """
    :called by: GAN.generate, GAN.discriminator_spk, GAN.discriminator_noise
    :param inputs: tensor
    :param is_training: training start signal
    :param scope:
    :param decay: decay rate
    :return: tensor after batch_normalization
    """
    epsilon = 0.0001
    # epsilon = e 防止方差为0
    # decay 衰减率用于控制模型更新的速度
    with tf.variable_scope(scope):
        # gamma
        scale = tf.Variable(tf.ones([inputs.get_shape()[-1]]))
        # shift
        beta = tf.Variable(tf.zeros([inputs.get_shape()[-1]]))

        pop_mean = tf.Variable(tf.zeros([inputs.get_shape()[-1]]), trainable=False)

        pop_var = tf.Variable(tf.ones([inputs.get_shape()[-1]]), trainable=False)

        if is_training:

            batch_mean, batch_var = tf.nn.moments(inputs, [0])

            # shadow variable what for???
            train_mean = tf.assign(pop_mean, pop_mean * decay + batch_mean * (1 - decay))

            train_var = tf.assign(pop_var, pop_var * decay + batch_var * (1 - decay))

            with tf.control_dependencies([train_mean, train_var]):

                return tf.nn.batch_normalization(inputs, batch_mean, batch_var, beta, scale, epsilon)

        else:

            return tf.nn.batch_normalization(inputs, pop_mean, pop_var, beta, scale, epsilon)


class GAN(object):
    def __init__(self, model_path, logname):

        # Generate Layer
        self.g_h0_dim = 1024
        self.g_h1_dim = 1024
        self.g_h2_dim = 128

        # Discriminate speaker layer
        self.d_spk_h0 = 1024
        self.d_spk_h1 = 1024
        self.spk_lab_dim = 50

        # Discriminate noise layer

        self.d_noise_h0 = 1024
        self.d_noise_h1 = 1024
        self.noise_lab_dim = 6

        #
        self.input_dim = 627

        self.is_training = True

        self.model_path = model_path

        if not os.path.exists(self.model_path):
            os.makedirs(self.model_path)

        # set logging module
        self.logger = logging.getLogger('GAN-' + logname)
        self.logger.setLevel(logging.DEBUG)
        formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
        fh = logging.FileHandler(logname + '.log')
        fh.setFormatter(formatter)

        self.logger.addHandler(fh)

    def generator(self, input):

        # batch normalized input

        input_BN = batch_norm_wrapper(input, self.is_training, scope='in_G_BN')

        # hidden layer 0 on G

        h0 = linear(input_BN, self.g_h0_dim, 'g0')

        h0_BN = batch_norm_wrapper(h0, self.is_training, scope='g0_BN')

        h0_out = tf.nn.softplus(h0_BN, name='g0_out')

        # hidden layer 1 on G

        h1 = linear(h0_out, self.g_h1_dim, 'g1')

        h1_BN = batch_norm_wrapper(h1, self.is_training, scope='g1_BN')

        h1_out = tf.nn.softplus(h1_BN, name='g1_out')

        # hidden layer 2

        h2 = linear(h1_out, self.g_h2_dim, 'g2')

        h2_BN = batch_norm_wrapper(h2, self.is_training, scope='g2_BN')

        h2_out = tf.nn.tanh(h2_BN, name='g2_out')

        return h2_out

    def discriminator_spk(self, input):

        input_BN = batch_norm_wrapper(input, self.is_training, scope='in_D_BN')

        # hidden layer 0

        h0 = linear(input_BN, self.d_spk_h0, 'd0_spk')

        h0_BN = batch_norm_wrapper(h0, self.is_training, scope='d0_BN_spk')

        h0_out = tf.nn.sigmoid(h0_BN, name='d0_out_spk')

        # hiddenlayer 1

        h1 = linear(h0_out, self.d_spk_h1, 'd1_spk')

        h1_BN = batch_norm_wrapper(h1, self.is_training, scope='d1_BN_spk')

        h1_out = tf.nn.sigmoid(h1_BN, name='d1_out_spk')

        # output layer

        h2 = linear(h1_out, self.spk_lab_dim, 'd2_spk')

        h2_out = tf.nn.softmax(h2, name='d2_out_spk')

        return h2_out

    def discriminator_noise(self, input):

        input_BN = batch_norm_wrapper(input, self.is_training, scope='in_D_BN')

        # hidden layer 0

        h0 = linear(input_BN, self.d_noise_h0, 'd0_noise')

        h0_BN = batch_norm_wrapper(h0, self.is_training, scope='d0_BN_noise')

        h0_out = tf.nn.sigmoid(h0_BN, name='d0_out_noise')

        # hiddenlayer 1

        h1 = linear(h0_out, self.d_noise_h1, 'd1_noise')

        h1_BN = batch_norm_wrapper(h1, self.is_training, scope='d1_BN_noise')

        h1_out = tf.nn.sigmoid(h1_BN, name='d1_out_noise')

        # output layer

        h2 = linear(h1_out, self.noise_lab_dim, 'd2_noise')

        h2_out = tf.nn.softmax(h2, name='d2_out_noise')

        return h2_out

    def optimizer(self, loss, var_list, lab):
        """
         GradientDescentOptimizer
        :called by: create_model
        :param loss: loss
        :param var_list: variable list(W and b)
        :param lab:
        :return: optimizer object
        """
        initial_learning_rate = 0.005

        decay = 0.9

        num_decay_step = 150
        # batch = global_steps: Optional Variable to increment by one after the variables have been updated
        batch = tf.Variable(0)
        # every 150 training steps, learning_rate mul decay
        learning_rate = tf.train.exponential_decay(

            initial_learning_rate,

            batch,

            num_decay_step,

            decay,

            staircase=True

        )
        if lab == 'G':
            learning_rate = learning_rate
        else:
            learning_rate = learning_rate

        # 梯度下降，更新var_list减小loss
        m_optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(

            loss,

            global_step=batch,

            var_list=var_list

        )

        return m_optimizer

    def create_model(self):
        """

        :return:
        """
        # Discriminator pre-process
        with tf.variable_scope('D_pre'):
            # pass
            # create the whole model g+d_spk+d_noise
            self.pre_input = tf.placeholder(tf.float32, shape=(None, self.input_dim))

            self.pre_labs_spk = tf.placeholder(tf.float32, shape=(None, self.spk_lab_dim))

            self.pre_labs_noise = tf.placeholder(tf.float32, shape=(None, self.noise_lab_dim))
            #
            self.g_out = self.generator(self.pre_input)

            d_spk_out = self.discriminator_spk(self.g_out)

            d_noise_out = self.discriminator_noise(self.g_out)

            loss_spk = tf.reduce_mean(-tf.reduce_sum(self.pre_labs_spk * tf.log(d_spk_out + 1e-10), 1), 0)

            loss_noise = tf.reduce_mean(-tf.reduce_sum(self.pre_labs_noise * tf.log(d_noise_out + 1e-10), 1), 0)


        vars = tf.trainable_variables()

        self.d_pre_params = [v for v in vars if v.name.startswith('D_pre')]

        self.pre_loss = 0.5 * loss_spk + 0.5 * loss_noise

        self.pre_opt = self.optimizer(self.pre_loss, self.d_pre_params, 'd')

    def test_model(self, scp_file, model_name, savepath_in, savepath_out):

        self.is_training = False

        saver = tf.train.Saver()

        with tf.Session() as  session:

            saver.restore(session, model_name)

            m_testdata = dg.DataSet(scp_file, savepath_in, 1, 0)

            while 1:
                if m_testdata.get_epoch_complate() == 1:
                    break
                try:
                    data, filename = m_testdata.next_file()
                except Exception:
                    continue

                n, d = np.shape(data)

                if n < 3:
                    print(filename + 'ERRO\n')
                    self.logger.info(filename + 'ERRO')
                    continue

                m_G = session.run([self.g_out], {self.pre_input: data})
                savename = savepath_out + '/' + filename

                pathname = os.path.dirname(savename)

                if not os.path.exists(pathname):
                    os.makedirs(pathname)
                sio.savemat(savename, {'data': m_G})

    def train_model(self, train_scp, num_pertrain, num_GAN):

        print('read data')

        # m_traindata=dg.DataSet(train_scp,'',64,1)

        saver = tf.train.Saver(max_to_keep=10000)

        with tf.Session() as session:

            # tf.global_variables_initializer().run()
            tf.initialize_all_variables().run()

            # pre train discriminator   train_scp:rand_all.scp
            d = np.genfromtxt(train_scp, dtype=str)
            # number of data
            N = np.shape(d)[0]

            # mat file
            files_all = d[:, 1]
            # noise type
            labs_noise = d[:, 2]
            # spk label
            labs_spk = d[:, 0]
            self.batch_size = 64
            """
            CHANGE
            HERE (batch_size)
            ATTENTION
            """


            for epoch in range(num_GAN):
                # random sorting
                perm = np.arange(N)
                shuffle(perm)
                rand_train_files = [files_all[i] for i in perm]
                rand_train_labs_noise = [labs_noise[i] for i in perm]
                rand_train_labs_spk = [labs_spk[i] for i in perm]
                loss_g1 = 0
                # number of batch
                batch_idxs = N // self.batch_size
                for idx in range(0, batch_idxs):

                    zz = 'Epoch: ' + str(epoch) + ' ' + str(idx) + '---' + str(batch_idxs)
                    print(zz)
                    # select batch files
                    batch_train_files = rand_train_files[idx * self.batch_size:(idx + 1) * self.batch_size]
                    batch_train_labs_noise = rand_train_labs_noise[idx * self.batch_size:(idx + 1) * self.batch_size]
                    batch_train_labs_spk = rand_train_labs_spk[idx * self.batch_size:(idx + 1) * self.batch_size]
                    # function from datagenerater_new.py
                    batch_train = [readmat_lab(x, y, z) for (x, y, z) in
                                   zip(batch_train_files, batch_train_labs_noise, batch_train_labs_spk)]

                    data = []
                    lab_noise = []
                    lab_spk = []
                    try:
                        for x in batch_train:
                            if np.shape(x[0])[1] == 627:
                                data.append(x[0])
                                lab_noise.append(x[1])
                                lab_spk.append(x[2])
                    except IndexError as s:
                        continue

                    try:
                        data = np.concatenate(data)
                        lab_noise = np.concatenate(lab_noise)
                        lab_spk = np.concatenate(lab_spk)
                    except ValueError as s:
                        continue
                    """
                    data = [x[0] for x in batch_train]
                    lab_spk = [x[2] for x in batch_train]
                    lab_noise = [x[1] for x in batch_train]
                    # concatenate all data and labels
                    data = np.concatenate(data)
                    lab_spk = np.concatenate(lab_spk)
                    lab_noise = np.concatenate(lab_noise)
                    """


                    N = np.shape(lab_noise)[0]
                    # N x 7 matrix  type: clean
                    lab_G_noise = repmat([1, 0, 0, 0, 0, 0], N, 1)
                    # lab_G_noise = lab_noise;
                    tt = np.random.rand()
                    loss_d = 0.0


                    DNNtrain_loss, _ = session.run([self.pre_loss, self.pre_opt],
                                                   {self.pre_input: data, self.pre_labs_noise: lab_noise,
                                                   self.pre_labs_spk: lab_spk})

                    self.logger.info(
                        'step ' + str(epoch) + ' Batch ' + str(idx) + 'DNNtrain_loss ' + str(DNNtrain_loss))

                temp_savename = self.model_path + '/yu_GAN' + str(epoch) + '.ckpt'
                saver.save(session, save_path=temp_savename)
            saver.save(session, save_path=self.model_path + '/DNN_noise_spk.ckpt')


result_path = '/mnt/hd5/hutr/GAN_DATA/result'

extname = 'DNN_noise_spk'
my_modelpath = result_path + '/' + extname + '/model_temp'
my_logname = result_path + '/' + extname + '/log_temp'
print(my_modelpath)
print(my_logname)
print('create instance')
mymodel = GAN(my_modelpath, my_logname)
print('create model')
mymodel.create_model()
print('train 3')
mymodel.train_model('scp/train_GAN_mat.scp', 0, 60)
print('end')

database_path = '/mnt/hd5/hutr/GAN_DATA'
# test
print('test model')
inpath = database_path + '/UBM/mfcc'
outpath = database_path + '/UBM/GAN_' + extname
scp_UBM = 'scp/UBM.scp'
my_model_name = my_modelpath + '/DNN_noise_spk.ckpt'
mymodel.test_model(scp_file=scp_UBM, model_name=my_model_name, savepath_in=inpath, savepath_out=outpath)

# train clean  ??? or test

inpath = database_path + '/train_spk/mfcc/train_spk_clean'
outpath = database_path + '/train_spk/GAN_' + extname + '/train_spk_clean'
scp_train_spk = 'scp/train_spk.scp'
mymodel.test_model(scp_file=scp_train_spk, model_name=my_model_name, savepath_in=inpath, savepath_out=outpath)

# train noise
noises = ['white', 'babble', 'airplane', 'cantine', 'market']
snrs = ['10', '20']

for noise in noises:
    for snr in snrs:
        inpath = database_path + '/train_spk/mfcc/train_spk_' + noise + '/SNR_' + snr
        outpath = database_path + '/train_spk/GAN_' + extname + '/train_spk_' + noise + '/SNR_' + snr
        mymodel.test_model(scp_file=scp_train_spk, model_name=my_model_name, savepath_in=inpath, savepath_out=outpath)

# test clean
inpath = database_path + '/test_spk/mfcc/test_spk_clean'
outpath = database_path + '/test_spk/GAN_' + extname + '/test_spk_clean'
scp_test_spk = 'scp/test_spk.scp'
mymodel.test_model(scp_file=scp_test_spk, model_name=my_model_name, savepath_in=inpath, savepath_out=outpath)

# test noise
snrs = ['-5', '00', '05', '10', '15', '20']
for noise in noises:
    for snr in snrs:
        inpath = database_path + '/test_spk/mfcc/test_spk_' + noise + '/SNR_' + snr
        outpath = database_path + '/test_spk/GAN_' + extname + '/test_spk_' + noise + '/SNR_' + snr
        mymodel.test_model(scp_file=scp_test_spk, model_name=my_model_name, savepath_in=inpath, savepath_out=outpath)

# os.chdir("/gpfs/gss1/home/hongyu/GAN_denoise/matlabcode")

# cmd="matlab -nodisplay -r "+ ''' "doall('GAN_spk_noise_ngout')" '''

# os.system(cmd)