模型推理优化

huawei-noah · AmiyaSX · Feb 7, 2023 · Feb 7, 2023 · Feb 12, 2023 · Feb 13, 2023
commit 3b61d7c2e365ff45979b0bffccaa9b5cb44bb241
diff --git a/xt/model/dqn/dqn_cnn_ms.py b/xt/model/dqn/dqn_cnn_ms.py
@@ -17,6 +17,7 @@
 # LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 # OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 # THE SOFTWARE.
+
 from zeus.common.util.register import Registers
 from xt.model.model_ms import XTModel_MS
 from xt.model.ms_utils import MSVariables
@@ -26,7 +27,7 @@
  DynamicLossScaleUpdateCell, Cast, Cell, Tensor
 from zeus.common.util.common import import_config
 import mindspore.ops as ops
-
+import numpy as np
 
 @Registers.model
 class DqnCnnMS(XTModel_MS):
@@ -42,6 +43,7 @@ def __init__(self, model_info):
  self.dueling = model_config.get('dueling', False)
  self.net = DqnCnnNet(state_dim=self.state_dim, action_dim=self.action_dim, dueling=self.dueling)
  super().__init__(model_info)
+ self.net.compile(ms.Tensor(np.zeros((1, 84, 84, 4))).astype(ms.float32))
 
  def create_model(self, model_info):
  """Create Deep-Q CNN network."""
@@ -117,13 +119,13 @@ def __init__(self, network, optimizer, scale_sense=1, grad_clip=False, clipnorm=
  super(MyTrainOneStepCell, self).__init__(network, optimizer, scale_sense)
  self.grad_clip = grad_clip
 
- def construct(self, state, label):
+ def construct(self,*inputs ):
  weights = self.weights
- loss = self.network(state, label)
+ loss = self.network(*inputs)
  scaling_sens = self.scale_sense
  status, scaling_sens = self.start_overflow_check(loss, scaling_sens)
  scaling_sens_filled = ops.ones_like(loss) * ops.cast(scaling_sens, ops.dtype(loss))
- grads = self.grad(self.network, weights)(state, label, scaling_sens_filled)
+ grads = self.grad(self.network, weights)(*inputs, scaling_sens_filled)
  grads = self.hyper_map(ops.partial(_grad_scale, scaling_sens), grads)
  if self.grad_clip:
  grads = ops.clip_by_global_norm(grads, self.clipnorm)

diff --git a/xt/model/ms_compat.py b/xt/model/ms_compat.py
@@ -44,7 +44,7 @@ def import_ms_compact():
  from mindspore.nn import MSELoss
  from mindspore.train import Model
  from mindspore.nn import WithLossCell, TrainOneStepCell, SoftmaxCrossEntropyWithLogits, SequentialCell
- from mindspore.nn import Cell, WithLossCell, DynamicLossScaleUpdateCell, get_activation, LossBase
+ from mindspore.nn import Cell, WithLossCell, DynamicLossScaleUpdateCell, get_activation, LossBase, FixedLossScaleUpdateCell
  from mindspore import Model, Tensor
  from mindspore.ops import Cast, MultitypeFuncGraph, ReduceSum, ReduceMax, ReduceMin, ReduceMean, Reciprocal
  from mindspore.ops import Depend, value_and_grad, clip_by_global_norm, Minimum, Maximum, Exp, Square, clip_by_value

diff --git a/xt/model/muzero/muzero_model_ms.py b/xt/model/muzero/muzero_model_ms.py
@@ -1,3 +1,23 @@
+# Copyright (C) 2020. Huawei Technologies Co., Ltd. All rights reserved.
+#
+# Permission is hereby granted, free of charge, to any person obtaining a copy
+# of this software and associated documentation files (the "Software"), to deal
+# in the Software without restriction, including without limitation the rights
+# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+# copies of the Software, and to permit persons to whom the Software is
+# furnished to do so, subject to the following conditions:
+#
+# The above copyright notice and this permission notice shall be included in
+# all copies or substantial portions of the Software.
+#
+# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
+# THE SOFTWARE.
+
 import os
 import copy
 import typing
@@ -7,7 +27,7 @@
 from collections import OrderedDict
 from typing import List
 from mindspore import nn, ops, ParameterTuple
-from xt.model.ms_compat import ms, Tensor, Adam, Cell, TrainOneStepCell
+from xt.model.ms_compat import ms, Tensor, Adam, Cell, TrainOneStepCell，FixedLossScaleUpdateCell
 from xt.model.model_ms import XTModel_MS, check_keep_model
 from xt.model.muzero.default_config import LR, td_step
 from xt.model.muzero.muzero_utils_ms import value_compression_ms,\
@@ -16,7 +36,7 @@
 from xt.model.pb_format import pb_model
 from zeus.common.util.register import Registers
 from mindspore import set_context
-
+from xt.model.dqn.dqn_cnn_ms import MyTrainOneStepCell
 set_context(runtime_num_threads=3)
 
 # pylint: disable=W0201
@@ -83,8 +103,17 @@ def __init__(self, model_info):
  self.model.rnet, self.model.pnet)
  self.recur_infer_net = self.RecurInferNet(
  self.model.dnet, self.model.pnet)
- self.train_net = MyTrainOneStepCell(self.net_with_loss, self.adam)
+ device_target = ms.get_context("device_target")
+ if device_target == 'Ascend':
+ manager = FixedLossScaleUpdateCell(loss_scale_value=2**14)
+ self.train_net = MyTrainOneStepCell(self.net_with_loss, self.adam, manager)
+ elif device_target == "GPU" or device_target == "CPU" :
+ self.train_net = myTrainOneStepCell(self.net_with_loss, optimizer=self.adam)
+ else:
+ raise Exception("Target error, GPU or Ascend is supported.")
  super(MuzeroModelMS, self).__init__(model_info)
+ self.recur_infer_net.compile(ms.Tensor(np.zeros((1, 260))).astype(ms.float32))
+ self.init_infer_net.compile(ms.Tensor(np.zeros((1, 84, 84, 4))).astype(ms.float32))
 
  def create_model(self, model_info):
  self.full_model = MuzeroBaseMS(self.representation_network,
@@ -234,7 +263,7 @@ def value_inference(self, input_data):
  return np.asarray(value_list)
 
 
-class MyTrainOneStepCell(TrainOneStepCell):
+class myTrainOneStepCell(TrainOneStepCell):
  def __init__(self, network, optimizer):
  super(MyTrainOneStepCell, self).__init__(network, optimizer)
  self.depend = ops.Depend()
@@ -338,4 +367,4 @@ def dnet(self):
  return self.dynamic_network
  @property
  def pnet(self):
- return self.policy_network
+ return self.policy_network
diff --git a/xt/model/ppo/ppo_ms.py b/xt/model/ppo/ppo_ms.py
@@ -1,14 +1,35 @@
+# Copyright (C) 2020. Huawei Technologies Co., Ltd. All rights reserved.
+#
+# Permission is hereby granted, free of charge, to any person obtaining a copy
+# of this software and associated documentation files (the "Software"), to deal
+# in the Software without restriction, including without limitation the rights
+# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+# copies of the Software, and to permit persons to whom the Software is
+# furnished to do so, subject to the following conditions:
+#
+# The above copyright notice and this permission notice shall be included in
+# all copies or substantial portions of the Software.
+#
+# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
+# THE SOFTWARE.
+
 import numpy as np
 from xt.model.ppo.default_config import LR, BATCH_SIZE, CRITIC_LOSS_COEF,\
  ENTROPY_LOSS, LOSS_CLIPPING, MAX_GRAD_NORM, NUM_SGD_ITER, SUMMARY, VF_CLIP
 from xt.model.ms_dist import make_dist
 from zeus.common.util.common import import_config
 from zeus.common.util.register import Registers
 from xt.model.ms_compat import Cell, TrainOneStepCell, LossBase, ReduceMean, ReduceSum, Tensor, Adam
-from xt.model.ms_compat import Depend, value_and_grad, clip_by_global_norm, Minimum, Maximum, Exp, Square, clip_by_value
+from xt.model.ms_compat import Depend, value_and_grad, clip_by_global_norm, Minimum, Maximum, Exp, Square, clip_by_value, DynamicLossScaleUpdateCell,FixedLossScaleUpdateCell
 from xt.model.model_ms import XTModel_MS
 from xt.model.ms_utils import MSVariables
-
+import mindspore as ms
+from xt.model.dqn.dqn_cnn_ms import MyTrainOneStepCell
 
 @Registers.model
 class PPOMS(XTModel_MS):
@@ -48,11 +69,18 @@ def __init__(self, model_info):
 
  super().__init__(model_info)
  self.predict_net = self.PPOPredictPolicy(self.model, self.dist)
- adam = Adam(params=self.predict_net.trainable_params(), learning_rate=self._lr, use_amsgrad=False, use_locking=True)
+ adam = Adam(params=self.predict_net.trainable_params(), learning_rate=self._lr, use_amsgrad=True, use_locking=True)
  loss_fn = WithLossCell(self.critic_loss_coef, self.clip_ratio, self.ent_coef, self.vf_clip)
  forward_fn = NetWithLoss(self.model, loss_fn, self.dist)
- self.train_net = MyTrainOneStepCell(forward_fn, optimizer=adam, max_grad_norm=self._max_grad_norm)
- self.train_net.set_train()
+ device_target = ms.get_context("device_target")
+ if device_target == 'Ascend':
+ manager = FixedLossScaleUpdateCell(loss_scale_value=2**14)
+ self.train_net = MyTrainOneStepCell(forward_fn, adam, manager, grad_clip=True, clipnorm=self._max_grad_norm)
+ elif device_target == "GPU" or device_target == "CPU":
+ self.train_net = myTrainOneStepCell(forward_fn, optimizer=adam, max_grad_norm=self._max_grad_norm)
+ else:
+ raise Exception("Target error, GPU or Ascend is supported.")
+ self.predict_net.compile(ms.Tensor(np.zeros((1, 84, 84, 4))).astype(ms.float32))
 
  def predict(self, state):
  """Predict state."""
@@ -75,18 +103,19 @@ def train(self, state, label):
  state_ph = Tensor.from_numpy(state[0][mbinds])
  behavior_action_ph = Tensor.from_numpy(label[0][mbinds])
  old_logp_ph = Tensor.from_numpy(label[1][mbinds])
- adv_ph = Tensor.from_numpy(label[2][mbinds])
+ adv_ph = Tensor.from_numpy(label[2][mbinds]).astype(ms.float32)
  old_v_ph = Tensor.from_numpy(label[3][mbinds])
- target_v_ph = Tensor.from_numpy(label[4][mbinds])
- loss = self.train_net(state_ph, adv_ph, old_logp_ph, behavior_action_ph, target_v_ph, old_v_ph).asnumpy()
+ target_v_ph = Tensor.from_numpy(label[4][mbinds]).astype(ms.float32)
+ loss = self.train_net(state_ph, adv_ph, old_logp_ph, behavior_action_ph, target_v_ph, old_v_ph)
+ loss = loss.asnumpy()
  loss_val.append(np.mean(loss))
  self.actor_var = MSVariables(self.predict_net)
  return np.mean(loss_val)
 
 
-class MyTrainOneStepCell(TrainOneStepCell):
+class myTrainOneStepCell(TrainOneStepCell):
  def __init__(self, network, optimizer, max_grad_norm, sens=1.0):
- super(MyTrainOneStepCell, self).__init__(network, optimizer, sens)
+ super(myTrainOneStepCell, self).__init__(network, optimizer, sens)
  self.sens = sens
  self.depend = Depend()
  self.max_grad_norm = max_grad_norm