Update to work with args 1.

EleutherAI · joshlk · Feb 28, 2021 · Feb 19, 2021 · Feb 19, 2021 · Feb 21, 2021
commit 5b9792f916c44911a2e9e24bbe8e8b0037b7ad7b
@@ -586,11 +586,16 @@ class ParallelTransformer(MegatronModule):
  """Transformer class."""
 
  def __init__(self, attention_mask_func,
- init_method, output_layer_init_method,
- rpe=True, rpe_causal=False, rpe_num_buckets=32, rpe_max_distance=128):
+ init_method, output_layer_init_method):
+# rpe=True, rpe_causal=False, rpe_num_buckets=32, rpe_max_distance=128):
  super(ParallelTransformer, self).__init__()
  args = get_args()
 
+ self.rpe = args.rpe # True
+ self.rpe_causal = args.rpe_causal # False
+ self.rpe_num_buckets =.args.rpe_num_buckets # 32
+ self.rpe_max_distance = args.rpe_max_distance # 128
+
  # Store activation checkpoiting flag.
  self.checkpoint_activations = args.checkpoint_activations
  self.checkpoint_num_layers = args.checkpoint_num_layers