add exception

EleutherAI · trisongz · Jan 5, 2021 · Jan 11, 2021 · Jan 11, 2021 · Jan 12, 2021
commit abb5e46909e1886d110f13e6b14cc2f949ee0287
@@ -229,7 +229,7 @@ def tokenize_example(self, ex):
  if len(out) < self.max_seq_len:
  _to_pad = self.max_seq_len - len(out)
  out.extend([self.pad_token for i in range(_to_pad)])
- if tokenized['overflowing_tokens']:
+ if tokenized.get('overflowing_tokens', None):
  self.token_cache = tokenized['overflowing_tokens'].append(self.sep_token) 
 
  else:
@@ -238,7 +238,7 @@ def tokenize_example(self, ex):
  if len(out) < self.max_seq_len:
  _to_pad = self.max_seq_len - len(out)
  out.extend([self.pad_token for i in range(_to_pad)])
- if tokenized['overflowing_tokens']:
+ if tokenized.get('overflowing_tokens', None):
  self.token_cache = tokenized['overflowing_tokens'].append(self.sep_token)
 
  return torch.tensor(out, dtype=torch.long)