don't resize embeddings if it's already large enough #577

winglian · 2023-09-15T03:23:11Z

for example, we don't actually need to resize phi b/c the embeddings size is already much larger than the tokenizer len

>>> from transformers import AutoModelForCausalLM, AutoTokenizer
>>> tokenizer = AutoTokenizer.from_pretrained("microsoft/phi-1_5", trust_remote_code=True)
>>> len(tokenizer)
50295
>>> model = AutoModelForCausalLM.from_pretrained("microsoft/phi-1_5", trust_remote_code=True)
>>> model.get_input_embeddings().num_embeddings
51200
>>>

NanoCode012 · 2023-09-15T04:05:23Z

As I rmb, model.resize implicitly calls model.tie_weights. By doing this, we're not tying weights. I'm not clear whether this is still important as it was a warning message while finetuning a month ago.

It is also weird that the tokenizer's length and the model's weights have different length..

…ollective#577) * don't resize embeddings if it's already large enough * make sure to tie weights, even if we aren't resizing

don't resize embeddings if it's already large enough

2349ad5

winglian requested a review from NanoCode012 September 15, 2023 03:23

make sure to tie weights, even if we aren't resizing

8133f3b

winglian force-pushed the embeddings-sz branch from 2841fdd to 8133f3b Compare September 15, 2023 04:43

winglian merged commit 3607882 into main Sep 15, 2023
6 checks passed

winglian deleted the embeddings-sz branch September 15, 2023 19:47

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

don't resize embeddings if it's already large enough #577

don't resize embeddings if it's already large enough #577

winglian commented Sep 15, 2023

NanoCode012 commented Sep 15, 2023

don't resize embeddings if it's already large enough #577

don't resize embeddings if it's already large enough #577

Conversation

winglian commented Sep 15, 2023

NanoCode012 commented Sep 15, 2023