guidedmlm

Proof of concept uses generator to generate mask probability for each word and is trained by discriminator which predicts loss from mask probability and input

Blue: Guided MLM v1 (Uses 3x more compute for each training step) Orange: Standard MLM

First plot: Bert Loss Curve (log scale) Second plot: Discriminator Loss Curve (log scale)

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
bert		bert
data/train		data/train
images		images
.gitignore		.gitignore
README.md		README.md
__main__.py		__main__.py
dataset.py		dataset.py
memory.py		memory.py
plot.py		plot.py
trainer.py		trainer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

guidedmlm

About

Releases

Packages

Languages

YHL04/guidedmlm

Folders and files

Latest commit

History

Repository files navigation

guidedmlm

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages