请问是否计划支持Full-parameter Reward Model训练 #1011

DtYXs · 2023-09-22T08:49:22Z

No description provided.

hiyouga · 2023-09-22T08:56:07Z

#224

Refactor llmtuner, support full-parameter RLHF

…uga#931 hiyouga#936 hiyouga#1011 Refactor llmtuner, support full-parameter RLHF

hiyouga added the duplicate This issue or pull request already exists label Sep 22, 2023

hiyouga closed this as completed Sep 22, 2023

hiyouga mentioned this issue Nov 15, 2023

Refactor llmtuner, support full-parameter RLHF #1525

Merged

hiyouga added a commit that referenced this issue Nov 16, 2023

Merge #1525 from hiyouga/dev, fix #224 #336 #931 #936 #1011

f04bc2a

Refactor llmtuner, support full-parameter RLHF

sangttruong pushed a commit to painkillernhat/LLaMA-Factory that referenced this issue May 9, 2024

Merge hiyouga#1525 from hiyouga/dev, fix hiyouga#224 hiyouga#336 hiyo…

8d994ce

…uga#931 hiyouga#936 hiyouga#1011 Refactor llmtuner, support full-parameter RLHF

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问是否计划支持Full-parameter Reward Model训练 #1011

请问是否计划支持Full-parameter Reward Model训练 #1011

DtYXs commented Sep 22, 2023

hiyouga commented Sep 22, 2023

请问是否计划支持Full-parameter Reward Model训练 #1011

请问是否计划支持Full-parameter Reward Model训练 #1011

Comments

DtYXs commented Sep 22, 2023

hiyouga commented Sep 22, 2023