Skip to content

keishihara/oasst_editor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

OASST-ja Editor

kunishou/oasst2-135k-jaの日本語訳テキストを手作業で修正するためのアプリです。

python 3.12.2で動作確認しています。

Quick start

# create virtural environment (first time only)
$ python3 -m venv env
$ source env/bin/activate
# install dependencies (first time only)
(env) $ pip install -U pip setuptools
(env) $ pip install -r requirements.txt

# start the annotation app
(env) $ streamlit run annotation_app.py --browser.serverAddress localhost

Edited data

編集したデータはedited_data_flat.jsonに保存されます。変更は自動で保存されませんので、忘れずにSave threadボタンを押すようにしてください。

アプリに表示されるデータは事前にkunishou/oasst2-135k-jaから、品質の低いデータを取り除いたのものみを使っています。翻訳元のoasst2あるlabelsのデータを使って品質の低いデータをフィルタリングしています。詳しくはこちらのnotebookを参照してください。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages