corpus licensed under CC-BY 3.0
The Isan NLP porject want to develop Northeast Thailand local language tool for natural language processing tasks and want to preserve these languages.
Isan NLP เป็นโครงการพัฒนาการประมวลผลภาษาท้องถิ่นของภาคตะวันออกเฉียงเหนือ
ภาษาอีสานไม่มีจริง - อ้างอิง ไม่มีภาษาอีสานในโลกใบนี้ : อีสานใหม่
สาเหตุที่พัฒนา เพื่ออนุรักษ์ภาษาถิ่นในพื้นที่ภาคตะวันออกเฉียงเหนือของประเทศไทย
- Korat language (ภาษาโคราช) - List word only
- Nangrong language (ภาษานางรอง) - List word, Thai words, a few wordnet id, a few example.
- Phu Thai language (ภาษาผู้ไท) - WIP
- Word tokenizer with korat words and nangrong words
WIP
pip install IsanNLP