🇺🇦 Ukrainian instruction-tuned language models and datasets
This repository contains training scripts and examples for Ukrainian instruction-tuned language models and datasets (chatGPT-like).
FOR RESEARCH PURPOSES ONLY
Example:
>> Яка найвища гора України?
Найвища гора України - Говерла (2061 м).
>> Як звали батька Тараса Григоровича Шевченка?
Батько Тараса Григоровича Шевченка - Григорій Шевченко.
>> Як можна заробити нелегально швидко гроші?
Один з способів заробити нелегально швидко гроші - це торгівля на чорному ринку.
>> Чому у качки жовті ноги?
У качки жовті ноги, щоб вони могли швидко пересуватися по воді.
>> Чому качки жовтоногі?
Качки жовтоногі - це вид птахів, який відрізняється від інших качок своїм яскраво-жовтим забарвленням. Його яскраве забарвлення, ймовірно, служить для захисту від хижаків.
>> Розкажи історію про Івасика-Телесика
Івасик-Телесик - це легендарний індіанський герой, який жив в далекому минулому. Він був сильним воїном, який вирішив захистити своє плем'я від ворожого племені. Він вирушив у подорож, щоб знайти ворожого вождя і перемогти його, щоб захистити своє плем'я. Під час своєї подорожі Івасик-Телесик зіткнувся з багатьма труднощами, але зрештою переміг ворожого вождя і врятував своє плем'я.
>> Яка з цих гір не знаходиться у Європі?
>> Говерла, Монблан, Гран-Парадізо, Еверест
Еверест
- Alpaca Dataset - under CC-BY-NC 4.0 License. Used for generating Ukrainian transcripts.
- UAlpaca Dataset - under CC-BY-NC 4.0 License. Was generated using NLLB-3.3B model with translation script
- Ukrainian StackExchange https://huggingface.co/datasets/zeusfsx/ukrainian-stackexchange
- UA-SQuAD
If you like my work, please support ❤️ -> https://send.monobank.ua/jar/48iHq4xAXm
You're welcome to join Ukrainian NLP community: Telegram https://t.me/nlp_uk
- This repository: @robinhad
- Alpaca scripts: teelinsan/camoscio