Коллекция отзывов на автомобили (тексты для анализа тональности) // Dataset of car reviews for machine learning (sentiment analysis)
- 6152 текста;
- язык: русский;
- формат: файлы txt;
- структура файлов: первая строка -- заголовок, вторая строка -- оценка по 5-балльной шкале (1-5); далее -- текст отзыва;
- размер: 9.37 Мб;
- тексты собраны в мае 2018.
Для использования в научных целях. При использовании коллекции процитируйте, пожалуйста, это статью: Глазкова А.В. ОЦЕНКА СТЕПЕНИ БЛИЗОСТИ КАТЕГОРИЙ ТЕКСТОВ ПРИ РЕШЕНИИ ЗАДАЧ КЛАССИФИКАЦИИ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2015. № 2 (31). С. 18-25.
- 6152 texts;
- Russian;
- format: .txt;
- file structure: the first line is the header, the second line is the score on a 5-point scale (1-5); further - the text of the review;
- size: 9.37 Mb;
- collected in May 2018.
Academic use only. Citation: Glazkova A. The evaluation of the proximity of text categories for solving electronic documents classification tasks //VESTNIK TOMSKOGO GOSUDARSTVENNOGO UNIVERSITETA-UPRAVLENIE VYCHISLITELNAJA TEHNIKA I INFORMATIKA-TOMSK STATE UNIVERSITY JOURNAL OF CONTROL AND COMPUTER SCIENCE. – 2015. – Т. 31. – №. 2. – С. 18-25.