add exps

dikar8 · Oct 26, 2022 · 60721f7 · 60721f7
1 parent 34498f8
commit 60721f7
Show file tree

Hide file tree

Showing 2 changed files with 15 additions and 2 deletions.
diff --git a/README.md b/README.md
@@ -141,10 +141,23 @@ _Таблица №1 Сводная таблица_
 
 ![alt text](https://github.com/dpkaranov/org_name_similarity/blob/master/images/table1.png?raw=true)
 
-Вывод: несмотря на перевод слов на разные языки и мультиязычную базу самой модели, модель переобучилась. Это не столько очевидно по результатам тестов на тестовом наборе данных, выделенном из общего датасета, сколько по "ручной проверке". Так, например, модель не смогла отличить Газпром от Роснефти, а с этим примером может справиться даже расстояние Левенштейна. Тем не менее, этот эксперимент позволил отбросить одну из гипотез, а сравнение разных моделей показало, что гораздо больше смысла в обучении distiluse-base-multilingual-cased-v2 (на базе BERT), которая даже без обучения показала очень высокие показатели.
+_Вывод: несмотря на перевод слов на разные языки и мультиязычную базу самой модели, модель переобучилась. Это не столько очевидно по результатам тестов на тестовом наборе данных, выделенном из общего датасета, сколько по "ручной проверке". Так, например, модель не смогла отличить Газпром от Роснефти, а с этим примером может справиться даже расстояние Левенштейна. Тем не менее, этот эксперимент позволил отбросить одну из гипотез, а сравнение разных моделей показало, что гораздо больше смысла в обучении distiluse-base-multilingual-cased-v2 (на базе BERT), которая даже без обучения показала очень высокие показатели._
 
 ### Эксперимент №2 Создание нового датасета и обучение distiluse-base-multilingual-cased-v2
 
-### Эксперимент №3
+В этом эксперименте использовался иной принцип подготовки данных:
+
+1. найдены все уникальные значения (порядка 17 тыс на оба столбца).
+Во-вторых, все короткие значения были удалены
+
+### Эксперимент №3 Уменьшение размерности output-слоя при сохранении точности
+
+В ноутбуке 7 представлен эксперимент по созданию модели с уменьшенной размерностью последнего слоя (с 512 до 128). Может возникнуть вопрос почему сразу, еще до обучения модели не внести коррективы? В таком случае мы могли потерять важные фичи, кроме того, этот эксперимент предполагает изучение возможности снижения размера исходящего эмбеддинга для уже обученных моделей. Как видно из представленных данных, модель не отстает по точности от своего аналога.
 
 ## Оценка производительности
+
+На тестовых данных distiluse-base-multilingual-cased-v2 показала невероятные 1.0 по всем метрикам. Проверка модели на сложных примерах может показать её реальное качество. Почему сложные? Потому что часть примеров модель никогда не видела (например, на кириллице или российских наименований с сокращенным указанием формы собственности в начале строки "ООО", "ОАО" и т.д. ). Примеров немного, но даже на них модель distiluse-base-multilingual-cased-v2 продемонстрировала хорошие результаты, отличив Bridge от Бриджит Бардо, Зенит от Спартака и т.д. Модель не справилась с Роскачеством и Россетями, что показаывает о необходимости подготовки русскоязычной модели отдельно.
+
+_Проверка модели на сложных примерах_
+
+![alt text](https://github.com/dpkaranov/org_name_similarity/blob/master/images/hard2.png?raw=true)
diff --git a/images/hard2.png b/images/hard2.png