История изменений

Исправление byko3y, 04.01.26 00:39 (текущая версия) :

Литерали гадание по кофейной гуще в этом треде. Я думал, что сейчас будут возмущения плана «я ничо не вижу».

Можно улучшить результат более грамотным подбором тренировочных триплетов, но это всё равно дерьмо собачье. В статье за 2025 год
https://arxiv.org/pdf/2410.12757
видно, что на тестах STEL-or-Content все берты выдают в среднем 22-31%, хотя дают 76-90% на тестах с одинаковым контентом. Это очень плохой результат для нейросетки, которую нужно херову тучу времени файнтюнить. Для сравнения, state of the art гибриды дают 90-95% точности на STEL-or-Content. И этого стоило ожидать, потому что берты не для стилистики вообще разработаны были.

Исходная версия byko3y, 04.01.26 00:38:

Литерали гадание по кофейной гуще в этом треде. Я думал, что сейчас будут возмущения плана «я ничо не вижу».

Можно улучшить результат более грамотным подбором тренировочных триплетов, но это всё равно дерьмо собачье. В статье за 2025 год
https://arxiv.org/pdf/2410.12757
видно, что на тестах STEL-or-Content все берты выдают в среднем 22-31%, хотя дают 86-90% на тестах с одинаковым контентом. Это очень плохой результат для нейросетки, которую нужно херову тучу времени файнтюнить. Для сравнения, state of the art гибриды дают 90-95% точности на STEL-or-Content. И этого стоило ожидать, потому что берты не для стилистики вообще разработаны были.