История изменений
Исправление byko3y, (текущая версия) :
Литерали гадание по кофейной гуще в этом треде. Я думал, что сейчас будут возмущения плана «я ничо не вижу».
Можно улучшить результат более грамотным подбором тренировочных триплетов, но это всё равно дерьмо собачье. В статье за 2025 год
https://arxiv.org/pdf/2410.12757
видно, что на тестах STEL-or-Content все берты выдают в среднем 22-31%, хотя дают 76-90% на тестах с одинаковым контентом. Это очень плохой результат для нейросетки, которую нужно херову тучу времени файнтюнить. Для сравнения, state of the art гибриды дают 90-95% точности на STEL-or-Content. И этого стоило ожидать, потому что берты не для стилистики вообще разработаны были.
Исходная версия byko3y, :
Литерали гадание по кофейной гуще в этом треде. Я думал, что сейчас будут возмущения плана «я ничо не вижу».
Можно улучшить результат более грамотным подбором тренировочных триплетов, но это всё равно дерьмо собачье. В статье за 2025 год
https://arxiv.org/pdf/2410.12757
видно, что на тестах STEL-or-Content все берты выдают в среднем 22-31%, хотя дают 86-90% на тестах с одинаковым контентом. Это очень плохой результат для нейросетки, которую нужно херову тучу времени файнтюнить. Для сравнения, state of the art гибриды дают 90-95% точности на STEL-or-Content. И этого стоило ожидать, потому что берты не для стилистики вообще разработаны были.