История изменений
Исправление wandrien, (текущая версия) :
Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.
Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.
Так как все экземпляры конкретной LLM идентичны, они дают примерно одинаковые ответы, типовые.
Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. То есть чтобы она не писала стихи вместо структуры СУБД.
На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».
Исправление wandrien, :
Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.
Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.
Так как все экземпляры конкретной LLM идентичены, они дают примерно одинаковые ответы, типовые.
Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. То есть чтобы она не писала стихи вместо структуры СУБД.
На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».
Исходная версия wandrien, :
Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.
Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.
Так как все экземпляры конкретной LLM идентичены, они дают примерно одинаковые ответы, типовые.
Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. ЕТо есть чтобы она не писала стихи вместо структуры СУБД.
На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».