История изменений

Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.

Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.

Так как все экземпляры конкретной LLM идентичны, они дают примерно одинаковые ответы, типовые.

Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. То есть чтобы она не писала стихи вместо структуры СУБД.

На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».

Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.

Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.

Так как все экземпляры конкретной LLM идентичены, они дают примерно одинаковые ответы, типовые.

Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. То есть чтобы она не писала стихи вместо структуры СУБД.

На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».

Пример - создание стихов. Пусть стиль будет такой, сильно поэтический. Где автор находит очень необычные сочетания слов в стихах. Может ли это делать LLM? Задача то заключается в том, чтобы найти принципиально новые, оригинальные сочетания и последовательности слов, сломать привычный язык. А LLM решает противоположную задачу - имитировать привычный язык. Поэтому ничего она не сделает, by design. Она может только копировать уже созданный человеком-поэтом стиль, на стихах которого ее обучили, просто переиспользуя те закономерности построения текста, которые поэт использовал в своих стихах. Чтобы создать новое, нужно понимать смысл самих элементов текста, а не просто знать закономерности последовательностей элементов.

Чтобы система давала уникальные идеи, у системы должен быть индивидуальный, отличающийся от других, опыт.

Так как все экземпляры конкретной LLM идентичены, они дают примерно одинаковые ответы, типовые.

Более того, тут еще присутствует эффект отупения в результате SFT и RLHF. Задача разработчика в том, чтобы модель имела предсказуемый Alignment, а не в том, чтобы была творческой. ЕТо есть чтобы она не писала стихи вместо структуры СУБД.

На практике это наблюдается в том, что если спрашивать модель на темы, которые слабее связаны областями знаний, на которых ей делали post-traning, то зачастую она даёт менее структурные и более СОДЕРЖАТЕЛЬНЫЕ ответы, за рамками вот этого узнаваемого «стиля LLM».