В чём реальная проблема ЛЛМ

0

2

нет смысла тренировать что-то своё на коленке, потому что это будет либо какой-то суперкастомный идиот, либо система, которая слишком много галлюцинирует (дуальная проблема увеличения шума против нерепрезентативности данных); а большую модель вы на коленке всё равно не натренируете.
поскольку проблема 1) - фундаментальная теоретическая проблема, коммерческие ЛЛМ идут по пути "пусть будет больше шума, всё равно первоначально у клиента будет «вау-эффект», и он купит подписку или кредиты. И вот тут самый цимес закрался. В отличие от человеческого интеллекта, возможности которого в отношение себя любимого мы может прогнозировать плюс-минус, не ошибаясь на порядки, в случае с ЛЛМ вы никогда не сможете оценить финансовые затраты на решение задачи. По моему опыту ЛЛМ лучше всего справляются с утилитами и гуишными тулзами строк на 3тыс кода, но не сильно больше. После определенного барьера, который можно условно измерить как количество строк в более или менее формализованном виде (в том, в котором сапиенсы пишут ТЗ для других сапиенсов), в промпты надо включать тупо всё ТЗ с самого начала.

Т.е. даже на платном антропике оно в какой-то момент начинает лажать и забывать изначальные вводные, которые были вот, совсем недавно, 10 промптов до того.

т.о., мы приходим к такому выводу, что промптинг нихрена не совместим с agile разработкой. Он создаёт видимость того, что в контексте есть данные, которые нам важны для дальнейших шагов, но это не так, потому что ЛЛМ не умеет интерпретировать токены, это тупая модель на больших данных, и соотв. давать ей задания лучше всего сразу готовые, в которых ещё за ручку надо объяснять, как что кодировать, иначе будет такая лапша, которую только эта модель ЛЛМ сможет дальше модифицировать, если не потеряет контекст мысли автора.

Т.е., по моему опыту, лажа начинается уже до 5к сток кода. И в определенный момент ты думаешь «слушай, спасибо, что ты типа нагуглил мне этот фреймворк, о котором я понятия не имел, что такое вообще есть, но дальше я сам буду читать мануалы, и буду кодировать сам, потому что тебе очень дорого всё разжёвывать, и эмоционально, и финансово».

Ссылка

← На kernel.org по ошибке удалили со всех зеркал архивы с кодом ядра

Воровство данных ллм-ками →

← 1 2 →

Ты неправильно LLM используешь, надо запускать их под агентом, который ограничен скилами и сам разбивает задачу на более мелкие. После выполнения каждой такой задачи контекст чистится и проводится проверка работоспособности кода и вносятся правки

Satou ★★★★★
(03.07.26 11:30:08 MSK)

Т.е., по моему опыту, лажа начинается уже до 5к сток кода.

А ты не сравнивал производительность исполняемого кода, созданного нейронной сетью и написанного грамотным инженером? Избыточность строк исходного кода относительно ручного написания ПО имеется?

Enthusiast ★★★★
(03.07.26 11:33:06 MSK)

А была такая красивая сказка, что всех программистов уволят…

А теперь.. всё равно работать надо…

unDEFER ★★★★★
(03.07.26 12:13:26 MSK)

Ссылка

Ответ на: комментарий от Enthusiast 03.07.26 11:33:06 MSK

Я последний раз занимался оптимизацией кода по производительности в универе, т.е. очень давно.

Современные реалии моей работы в том, что самые ресурсоемкие части системы выполняют асики (или плисы - не суть важно, что именно) которые работают в программно-аппаратном комплексе за кучу бабок штука.

Соответственно, единственное, что требуется от непосредственно софтовой прикладной части системы - быть алгоритмически корректной, при условии, что всё механизмы параллельности уже отлажены в фреймворках.

seiken ★★★★★
(03.07.26 12:14:34 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 12:14:34 MSK

Т.е. на самом деле, программный код - это дешевое говно по определению. Оно так задумано глобально сапиенсом, концептуально. И, соответственно, у ЛЛМ просто нет экономической целесообразности. Смысл софтовой индустрии - в воспроизводстве говна. А ЛЛМ слишком некреативны для этого.

seiken ★★★★★
(03.07.26 12:17:01 MSK) автор топика
Последнее исправление: seiken 03.07.26 12:17:22 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Satou 03.07.26 11:30:08 MSK

Интересно, ты лично пробовал в таком режиме работать с LLM?

anonymous_incognito ★★★★★
(03.07.26 12:18:46 MSK)

Ссылка

Ответ на: комментарий от Satou 03.07.26 11:30:08 MSK

Проблема в том, что всё равно вся эта системы будет работать как оверпрайснутый Джун, потому что всё равно всё надо будет объяснять на естественном языке.

seiken ★★★★★
(03.07.26 12:19:42 MSK) автор топика

Ссылка

По моему опыту ЛЛМ лучше всего справляются с утилитами и гуишными тулзами строк на 3тыс кода, но не сильно больше.

Т.е., по моему опыту, лажа начинается уже до 5к сток кода. И в определенный момент ты думаешь «слушай, спасибо, что ты типа нагуглил мне этот фреймворк, о котором я понятия не имел, что такое вообще есть, но дальше я сам буду читать мануалы, и буду кодировать сам, потому что тебе очень дорого всё разжёвывать, и эмоционально, и финансово».

Буквально из твоих слов следует, что для LLM задачу надо делить на подзадачи до 3 тыс.кода, поручать им эти части, а самому «руководить и направлять».

anonymous_incognito ★★★★★
(03.07.26 12:23:32 MSK)

Ответ на: комментарий от anonymous_incognito 03.07.26 12:23:32 MSK

Буквально из твоих слов следует, что для LLM задачу надо делить на подзадачи до 3 тыс.кода, поручать им эти части, а самому «руководить и направлять».

Проблема в том, что не все задачи можно так поделить. Будет какая-то суперсистема, типа обработчика ошибок, которая должна охватить всё, знать всё о проекте.

Но, когда можно, то, да.

tiinn ★★★★★
(03.07.26 12:29:46 MSK)

Ответ на: комментарий от tiinn 03.07.26 12:29:46 MSK

Будет какая-то суперсистема, типа обработчика ошибок, которая должна охватить всё, знать всё о проекте.

Для неё придётся отдельную документацию составить, которая будет подсовываться в LLM. LLM ведь не работает с кодом реализации всех API.

anonymous_incognito ★★★★★
(03.07.26 12:37:10 MSK)

Ответ на: комментарий от seiken 03.07.26 12:14:34 MSK

Я последний раз занимался оптимизацией кода по производительности в универе, т.е. очень давно.

Мой бывший работодатель тоже так думал лет 20. А потом упёрлись в производительность топовых десктопов, и пришлось учиться оптимизировать.

question4 ★★★★★
(03.07.26 12:43:28 MSK)

Ответ на: комментарий от tiinn 03.07.26 12:29:46 MSK

Проблема в том, что не все задачи можно так поделить. Будет какая-то суперсистема, типа обработчика ошибок, которая должна охватить всё, знать всё о проекте.

Почему нельзя в обработчике ошибок сделать отдельно общую алгоритмическую часть, втиснув её в эти 3000, а отдельно — независимые модули на каждую ошибку или группу ошибок? Возможно, какие-то модули вообще не будут содержать функций — только данные, которые нужно подставить.

question4 ★★★★★
(03.07.26 12:47:42 MSK)

потому что тебе очень дорого всё разжёвывать

Очевидно же, что язык программирования гораздо лучше приспособлен для описания проблемы компу, чем язык естественный. Поэтому объём описания на естественном языке всегда будет больше. Это ещё в 60-х годах поняли и перестали делать ЯП устроенные как речь.

no-such-file ★★★★★
(03.07.26 13:04:27 MSK)

Ответ на: комментарий от question4 03.07.26 12:43:28 MSK

тоже так думал лет 20. А потом упёрлись в производительность топовых десктопов

Т.е. целых 20 лет удавалось не тратить время на всякую херню, а решать более общие задачи. Это же замечательно.

no-such-file ★★★★★
(03.07.26 13:06:27 MSK)

Ответ на: комментарий от question4 03.07.26 12:47:42 MSK

Потому что в обработчике-то можно, но если это что-то большее, чем обработчик, то не выйдет. Например, чтобы переконфигурировать систему из самолёта в подводную лодку, надо знать, чем каждая часть в данный момент занимается, все ли модули выполнены по стандарту MIL-STD-810G, допустимо ли потерять модули, которые не выполнены, как организованы взаимодействия между модулями - по воздуху, по проводу, по радиоканалу и т.д. и т.п.

tiinn ★★★★★
(03.07.26 13:07:24 MSK)

Ссылка

Ответ на: комментарий от Satou 03.07.26 11:30:08 MSK

надо запускать их под агентом

Агенты нужны чтобы ИИ решал задачу проактивно. Проблему полноты описания задачи это никак не решает.

no-such-file ★★★★★
(03.07.26 13:08:32 MSK)

Ссылка

Ответ на: комментарий от anonymous_incognito 03.07.26 12:37:10 MSK

Для неё придётся отдельную документацию составить,

Ну, удачи. В производственном аду, когда система постоянно меняется, иметь чёткую документацию.

tiinn ★★★★★
(03.07.26 13:15:36 MSK)

Ответ на: комментарий от anonymous_incognito 03.07.26 12:23:32 MSK

Вроде бы да. Но проблема в том, что как только будет готов первый вариант системы, и он даже будет работать. Но для второго этапа ты запаришься объяснять ЛЛМ, как его дальше менять осмысленно.

Я согласен, что ЛЛМ - это очень крутая тулза, но в основном для «бутстрапинга» кода и экспериментальной проверки всяких гипотез о реальных технических компонентах ПО. Для устойчивой гарантии качества всё равно нужны все те же дорогущие сапиенсы.

seiken ★★★★★
(03.07.26 13:17:32 MSK) автор топика

Ссылка

Ответ на: комментарий от no-such-file 03.07.26 13:04:27 MSK

Большой вопрос, подходят ли ЯП для LLM в качестве решения задачи. Возможно, для написания ПО ИИшечкой нужно создать новый язык.

tiinn ★★★★★
(03.07.26 13:17:41 MSK)

Ответ на: комментарий от tiinn 03.07.26 13:17:41 MSK

Не думаю, что здесь можно найти золотую середину. ЯП с более простой структурой бесполезны, если нужно писать весь мир с нуля без батареек и чтобы теоретически в будущем это кто-то мог поддерживать без доступа к ЛЛМ. ЯП, на которых дохрена кода в опенсорс (типа JS) плохи, потому что для них куча библиотек, фреймворков, версий, и неизбежно будет больше галлюцинаций.

seiken ★★★★★
(03.07.26 13:24:09 MSK) автор топика

Ответ на: комментарий от question4 03.07.26 12:43:28 MSK

Ну мы работаем на таких дешманских нодах, что ни в какие пределы мы ещё годами не упремся.

seiken ★★★★★
(03.07.26 13:38:40 MSK) автор топика
Последнее исправление: seiken 03.07.26 13:38:53 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от seiken 03.07.26 13:24:09 MSK

Ваш аргумент похож на то, что ЯП высокого уровня бесполезен, если нужно писать весь мир с нуля без батареек для контроллера, для которого есть спеки, чтобы теоретически в будущем это кто-то мог поддерживать без доступа к исходникам. Типа, дизасм бинарников даст вам исходники.

Так и тут - с чего вы взяли, будто ЯП будет пользоваться большинство программистов, а не полтора человека на всю планету (как нынче обстоит дело с программированием на ассемблере)? А всё остальное будет писать ИИ-шечка.

tiinn ★★★★★
(03.07.26 13:52:19 MSK)

Ответ на: комментарий от tiinn 03.07.26 13:52:19 MSK

Ну покажи мне контору, которая создала бы продукт уровня файрфокса на ЛЛМ с ассемблером в качестве ЯП.

seiken ★★★★★
(03.07.26 13:56:38 MSK) автор топика

фундаментальная теоретическая проблема

«Преждевременная оптимизация — корень всех зол.» // Дональд-наш-Кнут © (wikiquote.org).

система, которая слишком много галлюцинирует

Это следствие неустойчивости модели к изменчивому контексту. Теоретически лечится избыточностью обучающих данных и строгим отделением их от проверочной выборки.

quickquest ★★★★★
(03.07.26 14:08:09 MSK)

Ответ на: комментарий от quickquest 03.07.26 14:08:09 MSK

Да. И это вообще самый сложный аспект биг даты, о котором надо говорить со школьной скамьи.

seiken ★★★★★
(03.07.26 14:15:42 MSK) автор топика

Ссылка

Ответ на: комментарий от tiinn 03.07.26 12:29:46 MSK

Проблема в том, что не все задачи можно так поделить. Будет какая-то суперсистема, типа обработчика ошибок, которая должна охватить всё, знать всё о проекте.

Очень абстрактный пример без конкретики, но он уже попахивает говнодизайном. Если напишешь конкретнее, можно попробовать разобрать. Но всяких «суперсистем» в проекте обычно не должно быть.

Gary ★★★★★
(03.07.26 14:21:51 MSK)

Ответ на: комментарий от Gary 03.07.26 14:21:51 MSK

Кстати, исключения а ля плюсы/Ада были как раз придуманы ради дизайна «я не знаю, каким ошибкам приведет падение меня как отдельного модуля». Но макаки типа тех, кто Ариан в 90х уронил, не поняли, как пользоваться этим механизмом.

seiken ★★★★★
(03.07.26 14:28:19 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 13:56:38 MSK

Почему сразу с ассемблером в качестве ЯП? Надо произвести исследования, нельзя ли повысить эффективность программировалия ЛЛМ, если не ограничиваться существующими ЯП.

tiinn ★★★★★
(03.07.26 14:28:32 MSK)

Ответ на: комментарий от Gary 03.07.26 14:21:51 MSK

Очень абстрактный пример без конкретики, но он уже попахивает говнодизайном.

Дык, процентов 80 современного ПО - это говнодизайн.

tiinn ★★★★★
(03.07.26 14:29:17 MSK)

Ответ на: комментарий от tiinn 03.07.26 14:28:32 MSK

Это не решает основной проблемы: кто-то из сапиенсов должен проверить код. Чем более высокоуровневый ЯП, тем проще это сделать.

seiken ★★★★★
(03.07.26 14:30:03 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 14:30:03 MSK

Что за ошибки ЛЛМ отвечать будет промпт-инженер, а не разраб ЛЛМ, надеюсь, объяснять не надо.

seiken ★★★★★
(03.07.26 14:31:47 MSK) автор топика

Ссылка

Ответ на: комментарий от seiken 03.07.26 14:28:19 MSK

Но макаки типа тех, кто Ариан в 90х уронил, не поняли, как пользоваться этим механизмом.

Всё они прекрасно понимали, просто обработка исключений занимает дополнительные вычислительные ресурсы, поэтому, они просто не стали нагружать тамошний дохленький компьютер дополнительной обёрткой в try-catch именно того кода, который и сбойнул. А не стали оборачивать, ибо предполагали, что эти переменные никогда не уйдут в минус из-за физических особенностей Ариан-4. Ага, на Ариан-5, который не имел этих физических особенностей.

tiinn ★★★★★
(03.07.26 14:33:04 MSK)

Ответ на: комментарий от seiken 03.07.26 14:30:03 MSK

Это не решает основной проблемы: кто-то из сапиенсов должен проверить код.

Ровно то же самое говорили про Алгол-60, компилятор которого на первых порах генерировал эталонную ахинею, которая работала дай бог через раз.

tiinn ★★★★★
(03.07.26 14:34:25 MSK)

Ответ на: комментарий от tiinn 03.07.26 13:15:36 MSK

В производственном аду, когда система постоянно меняется, иметь чёткую документацию.

Документацию тоже LLM-ка может генерить отдельной задачей. Или даже другая LLM. Но я не пробовал так работать.

anonymous_incognito ★★★★★
(03.07.26 14:37:21 MSK)
Последнее исправление: anonymous_incognito 03.07.26 14:37:41 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от tiinn 03.07.26 14:33:04 MSK

Это и есть «не уметь в исключения».

seiken ★★★★★
(03.07.26 14:39:14 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 14:39:14 MSK

Не, я считаю, это неверное «повторное использование кода» прежде всего. Во вторую очередь - излишняя оптимизация по принципу «хотели как лучше, а получилось как всегда»

tiinn ★★★★★
(03.07.26 14:41:24 MSK)

Ссылка

Ответ на: комментарий от tiinn 03.07.26 14:34:25 MSK

Есть одна большая проблема в этой аналогии. Компилятор алгола купил один раз, и используешь, он не будет просить денег, чтобы отрефакторить код для следующего коммита. А с ЛЛМ нужно платить фактически за вычислительный ресурс за каждый токен, каждый раз. На любой чих.

seiken ★★★★★
(03.07.26 14:47:33 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 14:47:33 MSK

А с ЛЛМ нужно платить фактически за вычислительный ресурс за каждый токен, каждый раз. На любой чих.

Используйте локальную ЛЛМ.

tiinn ★★★★★
(03.07.26 14:48:31 MSK)

Ответ на: комментарий от seiken 03.07.26 14:47:33 MSK

Т.е. фактически, мы платим не за какие-то квантово-механические ноухау, а тупо за ресурс барыг-монополистов.

seiken ★★★★★
(03.07.26 14:49:10 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 14:49:10 MSK

Используйте локальную ЛЛМ.

tiinn ★★★★★
(03.07.26 14:49:38 MSK)

Ссылка

Ответ на: комментарий от tiinn 03.07.26 14:48:31 MSK

Это будет говно на палке. Если бы можно было универсальную ЛЛМ сделать на коленке, ОпенАИ с антропиками даже не взлетели бы.

seiken ★★★★★
(03.07.26 14:50:07 MSK) автор топика

Слушай ну натрави ты соннет на лорчик, раз сам не вдупляешь. Уже сколько раз и я и остальные писали что в 2026 рулят скиллы и зерошотные техники. Галюны после 3-4 промтов это банальное следствие мат модели, пруфов уже хоть жопой ешь.

Lordwind ★★★★★
(03.07.26 14:50:30 MSK)
Последнее исправление: Lordwind 03.07.26 14:51:43 MSK (всего исправлений: 1)

Ссылка

В целом с рутинными задачами самые последние БЯМы справляются окей. Написать тест, небольшой класс или ф-цию, исправить опечатки, найти что-то по смыслу. С дизайном я бы не стал доверять.

Чтоб она не путалась и не забывала задачу, можно просто сохранить её в текстовый файл. Также ей нужны инструкции по сборке и тестированию приложения, тогда она сама сможет исправлять свои опечатки.

Человек всё ещё нужен конечно и вряд ли когда-либо будет не нужен, он должен ревьювить говнокод и останавливать агента когда у него начинает сносить крышу.

Gary ★★★★★
(03.07.26 14:52:32 MSK)
Последнее исправление: Gary 03.07.26 14:52:58 MSK (всего исправлений: 1)

Я общаюсь только с бесплатными, но у меня сложилось ощущение, что чем больше ты с ними общаешься в одном чате, тем больше они галлюцинирует. Через какое-то время у тебя начинает просто башка пухнуть от фрустрации. Т.е., как будто бы, должно добавляться больше контекста, а происходит наоборот.

MoldAndLimeHoney ★★★
(03.07.26 14:53:29 MSK)

Ответ на: комментарий от tiinn 03.07.26 14:29:17 MSK

Так нормально делай - нормально будет

Gary ★★★★★
(03.07.26 14:53:59 MSK)

Ответ на: комментарий от MoldAndLimeHoney 03.07.26 14:53:29 MSK

Им всем начинает сносить крышу с ростом контекста, потому что БЯМ не может отличить ошибки, неправильные утверждения и т.п. своём контексте. Даже было исследование недавно.

Поэтому при нормальном workflow задачи атомарны и на каждую берётся чистый контекст.

Gary ★★★★★
(03.07.26 14:56:46 MSK)

Ссылка

Ответ на: комментарий от Gary 03.07.26 14:52:32 MSK

Это всё круто, типа, тестируй через ИИ’шку. А только не делают коммерцоиды вещи тестируемыми. Например, мне, чтобы ИИ’шка смогла тестировать мой код, надо получить доступ к кишкам ноды, чтобы поставить туда проприетарный бинарь, настроить его запуск в системд, т.е. в итоге мне проще у себя хостить rest api сервис и говорить ИИ’шке, чтобы она его дёргала…

seiken ★★★★★
(03.07.26 14:57:06 MSK) автор топика
Последнее исправление: seiken 03.07.26 14:57:37 MSK (всего исправлений: 1)

Ответ на: комментарий от seiken 03.07.26 14:57:06 MSK

Дальше возникают проблемы. Как дать доступ этой ИИ’шке в корпоративную сетку?

seiken ★★★★★
(03.07.26 14:59:08 MSK) автор топика

Ссылка

Ответ на: комментарий от seiken 03.07.26 14:50:07 MSK

Это будет говно на палке.

Увы, но какую-то работу выполнять она способна.

tiinn ★★★★★
(03.07.26 15:05:27 MSK)

Ссылка

Ответ на: комментарий от MoldAndLimeHoney 03.07.26 14:53:29 MSK

Это потому, что они бесплатные. Сперва, для завлекалочки, вам подсовывают более мощную модель, а потом, когда вы втягиваетесь, всё более ограниченную. Используй локальные LLM, Люк!

tiinn ★★★★★
(03.07.26 15:07:10 MSK)