LINUX.ORG.RU
ФорумTalks

Написал тут статью по анализу проблем современных LLM

 , , ,


1

4

https://bykozy.me/blog/the-core-flaws-of-modern-ai-based-on-large-language-mo...

Чуть менее зубодробильное описание особенностей работы и проблем нейросетей, чем оно сделано в тех же ссылках. Но статья всё равно получилась здоровенной, Write говорит про 20 страниц даже с очень маленькими картинками.

Вся полностью на ангильском, не уверен в необходимости переводить это на русский язык. Чую, при таком объеме её осилят три калеки, которые и так владеют языком.

В любом случае, я бы не успокоился, пока не разложил современный нейросетевой положняк по полочкам.

Из хороших новостей — работа кожанных мешков всё ещё нужна, ИИ-сингулярность отменяется.

★★★★

Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от Reset

Я надеюсь статья писалась с помощью LLM?

Смотря что называть «с помощью». Я как бы даже явно ссылался на вывод LLM.

Меня вот что больш интересует: насколько было геморно писать https://github.com/resetius/qumir нейросеткой? Я пока что ровно от одного продвинутого кодера слышал про успешный опыт, грит «кое-где раза в четыре ускоряется работа» — без уточнения, какая именно часть ускоряется, а какая после этого замедляется.

Есть люди, которые пытаются, просто весь день воюют с промтом агента, и по итогу забрасывают это дело. Есть сообщения от тех, кто якобы какую-то там здоровую систему поддерживает, всю написал нейросеткой, и никаких ошибок в ней не было — в эту историю очень сильно не верится, учитывая то, сколько мне приходится исправлять полуавтоматически и просто руками код, сгенерированный нейросетью.

byko3y ★★★★
() автор топика
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от Gary

Короче ЛЛМкам нужен человек-переводчик который всё сам переведёт и исправит за ними 😭

Нужен оператор ИИ, который грамотно задаст промты. Я уверен, что можно отладить пайплайн так, чтобы он выдавал на 95% годный результат. Проблема в том, что большинство ленивых переводчиков даже не пытаются следить за качеством контента.

byko3y ★★★★
() автор топика
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от byko3y

насколько было геморно писать https://github.com/resetius/qumir нейросеткой?

Веб-морда написана 99% нейросеткой, так как я во фронтенде ни в зуб ногой и разбираться желания ни малейшего нет. Единственное место которое я взял там под контроль – связь js-строк с webasm-строками. Нейросеть не осилила от слова совсем. Но там и видно что это говнокод говнокодом. Остальное руками в основном, нейросеть для автодополнений и написания аналогичного кода по образу и подобию.

Есть сообщения от тех, кто якобы какую-то там здоровую систему поддерживает, всю написал нейросеткой, и никаких ошибок в ней не было

Смотря какая система.

Reset ★★★★★
()
Ответ на: комментарий от Gary

Человечество проходит через такие этапы постоянно с ростом уровня автоматизации и вроде ничего не произошло, освободившиеся руки обычно занимают себя чем-то другим. Раньше большая часть населения земли работала в полях, теперь люди строят карьеру в том что едят еду на камеру. Ну и плюс предпосылок к тому что LLM-ки начали решать реальные задачи я пока не видел.

С одной стороны, да. С другой стороны, многие рутинные задачи по поддержанию инфраструктуры, городской среды, так и не автоматизированы, и все развитые страны сейчас импортируют огромное количество (миллионы) мигрантов из южных стран. Для работы на низкоквалифицированных работах, где уже не хотят работать коренные, или их не хватает.

Правда, получается палка о двух концах, ибо и работают плохо, и привозят с собой свои традиционные гигантские семьи, и тот же мусор привыкли выбрасывать просто себе под ноги, из окна, потому выходит лекарство хуже болезни.

Chiffchaff
()

byko3y

Спасибо за ссылку на статью. Я воспользовался ЛЛМ. Посмотрите, как, искажён смысл или нормальная выжима?

Краткий перевод статьи «Ключевые недостатки современного ИИ на основе больших языковых моделей» Основные тезисы автора:

Трансформеры — это переводчики, а не мыслящие системы. Они не имеют модели реального мира, а лишь учатся описаниям мира из текстов. Как говорится: «вербализованная истина — уже ложь».
Фундаментальная неточность архитектуры. Из-за использования непрерывных дифференцируемых функций (MLP) и обратного распространения градиента модели не могут давать точные дискретные ответы. Например, между значениями «любовь» (4.0) и «голубь» (6.0) существует «промежуточное» значение 5.0, которое не имеет смысла в реальном мире. Для задач, требующих точности (математика, программирование), это критично.

Неспособность к решению новых задач. LLM хороши в «попугайничестве» — воспроизведении знакомых шаблонов, но проваливаются на действительно новых задачах. Даже перемешивание 30 слов в случайном порядке вызывает ошибки даже у самых крупных моделей.

Нестабильность вывода. Незначительные изменения во входных данных могут привести к непредсказуемым результатам. Модели «прикидываются экспертами», не будучи ими.

Цепочки рассуждений (Chain-of-Thought) лишь отсрочивают провал. Из-за «размывания информации» в механизме внимания (rank collapse) каждая последующая стадия логического вывода становится менее точной. Повторная подача вывода на вход (CoT) замедляет, но не решает проблему.

Главный грех индустрии ИИ — представление трансформеров как самостоятельных решателей задач. На деле это «стохастические попугаи»: нечёткие сопоставители шаблонов в латентном пространстве, которые имитируют понимание, не обладая им.

Вывод автора: LLM следует рассматривать как продвинутые инструменты перевода и поиска, а не как системы, способные к независимому мышлению или решению практических задач без участия человека. Их архитектура изначально ограничена — это следствие математических свойств градиентного обучения, а не недостаток масштаба.

baaba ★★★
()
Последнее исправление: baaba (всего исправлений: 1)
Ответ на: комментарий от Chiffchaff

Не совсем понял причём здесь мигранты. В условной СШАшке почти два миллиона официантов, сотни тысяч фитнесс-тренеров и т.п. Не то чтобы некому мести улицы, просто рыночек порешал что Хуан готов работать за минимальную зарплату, Джон нет. А робота, который доехал бы до места лучше мексиканца на велике, ещё не изобрели. Если изобретут, Хуан поедет домой (в Аризону :))), ну или переквалифицируется в бюджетного фитнес-тренера. Все спокойно разберутся, как разбирались с первых дней изобретения инструментов и индустриализации.

Gary ★★★★★
()
Ответ на: комментарий от Gary

В условной СШАшке почти два миллиона официантов, сотни тысяч фитнесс-тренеров и т.п.

Условные США печатают мировую резервную валюту. У них всё население может не работать, потому что любой ресурс и любой продукт они могут купить у любой страны за зелёную бумагу, которую они могут печатать в любом количестве. Разве что армия должна быть большая, чтобы по всему миру гарантировать, что никто от этих зелёных бумажек не отказывается.

Их ситуация радикально отличается от любой другой страны. Именно поэтому у них просело индустриальное производство и переразвита сфера услуг.

просто рыночек порешал что Хуан готов работать за минимальную зарплату, Джон нет.

Это не рыночек порешал, а целенаправленное влияние на политику и экономику соседей. Южная Америка всегда будет жить в нестабильности и нищете, именно потому что создание такой ситуации порождает почти неиссякаемый резервуар хуанов, готовых работать нелегально за минимальную зарплату. А когда они стареют и вырабатывают свой ресурс, их можно пинком под зад отправить обратно, где они сядут на шею своей нищей системе соцобеспечения, чтобы получать пенсию и медицину, или хотя бы что-то, ну или сдохнут где-нибудь в трущобах.

Все спокойно разберутся, как разбирались с первых дней изобретения инструментов и индустриализации.

Разбирались не спокойно, а через волнения, кризисы, голод, и гражданские войны. Это потом, спустя сто с лишним лет, всё это выглядит далёким и абстрактным.

Chiffchaff
()
Последнее исправление: Chiffchaff (всего исправлений: 4)
Ответ на: комментарий от Chiffchaff

Их ситуация радикально отличается от любой другой страны. Именно поэтому у них просело индустриальное производство и переразвита сфера услуг.

В странах ЕС и Великобритании такая же ситуация, хотя мировую валюту они не печатают (во всяком случае в таких масштабах как США)

sabacs
()
Ответ на: комментарий от byko3y

Смотря насколько «здоровую». Арканоид под DOS дипсик пишет идеально. Компилируй и играй.

Причём, самое главное - он идеально пишет игровую логику. То, на чём я всегда срубался (и срубаюсь).

Собственно, свистелки и перделки я и сам заговнокожу.

tiinn ★★★★★
()
Последнее исправление: tiinn (всего исправлений: 1)
Ответ на: комментарий от Reset

Остальное руками в основном, нейросеть для автодополнений и написания аналогичного кода по образу и подобию.

Ну вот именно, что подобный код бросается в глаза, так кожанные мешки не пишут. Всё-таки «писать IDE» — это не совсем «руками», особенно если писать не отпуская руки с кнопки Tab.

Есть сообщения от тех, кто якобы какую-то там здоровую систему поддерживает, всю написал нейросеткой, и никаких ошибок в ней не было

Смотря какая система.

Всё, что не шаблонный фронтент и не бойлерплейт-бойлерплейтович, по моим данным отвратительно поддаётся нейросетивизации. Вплоть до того, что автокомплит может быть бесполезным.

byko3y ★★★★
() автор топика
Ответ на: комментарий от baaba

Большая часть ключевых моментов безнадёжно утеряна. Например, что Chain of Thoughts — это костыль для того, чтобы тригерить попугайные способности БЯМ, и вывод на вход подаётся даже без явных Chain of Thoughts, трансформеры в принципе без этого работать не могут.

Вывод, в принципе, оно правильно передало, но я его так и формулировал.

Кстати, я запланировал написание примеров, которые больше показывают последствия «размывания» ответов — а то я как-то слишком абстрактно сформулировал эту идею, там можно практически потыкать в БЯМ и собственными глазами увидеть, как весь инференс просто рассыпается на глазах, безо всяких там рассуждений про точности, rank collapse, и остаточные логиты.

byko3y ★★★★
() автор топика
Ответ на: комментарий от sabacs

В странах ЕС и Великобритании такая же ситуация, хотя мировую валюту они не печатают (во всяком случае в таких масштабах как США)

ЕС и бриташка попроще будут, но в принципе у них аналогичная ситуация: они потребляют больше, чем производят, потому что владеют печатным станком, банкноты из которого могут быть напрямую сконвертированы в доллар с 2008 года.

byko3y ★★★★
() автор топика
Ответ на: комментарий от tiinn

Смотря насколько «здоровую». Арканоид под DOS дипсик пишет идеально. Компилируй и играй.

Арканоид под дипсик будет попроще, чем примитивная современная аркада под Unity. Потому что под современную аркаду будь добр модельки-текстуры нарисуй.

Причём, самое главное - он идеально пишет игровую логику. То, на чём я всегда срубался (и срубаюсь).

Если логика достаточно типовая.

byko3y ★★★★
() автор топика
Ответ на: комментарий от rechnick

Подтверждаю, хорошо разложил факты, по крайней мере на высоком уровне, в плане «для чего лучче применять ИИ, а для чего — не стоит».

К сожалению, он совершенно упустил тот факт, что LLM возникли не потому, что «ну наконец решили проблему человеческой речи», а потому что возникли достаточно большие датасеты с человеческими знаниями, на которых эти самые нейросети можно обучать — и именно эту информацию, эти паттерны из интернетов нейросети статистически копируют.

Так-то LLM ничего принципиально нового не принесли, это всё смасштабированные кирпичики 30-летней давности. Как ни странно, в этом даже есть что-то позитивное: благодаря отсталости технологий ИИ и вычислителей то, что могло быть уже в 2010 году, появилось только ближе к 2023. То есть, неэффективность моделей и вычислителей была решена тупо грубой вычислительной силой, тысячами видеокарточек — о чём я как бы начинал писать в самой моей первой записи в блоге.

byko3y ★★★★
() автор топика
Ответ на: комментарий от byko3y

Всё-таки «писать IDE» — это не совсем «руками», особенно если писать не отпуская руки с кнопки Tab.

Я кстати отписался от copilot неделю назад. Они на support тикеты не отвечают и еще денег хотят брать с февраля :)

tab часто генерирует дичь, согласен

Reset ★★★★★
()
Ответ на: комментарий от piyavking

Ну так-то я согласен с тем, что читать статью через маш переводчика так-себе, не совсем удобно. Другое дело, что я не знаю, когда сделаю и сделаю ли норм перевод.

byko3y ★★★★
() автор топика
Ответ на: комментарий от byko3y

Мне нормально зашло. Я и так в предмете не смыслю ни уха ни рыла, так что голосовой движок просто исполнил мне весьма интересную колыбельную)

piyavking ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)