В чём реальная проблема ЛЛМ

0

2

нет смысла тренировать что-то своё на коленке, потому что это будет либо какой-то суперкастомный идиот, либо система, которая слишком много галлюцинирует (дуальная проблема увеличения шума против нерепрезентативности данных); а большую модель вы на коленке всё равно не натренируете.
поскольку проблема 1) - фундаментальная теоретическая проблема, коммерческие ЛЛМ идут по пути "пусть будет больше шума, всё равно первоначально у клиента будет «вау-эффект», и он купит подписку или кредиты. И вот тут самый цимес закрался. В отличие от человеческого интеллекта, возможности которого в отношение себя любимого мы может прогнозировать плюс-минус, не ошибаясь на порядки, в случае с ЛЛМ вы никогда не сможете оценить финансовые затраты на решение задачи. По моему опыту ЛЛМ лучше всего справляются с утилитами и гуишными тулзами строк на 3тыс кода, но не сильно больше. После определенного барьера, который можно условно измерить как количество строк в более или менее формализованном виде (в том, в котором сапиенсы пишут ТЗ для других сапиенсов), в промпты надо включать тупо всё ТЗ с самого начала.

Т.е. даже на платном антропике оно в какой-то момент начинает лажать и забывать изначальные вводные, которые были вот, совсем недавно, 10 промптов до того.

т.о., мы приходим к такому выводу, что промптинг нихрена не совместим с agile разработкой. Он создаёт видимость того, что в контексте есть данные, которые нам важны для дальнейших шагов, но это не так, потому что ЛЛМ не умеет интерпретировать токены, это тупая модель на больших данных, и соотв. давать ей задания лучше всего сразу готовые, в которых ещё за ручку надо объяснять, как что кодировать, иначе будет такая лапша, которую только эта модель ЛЛМ сможет дальше модифицировать, если не потеряет контекст мысли автора.

Т.е., по моему опыту, лажа начинается уже до 5к сток кода. И в определенный момент ты думаешь «слушай, спасибо, что ты типа нагуглил мне этот фреймворк, о котором я понятия не имел, что такое вообще есть, но дальше я сам буду читать мануалы, и буду кодировать сам, потому что тебе очень дорого всё разжёвывать, и эмоционально, и финансово».

Ссылка

← На kernel.org по ошибке удалили со всех зеркал архивы с кодом ядра

Воровство данных ллм-ками →

← 1 2 →

Ответ на: комментарий от Gary 03.07.26 14:53:59 MSK

Так нормально делай - нормально будет

Кто ж спорит. И ЛЛМ тогда ненужно. Беда в том, что в реальном мире так получается редко.

tiinn ★★★★★
(03.07.26 15:08:04 MSK)

Ответ на: комментарий от tiinn 03.07.26 15:08:04 MSK

И ЛЛМ тогда ненужно.

Ещё раз говорю - она может делать рутину, что в целом неплохо, правда не совсем дешево.

Gary ★★★★★
(03.07.26 15:16:51 MSK)

Ссылка

Не клади все яйца в одну корзину.

«С нашим ИИ ты просто пишешь что тебе нужно и получаешь результат без знания предметной сферы» - маркетинговый булшит.

Но если ты способен и сам решить задачу, которую хочешь от ИИ, то с ИИ есть возможность решить её в несколько раз быстрее. При этом, разумеется, нужно набить руку, чтобы заранее понимать какой вопрос нужно задать ИИ, чтобы понять не облажался ли он, подмечать всякие детали в ответах («ага, он не упомянул Х - надо спросить прямо») и т. п.

KivApple ★★★★★
(03.07.26 15:23:07 MSK)

Ссылка

Ответ на: комментарий от seiken 03.07.26 14:50:07 MSK

Это будет говно на палке.

Есть опенсорсные модели на ~700B параметров (дипсик, qwen), они похуже, чем антропики с ОпенАИ, но не настолько хуже, чтобы не имело смысл с ними работать. Другое дело, что оборудование для запуска их полной версии сейчас стоит слишком дорого и токены покупать может оказаться дешевле.

Однако тут так ещё. С одной обычной видеокартой, даже RTX 5090 возможности усечённых вариантов недостаточно для нормального кодинга, но по экспериментам, уже где-то на паре RTX A6000 с суммарными 96Гб VRAM более приемлемые варианты возможны. Хотя конечно, с нынешними ценами такой комп всё-равно сильно недешёвый.

anonymous_incognito ★★★★★
(03.07.26 16:22:33 MSK)

Ответ на: комментарий от anonymous_incognito 03.07.26 16:22:33 MSK

Есть опенсорсные модели на ~700B параметров (дипсик, qwen), они похуже, чем антропики с ОпенАИ, но не настолько хуже, чтобы не имело смысл с ними работать.

Так эти модели не «на коленке» натренированы.

Другое дело, что оборудование для запуска их полной версии сейчас стоит слишком дорого и токены покупать может оказаться дешевле.

Речь же была не про запуск готовой, а про обучение своей… Для запуска-то оборудование как раз вполне доступное обывателю (да, не любому и с трудом, но это что-то, что при большом желании может себе позволить физическое лицо, а не только корпорация).

CrX ★★★★★
(03.07.26 16:24:46 MSK)

Ответ на: комментарий от MoldAndLimeHoney 03.07.26 14:53:29 MSK

что чем больше ты с ними общаешься в одном чате, тем больше они галлюцинирует

Не то чтобы галюцинируют, но начинают нести пургу и винегрет из контекста, т.к. у них нет личности, чтобы использовать контекст разговора в рамках чего-то большего. Если в контексте были противоречивые утверждения, то модель не выбирает какой точки зрения придерживаться, а молотит оба два. Поэтому контекст нужно периодически сжимать до ключевых тезисов.

no-such-file ★★★★★
(03.07.26 16:37:02 MSK)

Ссылка

Ответ на: комментарий от anonymous_incognito 03.07.26 16:22:33 MSK

Зато, выигрыш очевиден:

Можно не думать о стоимости токенов и их количестве,
Воспроизводимость результатов. Тебе гугол не подсунет старую модель под видом новой, и слабую под видом сильной, когда у него нехватка ресурсов.

tiinn ★★★★★
(03.07.26 16:37:06 MSK)

Ссылка

Ответ на: комментарий от anonymous_incognito 03.07.26 16:22:33 MSK

Ну ясно. Та же самая история, точь в точь, как с deep learning, от которого писали кипятком в 2010г.

seiken ★★★★★
(03.07.26 16:46:05 MSK) автор топика

Ответ на: комментарий от CrX 03.07.26 16:24:46 MSK

Речь же была не про запуск готовой, а про обучение своей…

На конкурентном уровне и с нуля это вообще доступно сейчас, наверное, только паре десятков компаний в мире.

Слегка подфайнтьюнить, наверное, всё же и физлицо побогаче тоже может.

anonymous_incognito ★★★★★
(03.07.26 16:47:05 MSK)

Ссылка

Ответ на: комментарий от seiken 03.07.26 16:46:05 MSK

Та же самая история, точь в точь, как с deep learning, от которого писали кипятком в 2010г.

Не понял тебя, в 2010 от dl кипятком не писали ещё. Хотя в целом, примерно тогда лет на 10 получился период, когда тренировать передовые конкурентные нейросетки с нуля мог чуть ли не каждый, по крайней мере с точки зрения необходимых аппаратных ресурсов. AlexNet натренировали за пару суток на 4-х GTX 580. Одна карта стоила примерно $500.

anonymous_incognito ★★★★★
(03.07.26 16:51:12 MSK)
Последнее исправление: anonymous_incognito 03.07.26 16:53:03 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous_incognito 03.07.26 16:51:12 MSK

Ну, в общем, скубенту, который может себе позволить разве что очень низкооплачиваемые подработки, чтобы сводить концы с концами, 1К талеров - это баснословное состояние по тем временам. А вот в универах уже строили кластеры на видеокартах, которые ни один отдельный бедный скубент позволить себе уже не мог.

seiken ★★★★★
(03.07.26 16:59:49 MSK) автор топика

Ответ на: комментарий от seiken 03.07.26 16:59:49 MSK

Масштаб баснословности и невозможности позволить разный был. GTX 580 - это же просто игровая карта была. При большом энтузиазме наскрести 3 килобакса (2 на 4 карты и еще 1 на остальное железо) мог даже бедный студент, не надо про состояние. Это было дешевле даже дешёвого нового автомобиля. А вот сейчас цена железа даже для инференса 700B стоит как квартира.

P.S. Хотя если чисто на CPU с 1Tb RAM систему собрать, то будет жутко тормозить (~0.2 токена в секунду), но всё-таки работать и цена всё же ниже. Но по-любому, куда дальше от возможностей студента, чем $3000 на которых можно было даже с нуля натренировать, а не только инференс.

anonymous_incognito ★★★★★
(03.07.26 17:14:47 MSK)

Ответ на: комментарий от seiken 03.07.26 16:59:49 MSK

Университеты - нищие. Кластеры в них строили на каком-то таком убожище, умилительно вспоминать. Тряслись над этими кластерами как Кощей над яйцом со своей смертью. Это все со стороны вызывало только жалость.

lenin386 ★★★★★
(03.07.26 18:26:14 MSK)

Ответ на: комментарий от anonymous_incognito 03.07.26 17:14:47 MSK

При большом энтузиазме наскрести 3 килобакса (2 на 4 карты и еще 1 на остальное железо) мог даже бедный студент, не надо про состояние

Как, интересно, наскрести? По-черному вагоны ночью разгружать? Но не во всех странах разрешено работать по чёрному. Запросто могут и визу аннулировать.

seiken ★★★★★
(03.07.26 18:45:55 MSK) автор топика

Ответ на: комментарий от lenin386 03.07.26 18:26:14 MSK

Даже если там пару-тройкп Квадро, студенты, даже если в группе по три на них не заработают, если учатся как следует. В нормальном универе программа такая, что надо взламывать и лопатить литературу с утра до ночи.

seiken ★★★★★
(03.07.26 18:48:13 MSK) автор топика
Последнее исправление: seiken 03.07.26 18:48:35 MSK (всего исправлений: 1)

Ответ на: комментарий от seiken 03.07.26 18:45:55 MSK

Как, интересно, наскрести?

Вариантов наскрести скубенту 3 килобакса куда больше, чем сейчас 30 килобаксов только на дохлый тормозной инференс. Если в другой стране учишься, то значит уже имеется какой-то источник денег на учёбу и проживание, на фоне этих затрат найти оттуда же ещё 3 килобакса вряд ли невозможный вопрос. Если не сразу, то хотя бы в течение года. Если в своей, то про визы и разрешения вопрос не стоит.

anonymous_incognito ★★★★★
(03.07.26 18:57:41 MSK)

Ссылка

Ответ на: комментарий от seiken 03.07.26 18:48:13 MSK

В моём случае, там были какие-то дуальные Атлоны в каком-то мизерном количестве что-то около 8. Видеокарт там толи не было, толи о них говорить не о чем. Универ мало того что нищий, так там ещё всякие Т-платформы на этом буизнесс делали. Ты сам то своими глазами видел эти университетские кластеры?

lenin386 ★★★★★
(03.07.26 19:02:29 MSK)
Последнее исправление: lenin386 03.07.26 19:03:17 MSK (всего исправлений: 2)

Ответ на: комментарий от no-such-file 03.07.26 13:06:27 MSK

целых 20 лет удавалось не тратить время на всякую херню, а решать более общие задачи. Это же замечательно.

И это время закончилось вскоре после окончания «гонки гигагерц». Когда для увеличения производительности процессоров в попугаях стали удваивать не частоты, а ядра. Тогда пришлось всерьёз задуматься об оптимизации.

question4 ★★★★★
(03.07.26 19:04:17 MSK)

Ссылка

Ответ на: комментарий от seiken 03.07.26 18:45:55 MSK

У родителей стрельнуть. Внимание, говорит КЭП!

lenin386 ★★★★★
(03.07.26 19:10:35 MSK)

Ссылка

Ответ на: комментарий от lenin386 03.07.26 19:02:29 MSK

Так у меня не было задачи, чтобы их нагрузить.

seiken ★★★★★
(03.07.26 19:35:11 MSK) автор топика

Ссылка

Ответ на: комментарий от lenin386 03.07.26 19:02:29 MSK

Сейчас в Москве самый понтовый ВУЗ - ВШЭ, и там не только по экономике защищаются, но и по ИТ. Не может такого быть, что там каждый скубент у родителей на кластер клянчит.

seiken ★★★★★
(03.07.26 19:38:25 MSK) автор топика
Последнее исправление: seiken 03.07.26 19:38:37 MSK (всего исправлений: 1)

Ответ на: комментарий от seiken 03.07.26 19:38:25 MSK

Не может такого быть, что там каждый скубент у родителей на кластер клянчит.

Ты куда-то вообще разговор в странную сторону повёл про нищих студентов и ВШЭ.

Я заметил, что было «золотое» десятилетие, примерно с 2010-го (даже ранее), когда в нейросетях можно было добиться мировых достижений на настолько дешёвой технике (~$3000), что её при сильном желании мог позволить себе практически каждый. На автомобиль больше денег ушло бы! Это невозможно было до и стало невозможно после. Зачем формально докапываться до совсем буквальногос смысла «каждый», выискивая примеры с некоторыми студентами.

anonymous_incognito ★★★★★
(04.07.26 00:55:14 MSK)
Последнее исправление: anonymous_incognito 04.07.26 00:56:50 MSK (всего исправлений: 1)

Ссылка

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

← 1 2 →

← На kernel.org по ошибке удалили со всех зеркал архивы с кодом ядра

Talks

Воровство данных ллм-ками →

Похожие темы