LINUX.ORG.RU

ИИ создал новый компилятор С

 ,


0

3

Степень прохождения тестовых наборов компиляторов, включая GCC Torture Tests, составляет 99%. Уже собирает ядра Linux, PostgreSQL, SQLite, Redis, FFmpeg, GNU coreutils, Busybox, CPython, QEMU, LuaJIT и ещё около 150 проектов. Для разработки компилятора было привлечено 16 AI-агентов, которые после двух недель работы и около двух тысяч сеансов в Claude Code сгенерировали 100 тысяч строк кода на Rust.

Код компилятора

Перемещено hobbit из development


Ответ на: комментарий от Lusine

И заказчик ничего не подверждает, он просто подписывает акт выполненных работ и платит.

Эка… Надо будет текущего заказчика на очередном созвоне повесилить.

А то что вы выполнили его требования и нет ошибок может подвердится только после нескольких лет эксплуатации. Ни ты ни заказчик заранее об этом не знают.

Как бы в контексте разговора речь шла не об отсуствии или наличии ошибок, а, цитирую: «соответсвтует ли продукт заявленным критериям».

eao197 ★★★★★
()
Ответ на: комментарий от eao197

Ладно, ИИ может дать гарантию, что ваш код соответстует требованиям стандартов НАТО (как пример)? И что вы тогда собираетесь показать заказчику? Вывод ИИ?

Lusine
() автор топика
Ответ на: комментарий от eao197

человек не самый лучший инструмент для контроля качества кода

Бротело, в реальном мире, у человека для контроля качества есть много инструментов, но в итоге решение принимает он. И перед заказчиком в любой компании есть целая лестница контролёров, начиная с ревьюера пул реквеста и далее по списку. Это только в твоей сказке пул реквесты принимает заказчик.

yvv1
()
Ответ на: комментарий от Lusine

Я вот не знаю что и думать: что вы совсем тупой или вам просто лень следить за разговорам и читать то, что вам отвечают?

Сориентируйте, пожалуйста, чтобы я понимал как с вами разговаривать.

По сути же напомню, что я здесь говорю не о том, на ком будет лежать ответственность (эта тема вообще вне разговора о том, какой код в состоянии генерировать ИИ). А о том, какова роль человека в написании кода при развитии ИИ. Т.е. будет ли человек писать какие-то спецификации для ИИ, будет ли человек как-то проверять качество сгенерированного ИИ кода, будет ли человек обучать ИИ писать код и т.д.

eao197 ★★★★★
()
Последнее исправление: eao197 (всего исправлений: 1)
Ответ на: комментарий от yvv1

Это только в твоей сказке пул реквесты принимает заказчик.

Простите, а когда вы написали «соответсвтует ли продукт заявленным критериям» – это вы о пул реквестах речь вели?

eao197 ★★★★★
()
Ответ на: комментарий от Lusine

ИИ на ура справляется в с формальной проверкой соответсвия продукта заявленным спекам. Это помогает автоматизировать процесс контроля, но не гарантирует 100% качество. Спеки тоже бавают неполными или содержат ошибки, как и автоматические тесты. Гражданин видимо этого не понимает.

yvv1
()
Ответ на: комментарий от yvv1

Контроль качества начинается с них.

Ну и каким же образом он начинается?

С визуального просмотра и ручных проверок?

Даже ещё раньше, когда ты делаешь коммит в локальную репу. А ты не знал?

Нет.

eao197 ★★★★★
()
Ответ на: комментарий от eao197

Даже интересно стало, чувак, ты чо внатуре веришь, что можно вот так вот взять код, который тебе нахерачил ии, и сразу отправить его заказчику? Ну-ну, удачи. Только любой вменяемый заказчик пошлёт тебя сразу нахер не глядя, и будет прав.

yvv1
()
Ответ на: комментарий от Lusine

А если убрать человека, код из ИИ нельзя использовать вообще.

Т.е. вы просто тупой и не понимаете о чем идет речь.

Мне и в страшном сне не привидится, что ответственность перекладывают с человека на ИИ. Поэтому этот пункт еще раз предлагаю оставить за скобками. Но если вы все же продолжите развивать эту тему вновь, то мне придется еще раз назвать вас тупым.

Вот что мне интересно. Сейчас есть программист, которому поступает некая задача. Программист находит ее решение и воплощает решение в коде. В какой-то момент времени программист говорит, что его решение готово, т.е. он считает, что решение достаточного качества, чтобы быть использовано в составе разрабатываемого продукта.

Однако, именно здесь и встает вопрос контроля качества. Действительно ли ожидания программиста соответствует действительности? Проверены ли все варианты? Проверено ли поведение на некорректных данных? Устраивает ли решение нас по потребляемым ресурсам и т.д., и т.п.

Еще недавно все это контролировалось людьми. Теми же программистами. И не то, чтобы это было хорошо.

За прошедшие десятилетия в области разработки ПО здесь продвинулись – появились разные формы тестирования, даже отдельная специализация «тестировщик» образовалась.

А весь этот прогресс произошел не просто так, а из-за того, что по мере роста сложности и объема ПО стало очевидно, что человек в качестве контролера качества ну такое себе. Самое слабое звено.

И вот персонаж заявляет, что когда код будет писать ИИ, то за человеком останется функция контроля качества.

Может быть персонаж, как и вы, под «контролем качества» понимал взятие на себя ответственности. Тогда вопросов нет.

Но мне больше приходится дело иметь с кодом. И с контролем качества кода. И если это то, что ИИ мне оставит, то перспектива так себе.

eao197 ★★★★★
()
Ответ на: комментарий от yvv1

Даже интересно стало, чувак, ты чо внатуре веришь

Дяденька, вы прежде чем вопросы задавать, просто в порядке вежливости ответили бы на ранее заданные вам. Например:

Это в какой области такая реальность? Можно примеры задач, над которыми вы работаете?

Но вернемся к вашим опусам:

что можно вот так вот взять код, который тебе нахерачил ии, и сразу отправить его заказчику? Ну-ну, удачи.

А могли бы вы, просто в качестве жеста доброй воли, показать где бы я такое предлагал?

Просто тут отметились верующие в неминуемую победу ИИ, которые, при этом сами же говорят, что коду от ИИ слепо доверять нельзя.

Но человек изначально плох в обеспечении контроля. Поэтому идея о том, что ИИ будет генерировать, а человек это будет проверять, выглядит утопически. Т.к. человек и собственный труд проверяет так себе. А ручные проверки еще и не масштабируются.

eao197 ★★★★★
()
Ответ на: комментарий от yvv1

Погугли уже, как делают PR review.

Мне интересно как это происходит у вас и что входит в ваш PR review.

А то нагуглить-то я могу и PR review здорового человека, но это не будет иметь отношения к вашим воспаленным фантазиям.

eao197 ★★★★★
()
Ответ на: комментарий от eao197

Ну у тебя же сразу заказчик определяет, правильный ему код нагенерировали, или нет.

окончательное решение, соответсвтует ли продукт заявленным критериям, или нет, принимает всё-таки человек.

И человек этот – заказчик. А не разработчик.

Т.е. перед отправкой заказчику разрабы ничего проверять не должны, правда?

yvv1
()
Ответ на: комментарий от eao197

А то нагуглить-то я могу и PR review здорового человека, но это не будет иметь отношения к вашим воспаленным фантазиям.

У меня PR review проходят так же как у всех. Это у тебя какие-то фантазии.

yvv1
()
Ответ на: комментарий от eao197

Человек все проверяет отлично. Никто не говорит, что нужно разглядывать каждую строчку. Вместе с заказчиком выпускается документ «Программа и методика испытаний», в котором говорится что проверяется и как. Но если что-то пошло не так, в код придется лезть в любом случае.

Lusine
() автор топика
Ответ на: комментарий от yvv1

Ну у тебя же сразу заказчик определяет, правильный ему код нагенерировали, или нет.

Схерали?

Вы правильный набор цитат привели, я их даже еще раз повторю:

окончательное решение, соответсвтует ли продукт заявленным критериям, или нет, принимает всё-таки человек.

И человек этот – заказчик. А не разработчик.

Окончательное решение по продукту (т.е. соответствует ли продукт заявленным критериям) принимает именно что заказчик. Исполнитель может принимать свои решения о том, что и в каком объеме предъявляется заказчику на каждом из этапов. Но это не окончательное решение по продукту, т.к. окончательно за заказчиком.

Т.е. перед отправкой заказчику разрабы ничего проверять не должны, правда?

Не правда.

eao197 ★★★★★
()
Ответ на: комментарий от yvv1

У меня PR review проходят так же как у всех.

Отучаемся говорить за всех (с)

А за себя раскажите, пожалуйста.

Это у тебя какие-то фантазии.

У меня их вообще нет.

eao197 ★★★★★
()
Ответ на: комментарий от Lusine

Человек все проверяет отлично.

Вероятно, я в какой-то другой вселенной живу. И списки багов у открытых проектов тоже из какой-то другой вселенной. И списки выявленных уязвимостей.

eao197 ★★★★★
()

Когда работаешь с ИИ, проверять нужно каждую строчку, которую он нагенерировал. Потому что как только в контекст попадает одно неверное утверждение или кусок говнокода, любым случайным образом, весь сеанс сразу летит в …. Это называется context poisoning. Любую задачу нужно разбивать на мелкие подзадачи и контролировать исполнение на каждом шагу. И да, такой workflow имеет смысл, т.к. ии выполняет некоторые задачи уж очень шустро.

yvv1
()
Ответ на: комментарий от eao197

Это случай, когда на ошибки всем наплевать. Но есть другой софт, где в контраке написано, исправление ошибки в течении 3 бизнес-дней, а далее ты оплачиваешь ущерб и неустойку.

Lusine
() автор топика
Ответ на: комментарий от eao197

Но это не окончательное решение по продукту, т.к. окончательно за заказчиком.

Не надо тупить. Оно своё окончательное на каждом этапе. Джун получил задачу, решил с помощью ии, проверил перед тем как пушить пиар. Мэйнтенер получил пиар, проверил (с помощью ии), но решение мерджить принял сам (или отослал обратно с каментами). И т.д., пока манагер не получил отчёт от разрабов, проверил, принял решение о готовности продукта, и отправил его заказчику. Это так работает, а не так как ты себе нафантазировал.

yvv1
()
Ответ на: комментарий от Lusine

Блин, ну уровень вашего умственного развития не перестает уменя удивлять. Вам не приходило в голову, что если бы человек отлично справлялся с контролем качества, то самого пункта в контракте про исправление ошибок не было бы? Ну вот просто за ненадобностью?

А поскольку без ошибок человек не может, то вот так и живем.

PS. И да, мне приходилось и среди ночи вставать, чтобы с инцидентами разбираться. А авралить без выходных и проходных, чтобы вернуть сервисам работоспособность. Поэтому в байки про контроль качества со стороны человека и не верю.

eao197 ★★★★★
()
Ответ на: комментарий от yvv1

Не надо тупить.

Ну так перестаньте.

Вы заявили про окончательное решение по продукту. Это заявление вполне трактуется именно озвученном мной ключе.

Точность формулировок – это как раз то, чем программист занимается. Он переводит задачу в точную спецификацию, которая не допускает неоднозначных трактовок. За это нам, собственно, и платят, т.к. это наша работа.

Когда вы пишете промпты для ИИ вы как раз эту точность спецификации теряете. В результате чего вам приходится и уточнять задачу, и затем проверять выхлоп.

Джун получил задачу, решил с помощью ии, проверил перед тем как пушить пиар. Мэйнтенер получил пиар, проверил (с помощью ии), но решение мерджить принял сам (или отослал обратно с каментами).

Если это и есть ваш «контроль качества», то мне остается лишь повторить еще раз: человек плох в этом самом контроле качества.

eao197 ★★★★★
()
Ответ на: комментарий от eao197

Вы заявили про окончательное решение по продукту.

Киса, продукт бывает разный. Багфикс или фича - это продукт. Доки, БД и т.д. - это всё продукты. Промежуточные продукты.

Когда вы пишете промпты для ИИ вы как раз эту точность спецификации теряете.

Наоборот, как раз ии требует максимально точные спеки. Он тогда лучше всего работает.

В результате чего вам приходится и уточнять задачу, и затем проверять выхлоп.

Ты хочешь сказать что вам не приходится их уточнять? Ты видимо просто никогда не составлял никаких спеков и задач. Всё с тобой понятно. Адью.

yvv1
()
Последнее исправление: yvv1 (всего исправлений: 1)
Ответ на: комментарий от eao197

«Но человек изначально плох в обеспечении контроля. Поэтому идея о том, что ИИ будет генерировать, а человек это будет проверять, выглядит утопически. Т.к. человек и собственный труд проверяет так себе. А ручные проверки еще и не масштабируются.»

Человек плох, а кто тогда будет проверять? ИИ? Господь Бог?

Lusine
() автор топика
Ответ на: комментарий от Byers

Программисты, которые сегодня с апломбом и общением через губу будут чистить унитазы и ботинки через год-два максимум.

Лет двадцать назад я это уже слышал, но причина была другая - индусы.

anonymous
()
Ответ на: комментарий от Lusine

Вы привели цитату, в которой говорится, что человек плох, но нет ничего о том, что контроль качества со стороны ИИ лучше.

Элементарная логика: из того, что X работает плохо не следует, что Y будет работать лучше.

Так что вы звизданули глупость в очередной раз.

ИИ? Господь Бог?

Без понятия. Я не yvv1 чтобы делать громкие прогнозы.

eao197 ★★★★★
()
Ответ на: комментарий от yvv1

Ты хочешь сказать что вам не приходится их уточнять?

Когда я пишу код, скажем, RadixTree, мне не приходится уточнять задачу самому себе.

Ты видимо просто никогда не составлял никаких спеков и задач.

Вам здесь любой анонимный эксперт с удовольствием расскажет, что я и программировать-то не умею.

eao197 ★★★★★
()