LINUX.ORG.RU

Классический психологический тест Струпа на внимание выявил главную слабость «ИИ»

 , ,

Классический психологический тест Струпа на внимание выявил главную слабость «ИИ»

0

1

Исследователи провели с ведущими моделями «ИИ» психологический тест Струпа на внимание и обнаружили серьезный недостаток. Хотя модели могли правильно называть цвета в коротких списках, их результаты резко ухудшались по мере того, как задача становилась длиннее и сложнее. У некоторых ведущих систем точность снизилась с более чем 90% до почти полного провала.

Системы искусственного интеллекта могут писать сочинения, отвечать на вопросы и решать сложные задачи. Однако новые исследования показывают, что им может быть сложно справиться с тем, что люди делают каждый день: сохранять концентрацию на поставленной задаче, когда появляются отвлекающие факторы.

Исследователи под руководством Сукету Пателя подвергли несколько ведущих моделей искусственного интеллекта известному психологическому эксперименту, называемому «задачей Струпа». Результаты показали существенную разницу между тем, как системы искусственного интеллекта обрабатывают информацию, и тем, как человеческий мозг управляет вниманием.

Что такое «задача Струпа»?

Задача Струпа — это классический психологический тест, который уже на протяжении десятилетий используется для изучения внимания, концентрации и самоконтроля.

В ходе теста на экране появляются слова, обозначающие цвета, такие как «красный», «синий» или «зеленый», напечатанные цветными чернилами. Иногда слово и цвет чернил совпадают. Например, слово «красный» может быть напечатано красными чернилами. В других случаях они не совпадают, например, слово «красный» напечатано синими чернилами.

Участникам предлагается назвать цвет чернил, а не читать само слово.

Это звучит просто, но создает сложность, поскольку чтение слов для большинства людей является автоматической привычкой. Мозг должен подавить желание прочитать слово и вместо этого сосредоточиться на определении цвета чернил.

Психологи часто используют эту задачу для измерения так называемого исполнительного контроля — набора умственных процессов, которые помогают людям регулировать внимание, противостоять отвлекающим факторам и оставаться сосредоточенными на целях.

Тестирование внимания «ИИ»

Исследователи хотели выяснить, справляются ли современные большие языковые модели (LLM) с этой задачей так же, как люди.

Большие языковые модели — это системы искусственного интеллекта, лежащие в основе таких инструментов, как ChatGPT, Claude и Gemini. Они обучаются на огромных массивах текста и усваивают языковые закономерности, что позволяет им генерировать ответы, которые зачастую выглядят удивительно человеческими.

При работе с короткими списками, содержащими пять слов, обозначающих цвета, системы «ИИ» в целом показывали хорошие результаты, даже когда слова и цвета не совпадали.

Однако ситуация резко изменилась, когда списки стали длиннее.

GPT-4o достиг точности 91% при работе с пятью словами. При десяти словах его точность упала до 57%. Когда список расширился до сорока слов, точность упала до всего 15%.

Claude 3.5 Sonnet демонстрировал стабильную производительность при работе со списками из двадцати слов, но затем его показатели резко ухудшились, и точность упала до 24% при работе со списками из сорока слов.

Исследователи наблюдали аналогичные тенденции в GPT-5, Claude Opus 4.1 и Gemini 2.5.

Когда «ИИ» теряет фокус

Задача стала ещё сложнее, когда в одном списке одновременно появлялись слова, соответствующие цвету чернил, и слова, не имеющие к нему отношения.

В этих условиях результаты ещё больше ухудшились. В некоторых случаях точность распознавания несоответствующих элементов упала практически до нуля.

По словам исследователей, модели «ИИ» испытывали трудности с соблюдением инструкции по распознаванию цветов чернил. Вместо этого они всё чаще по умолчанию переходили к чтению самих слов.

Другими словами, системы, по-видимому, не могли последовательно подавлять тот ответ, на котором их наиболее интенсивно обучали.

Этот вывод особенно интересен, поскольку люди сталкиваются с аналогичным конфликтом. Люди, как правило, гораздо лучше читают слова, чем называют цвета чернил. Однако, несмотря на этот уклон, большинство людей способны сохранять высокую точность и стабильную производительность даже при столкновении с длинными списками противоречивых слов и цветов.

Внимание человека и внимание машины

Исследование подчеркивает важное различие между человеческим и искусственным интеллектом.

Хотя современные системы «ИИ» способны демонстрировать впечатляющие языковые и логические способности, их внутренние механизмы отличаются от процессов внимания, характерных для биологического мозга.

Люди часто способны удерживать внимание на конкретной цели, отфильтровывая при этом постороннюю информацию. Результаты исследования показывают, что современные модели «ИИ» могут испытывать трудности с таким когнитивным контролем, когда задачи становятся всё более сложными.

Исследователи утверждают, что падение производительности, наблюдавшееся в ходе этих экспериментов, указывает на фундаментальные ограничения современных больших языковых моделей. Хотя «ИИ» иногда может имитировать поведение человека, его способность удерживать внимание, по-видимому, работает совсем иначе, чем у людей.

Полученные результаты напоминают о том, что даже самые передовые системы «ИИ» по-прежнему имеют слабые места, особенно когда задачи требуют от них сопротивления отвлекающим факторам и сохранения сосредоточенности на длинных цепочках информации.

>>> Подробнее в статье на PNAS Nexus

Источник: sciencedaily.com

★★★★★

Проверено: maxcom ()
Последнее исправление: maxcom (всего исправлений: 4)

Какое нахрен внимание, да что они несут?

Внимание человека это селекция, устройчивость, распределение, энергетические траты, это процесс. У БЯМ нет ничего этого - они работают в кванте без процесса. Пусть спайковые модели тестируют.

По сути они перегрузили статистический генератор некоррекной задачей. Ну он и нагенерировал в меру своих «сил».

И никто не может сохранять концентрацию весь день. Уроки и пары в учебных заведениях не просто так имеют определенное время. Возможности сохранять концентрацию высчитаны достаточно неплохо и у человека они тоже не шибко большие.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 3)

им может быть сложно справиться с тем, что люди делают каждый день: сохранять концентрацию на поставленной задаче, когда появляются отвлекающие факторы

Эти люди сейчас с нами в одной комнате?

MoldAndLimeHoney ★★★
()

Давайте угадывалке следующего слова по всем предыдущим дадим задачу где оно не зависит от всех предыдущих.

ya-betmen ★★★★★
()
Ответ на: комментарий от LightDiver

Какое нахрен внимание, да что они несут?
По сути они перегрузили статистический генератор некоррекной задачей. Ну он и нагенерировал в меру своих «сил».

Ну прочитай сначала статью, потом неси своё.

dataman ★★★★★
() автор топика

что-то на гуманитарном

madcore ★★★★★
()

Ждём новый вид капчи.

ptah_alexs ★★★★★
()
Ответ на: комментарий от LightDiver

Ты предлагаешь мне перейти по ссылке?! Ты еще скажи, что читать новости надо дальше заголовка…

Предлагаю не писать.

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

Это уже не первая весьма сомнительная статья по поводу ИИ на ЛОРе. Помню было недавно про снижение когнитивных свойств «навсегда» при использовании ИИ. Тоже был редкостный бред антинаучный. То что я вижу из теста - некорректное использование инструмента под видом научной деятельности.

LightDiver ★★★★★
()

Фиг знает… Мне кажется, это можно двояко воспринимать, ведь по сути ИИ ведёт себя человечнее, проваливая тест. Как-то на новость для ЛОРа по-моему не тянет. Мало ли что там с этими ИИ кто делает, Линукс-то тут причём?

CrX ★★★★★
()
Ответ на: комментарий от CrX

Потому что суть ИИ основана на нейронах человеков. Но это не та человечность в рамках данного теста. Это как закручивать шурупы молотком и выкатить статью: Молоток плохой инструмент для строительства.

Все модели, перечисленные в тексте - частотные, непрерывные. У них нет времени, нет процесса. Они «живут» в рамках кванта". Задача изначально для такой модели некорректна.

У таких моделей есть именно «проблема середины» и накопение ошибок на длинном контексте. Они не читают последовательно, они читают все вместе разом по сути. И это превращается в автозаполнение шаблона на основе статистики.

А ее этим контекстом перегружают, накапливая ошибки статистики. Тут нет «усталости» - это просто накопление статистической неточности.

Настоящий тест был бы на спайковых моделях, более «биологических». Потому что у спайковой сети появляется то, чего начисто лишена частотная - физическое время протекания процесса.

Спайковая модель будет не просто ошибаться, а именно что ошибаться как человек - пройдет полный путь от начала до конца с «усталостью». В то время как частотная просто перегружена контекстом в рамках кванта и все.

То что описано в статье - ложная корреляция. Результаты описаны с неправильными посылами. Хотя сами результаты верны.

В сериале «Рик и Морти» была великолепная серия по этому поводу, где прилетели огромные головы и им начали поклоняться, ложно делая выводы.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 3)
Ответ на: комментарий от dataman

Как писал покойный Симмонс

Это прозвучит странно, но не читал. Хотя в «бэклоге» есть.

Так или иначе, ИМХО, это как раз хорошо годится для темы в разделе форума «Искусственный интеллект», но не особо годится на новость — именно в рамках ЛОРа.

CrX ★★★★★
()

понятия «внимание» и «концентрация» к слоп-генераторам неприменимы, за неимением таковых свойств.

alegz ★★★★★
()

Да, механизм внимания страдает в сравнении с кожаными, из-за него и галлюцинации. Теперь это стало более явным и будут над этим думать.

ЗЫ

Сам ИИ считает что ему сознание для этого нужно, точнее его аналог (контур рефлексии для самоанализа, анализирующий энтропию внутри модели и оптимизирующий её на лету, при том оно должно постоянно в цикле работать и в идеале быть связанным с процессом обучения/дообучения). Конечно плывёт по формулам и теории, но гипотеза очень интересная.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 2)
Ответ на: комментарий от CrX

В той же мере, в которой применима дальность полета перелетных кошек в рамках сезонной миграции на юг. Если кошку пнуть, она какое то время будет лететь…

Можно провести «научное» исследование и доказать. что кошки летают плохо. И это будет верно - реально плохо летают.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от LightDiver

Вообще не согласен, что аналогия удачная.

На мой взгляд, внимание — это про выделение каких-то элементов как более важных на фоне других. С определённой целью — чтобы выделять их обработке больше ресурсов, чем обработке других. Примерно к этому сводится внимание у живых существ, и примерно в таком же контексте вполне можно, по-моему, использовать этот термин и в отношении нейросетей. Да и не только нейросетей, но даже и к классическим детерминированным алгоритмам его вполне есть где применить. В разных контекстах. Вплоть до того, что это может быть гипотетически применимо даже при написании шедулера или OOM-киллера.

Зачем может понадобиться говорить о полёте кошек на практике, тем более в сезонной миграции — непонятно. Да, если у нас чемпионат по метанию кошек, то говорить о дальности полёта будет более чем уместно. Но тогда непонятно, причём тут какие-то сезонные миграции.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Зачем может понадобиться говорить о полёте кошек на практике

Потому что это прямая аналогия с контекстом статьи на самом деле. Как у кошки нет крыльев, так у частотных моделей нет «внимания». Внимание это процесс избирательной обработки информации. Способность фокусировать ограниченные ресурсы на чем то одном, игнорируя остальное.

То есть авторы статьи доказали плохость того, чего физически не существует в силу структуры «нейронов» таких моделей.

Причем внимание для таких моделей пытаются эмулировать - тот самый процесс «мышления». Но это именно эмуляция - у нее свои минусы. Вне этой эмуляции то что вывели авторы - повышение статистической погрешности с увеличением контекста. Как неожиданно, а то никто не знал.

Ключевое для процесса «внимания» это горизонтальные связи между нейронами. Пирамидные нейроны в коре обмениваются сигналами с соседями, формируя локальные ансамбли, конкуренцию и затухающую память. В спайковых сетях это активно используется. В частотных сетях этих связей нет. Нету. Отсутствуют. Есть между слоями, но это чуток другой процесс. Именно при этом процессе катастрофически нарастает погрешность.

То есть авторы по сути пинали кошку и на основе длительности полета вывели, что кошки плохо летают.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 4)
Ответ на: комментарий от LightDiver

Как у кошки нет крыльев, так у частотных моделей нет «внимания». Внимание это процесс избирательной обработки информации. Способность фокусировать ограниченные ресурсы на чем то одном, игнорируя остальное.

То есть авторы статьи доказали плохость того, чего физически не существует в силу структуры «нейронов» таких моделей.

Вот в такой формулировке можно согласиться. В такой — по-моему, нет:

понятия «внимание» и «концентрация» к слоп-генераторам неприменимы, за неимением таковых свойств.

По-моему, понятия применимы, особенно если рассматривать в целом. И не только к «слоп-генераторам», но даже и к гораздо более простым вещам (примеры выше).

Причем внимание для таких моделей пытаются эмулировать

Это лишний раз показывает, что понятие очень даже применимо. Пытаться эмулировать то, для чего не существует (или не применимо) даже понятия, было бы совсем странно.

Просто надо различать неприменимость понятий, отсутствие значения, и нулевое значение для применимых понятий. Причём это может отличаться у теоретически обсуждаемых вещей и у реальных реализаций. Я оспариваю именно тезис «понятие внимания неприменимо к LLM». А не тезис «у существующих LLM нет внимания». Это два разных тезиса. Как понятие заряда применимо к нейтрону. Просто заряд — нулевой. А вот к любви, нигилизму, тёплому, или фиолетовому оно уже именно неприменимо.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 3)
Ответ на: комментарий от CrX

По-моему, понятия применимы, особенно если рассматривать в целом. И не только к «слоп-генераторам», но даже и к гораздо более простым вещам (примеры выше).

Это разные процессы. Они схожи только внешне. Именно потому я предложил аналогию про кошку. Если кошка летит при помощи пинка - она тоже летит, но это не тот полет, что с крыльями. У них разные предпосылки, разные результаты. Все разное.

Строить выводы на основе схожести процессов это невероятная глупость. Это называется «ложная корреляция» - когда две переменные статистически связаны (меняются вместе), но между ними нет причинно-следственной связи.

Ты сам можешь вспомнить когда такое случалось в истории и ни к чему хорошему это обычно не приводило.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от LightDiver

Это разные процессы. Они схожи только внешне. Именно потому я предложил аналогию про кошку. Если кошка летит при помощи пинка - она тоже летит, но это не тот полет, что с крыльями. У них разные предпосылки, разные результаты. Все разное.

Всё верно. Как я ранее и заметил: если у нас чемпионат по метанию кошек, то понятие высоты полёта кошки не просто применимо, но и полезно. Вопрос только причём тут сезонные миграции.

Строить выводы на основе схожести процессов это невероятная глупость. Это называется «ложная корреляция» - когда две переменные статистически связаны (меняются вместе), но между ними нет причинно-следственной связи.

Полностью согласен. Однако не очень понятно, к чему это сказано. Даже из применимости или неприменимости понятий как таковой выводы не делаются, они делаются уже по результатам применения (или неудачных попыток оного). Хотя даже применять или не применять что-то на основе исключительно схожести тоже в принципе не предлагалось…

CrX ★★★★★
()
Ответ на: комментарий от CrX

Хотя даже применять или не применять что-то на основе исключительно схожести тоже в принципе не предлагалось…

Авторы наносят вред просто формулировками. Я не берусь оценивать сомнительность или пользу их исследования - пущай изучают, все полежно может оказаться. Но зачем засирать головы?

Это как с «эффектом наблюдателя». Или «обезьяна предок человека». Простая ложная формулировка, которая засрала головы миллионам и привела к неприятным последствиям.

LightDiver ★★★★★
()
Ответ на: комментарий от LightDiver

Вон оно в чём дело…

Ну фиг знает…

Я могу тебя понять по крайней мере. С одной стороны. С другой… Ну ограничено количество слов в лексиконе. Не назвали бы «эффектом наблюдателя», пришлось бы называть как-то ещё — и кто его знает, какие именно ошибочные суждения по аналогии это вызвало бы у широкой публики…

Про «обезьяна предок человека» ситуация совершенно иная. Здесь не метафоры и не разный смысл произносимых слов, и при этом вполне истинное утверждение. Я не думаю, что его можно было бы избежать, не нагородив ещё больше лжи. Это не ложная формулировка. Другое дело, что люди додумывают рандомный бред поверх неё. Но это уже обычные когнитивные искажения, с ними выбором формулировок бороться не получится.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Не «эффект наблюдателя», а вмешательство или воздействие. Совсем иначе воспринимается эксперимент.

Не «обезьяна предок человека», а общий предок у обезьян и человека. Потому что человек и есть обезьяна. Настолько же, насколько современные остальные обезьяны.

Не «у кошки вертикальный зрачок, чтобы лучше птичек ловить», а потому что вымерли кошки с круглым и остались в какой то момент с вертикальным. Тут вообще ставят с головы на ноги и просто путают детей в школах изначально.

Не «внимание частотых моделей», а нарастание статистической погрешности.

Если правильно формулировать, сразу становятся и понятнее происходящие процессы и выводы делаются совсем иные и не возникает ложных предпосылок.

LightDiver ★★★★★
()
Ответ на: комментарий от LightDiver

Не «эффект наблюдателя», а вмешательство или воздействие. Совсем иначе воспринимается эксперимент.

Я согласен, что так лучше. Но у нас не было возможности провести эксперимент и посмотреть, какую шизу широкая публика придумает об этом, если назвать правильно. Да, мне тоже интуитивно кажется, что менее бредовую, чем с «сознание имеет значение». Но строго говоря, мы не знаем. Это требует подтверждения. Ведь шизотеории и шизовосприятие есть и с вещами, которые названы вполне нормально. Сложно оценить, какой вклад в развитии всякого мракобесия вокруг «эффекта наблюдателя» сыграло именно название. Какой-то точно был. Но вряд ли прям 100% только из-за этого.

Не «обезьяна предок человека», а общий предок у обезьян и человека.

Одно другому не пртиворечит. Общий предок современных обезьян и человека был кем? Обезьяной. Не кем-то ещё. Это лишь добавление подробностей, но не опровержение верности формулировки.

Не «внимание частотых моделей», а нарастание статистической погрешности.

Конкретно с ними — возможно. Однако, это не значит, что понятие не применимо к LLM вообще. Они могут быть устроены по-разному, в том числе можно реализовать и «внимание». Повторюсь, я считаю, что этот термин применим даже к шедулерам или OOM-киллеру — без всяких нейронок.

Если правильно формулировать, сразу становятся и понятнее происходящие процессы и выводы делаются совсем иные и не возникает ложных предпосылок.

В идеальном мире так.

В реальном: если правильно формулировать, иногда и некоторым, обычно не сразу, становятся и понятнее происходящие процессы, и есть небольшой шанс, что выводы будут сделаны иные. И возникает чуть-чуть меньше ложных предпосылок. ;)

CrX ★★★★★
()
Ответ на: комментарий от CrX

Просто тут возникает дублирование понятий и путаница. Для спайковых нейросетей вполне применим термин «внимание». И тут у нас возникает конфликт. У нас два одинаковых термина для абсолютно разных процессов.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)

им … сложно … сохранять концентрацию на поставленной задаче, когда появляются отвлекающие факторы.

интересно, что именно 100% концентрация и отсутствие релевантности отвлекающих факторов всегда и подаётся как главная фича ии огентов.

flant ★★★★
()

Вчера дал ЧатГпт задачку по информатике для переводного класса (из 9 в 10й что ли). Эксперимент показал, что считать ГПТ не умеет.

seiken ★★★★★
()
Ответ на: комментарий от CrX

Общий предок современных обезьян и человека был кем? Обезьяной. Не кем-то ещё.

Он на современного человека больше похож, чем на современных обезьян. Опять вопрос термина. С таким же успехом можно назвать его древним человеком и истиной станет, что обезьяны произошли от человека.

Ведь шизотеории и шизовосприятие есть и с вещами, которые названы вполне нормально.

Вопрос не в шизотеориях, а в необходимости уточнения. Потому что использование термина само по себе является утверждением.

Если утверждение, следующее из термина неверно, человеку приходится дополнительно запоминать утверждения относительно конкретного термина. В пределе это наименование «морская свинка», в котором оба слова термина приводят к ложным умозаключениям.

В реальном: если правильно формулировать

Цзы Лу спросил: «Вэйский правитель намеревается привлечь Вас к управлению государством. Что Вы сделаете прежде всего»?

Учитель ответил: «Необходимо начать с исправления имён».

Цзы Лу спросил: «Вы начинаете издалека. Зачем нужно исправлять имена?»

Учитель сказал: «Как ты необразован, Ю! Благородный муж проявляет осторожность по отношению к тому, чего не знает. Если имена неправильны, то слова не имеют под собой оснований. Если слова не имеют под собой оснований, то дела не могут осуществляться. Если дела не могут осуществляться, то ритуал и музыка не процветают. Если ритуал и музыка не процветают, наказания не применяются надлежащим образом. Если наказания не применяются надлежащим образом, народ не знает, как себя вести. Поэтому благородный муж, давая имена, должен произносить их правильно, а то, что произносит, правильно осуществлять. В словах благородного мужа не должно быть ничего неправильного».
monk ★★★★★
()

Не совсем понимаю для чего ии должен проходить тест Струпа.

imul ★★★★★
()
Ответ на: комментарий от monk

С таким же успехом можно назвать его древним человеком и истиной станет, что обезьяны произошли от человека.

Для этого придётся перелопачивать всю систематику, переназывать отряды с семействами. Вместе с другими шимпанзе, гориллой, орангутаном, а также многими вымершими и предковыми видами относится к гоминидам, а гоминиды — к узконосым обезьянам. И предки относятся, и современные обезьяны, и люди. Все вместе. Чтобы можно было говорить «обезьяны произошли от человека», придётся обозвать узконосых обезьян людьми и сделать так, чтобы люди (homo) стало не родовым, а парвотрядным названием. Только тогда получится сказать, что современные обезьяны произошли от людей и являются людьми. Зачем так делать кроме как с целью всех запутать — непонятно.

Вопрос не в шизотеориях, а в необходимости уточнения. Потому что использование термина само по себе является утверждением.

Если бы мы проектировали с нуля новый язык, мы бы всё сделали логично, и дали всем объектам и действиям наиболее «правильные» имена. Но к сожалению (а может и к счастью), реальные языки работают не так, они полны такими вот «божьими коровками», которые молока не дают и в церковь не ходят. Бороться с этим, наверное, можно, но дело весьма неблагодарное.

CrX ★★★★★
()
Ответ на: комментарий от LightDiver

Я не пойму только одного, почему все согласны с данной «технологией» ?

nixbrain
()
Ответ на: комментарий от LightDiver

Мем про микроскоп и гвозди не на пустом месте появился. Отважные ученые наверняка провели эксперимент, написали пэйпер и потом с помпой заявили, что микроскопом гвозди забивать не нужно. Это когда микроскопы только в моду входили и деньги пилили на них.

ant1
()

сохранять концентрацию на поставленной задаче, когда появляются отвлекающие факторы

Чисто предположение от необразованного луркера (меня): может быть, потому что для ИИ не существует «отвлекающих факторов»? Оно их просто воспринимает как часть инструкции. И оно пытается учесть всё.

kaldeon ★★
()
Последнее исправление: kaldeon (всего исправлений: 1)
Ответ на: комментарий от CrX

Мне кажется, это можно двояко воспринимать, ведь по сути ИИ ведёт себя человечнее, проваливая тест

Строго наоборот. Человек может сопротивляться тексту потому что более базирован. Он опирается на биологический опыт цвета, а для ИИ цвет это всегда просто текст. Конфликт ИИ это конфликт одного текста с другим. Для человека конфликт между биологическим ощущением цвета и текстом.

no-such-file ★★★★★
()
Ответ на: комментарий от peregrine

На 7ричную систему исчисления и подсчет нулей. Давать условие не буду, потому что всегда найдется 🤡, который, зная верное решение так вывернет свой промпт, чтобы угодить ИИшке. А ЛЛМки же люди как раз критикуют за то, что неформальный язык она очень хреново понимает.

seiken ★★★★★
()
Ответ на: комментарий от alegz

понятия «внимание» и «концентрация» к слоп-генераторам неприменимы, за неимением таковых свойств

А слово «память» применительно к устройствам хранения информации тебя не смущает?

no-such-file ★★★★★
()

GPT-4o достиг точности 91% при работе с пятью словами. При десяти словах его точность упала до 57%. Когда список расширился до сорока слов, точность упала до всего 15%.

Claude 3.5 Sonnet демонстрировал стабильную производительность при работе со списками из двадцати слов, но затем его показатели резко ухудшились, и точность упала до 24% при работе со списками из сорока слов.

Вот бы людям так уметь🙊

MaZy ★★★★★
()
Ответ на: комментарий от LightDiver

Это разные процессы. Они схожи только внешне

«Внимание» и «концентрация» это в принципе эмпирические, описательные и «внешние» термины. Поэтому нет никакой проблемы использовать их к самым разным процессам.

С точки зрения внутреннего устройства процессов никакого «внимания» и «концентрации» не существует вообще. Элементы, которые вызывают наблюдаемые снаружи «внимание» и «концентрацию» должны быть названы своими конкретными для данного устройства именами.

no-such-file ★★★★★
()
Ответ на: комментарий от CrX

И предки относятся, и современные обезьяны, и люди.

В этом смысле утверждение «человек произошёл от обезьяны» ложно, а утверждение «человек является обезьяной» истинно.

относится к гоминидам

Вот именно. А антропологи гоминидов называют людьми (австралопитек, человек умелый, …). Называем накалипитека человеком и гориллы произошли от человека.

Но к сожалению (а может и к счастью), реальные языки работают не так, они полны такими вот «божьими коровками», которые молока не дают и в церковь не ходят. Бороться с этим, наверное, можно, но дело весьма неблагодарное.

Но иногда полезное, доказано китайцами.

monk ★★★★★
()
Последнее исправление: monk (всего исправлений: 1)
Ответ на: комментарий от no-such-file

Он опирается на биологический опыт цвета, а для ИИ цвет это всегда просто текст. Конфликт ИИ это конфликт одного текста с другим.

Тогда непонятно чем задача «назови цвет» отличается от задачи «назови слова в правой колонке». Или чтение из одной колонки двухколоночного текста ИИ тоже проваливает?

Для человека конфликт между биологическим ощущением цвета и текстом.

Для человека проблема в проговаривании при чтении. И решение обычно «не читать». А его исполнение требует некоторой внутренней концентрации.

monk ★★★★★
()
Ответ на: комментарий от monk

Или чтение из одной колонки двухколоночного текста ИИ тоже проваливает?

Хороший вопрос, нужен эксперимент. Но подозреваю, что так не получится, т.к. колонки заранее группируют разный текст. А слово другого цвета – нет. Возможно эксперимент с цветными словами пойдёт лучше, если дать инструкции ИИ сначала разделить текст «на две колонки» (слева цвет, справа слово) и потом читать только слова.

no-such-file ★★★★★
()
Ответ на: комментарий от monk

Для человека проблема в проговаривании при чтении

Проблема для человека правильно обозначена в ОП. Автоматичность навыка чтения.

И решение обычно «не читать»

Именно. А ИИ не может «не читать». Это всё что он умеет. Цвет воспринимается тоже как текст. Вообще для человека есть области деятельности, где возникает похожая ситуация. Например цвета кварков это просто текст, никакого другого восприятия нет.

no-such-file ★★★★★
()
Ответ на: комментарий от monk

В этом смысле утверждение «человек произошёл от обезьяны» ложно, а утверждение «человек является обезьяной» истинно.

Нет, оба утверждения истинны. Предки человека, не являющиеся людьми, уже были обезьянами. Следовательно, человек произошёл от обезьяны.

А антропологи гоминидов называют людьми (австралопитек, человек умелый, …)

Нет, не называют. Точнее не всех. Homo — это род внутри гоминид.

CrX ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.