LINUX.ORG.RU

AMD GAIA 0.20.0

 , gaia, ryzen ai


0

1

Опубликован выпуск AMD GAIA 0.20.0 — открытого фреймворка для запуска локальных AI-агентов на ПК с аппаратным ускорением AMD Ryzen AI. Проект распространяется под лицензией MIT, поддерживает Windows и Linux, а установка доступна через пакет amd-gaia. Сам тег v0.20.0 опубликован 3 июня, но в новостную ленту релиз попал 4–5 июня.

Главное изменение версии — нормальный выбор устройства выполнения для каждого агента. Раньше GAIA по умолчанию использовала GPU через backend на базе llama.cpp и не давала удобного способа переключить конкретного агента на CPU или энергоэффективный Ryzen AI NPU. В GAIA 0.20.0 агенты могут объявлять поддерживаемые устройства, а пользователь выбирает CPU, GPU или NPU через Agent UI либо CLI-флаг --device {cpu,gpu,npu}. GPU остаётся вариантом по умолчанию, а профиль gaia init --profile npu берёт на себя обнаружение NPU, установку FLM-backend и загрузку модели.

Изменения в выпуске:

  • Выбор CPU/GPU/NPU для отдельных агентов. Позволяет запускать тяжёлые сценарии на GPU, а менее требовательные или фоновые — на NPU или CPU. Для владельцев Ryzen AI это особенно важно: NPU можно использовать для локального вывода с меньшим энергопотреблением, не занимая видеоядро.

  • Agent Hub TUI. При запуске gaia без аргументов теперь открывается терминальный центр управления агентами. Через него можно просматривать, искать, запускать и администрировать агентов без графического интерфейса. Разработчики указывают размер standalone-бинарника около 21 МБ и запуск менее чем за 200 мс.

  • Более строгий контроль MCP-инструментов. Для MCP-коннекторов добавлен второй уровень управления — activations. Теперь выданный агенту коннектор не обязан автоматически добавлять все свои инструменты в prompt: инструменты становятся видимыми только после явного включения для пары «коннектор — агент». Это уменьшает шум в prompt и помогает небольшим моделям точнее выбирать нужные действия.

  • Ускоренная обработка почты. Email-агент получил семь новых batch-инструментов для массовой организации входящих. По данным разработчиков, типовой сценарий сократился примерно с 13 LLM-запросов до 2–3 шагов, время обработки — с 488 секунд до 30–60 секунд, а расход токенов — примерно с 12 тысяч до 1,2 тысячи.

  • RAG по PowerPoint-файлам. GAIA теперь напрямую индексирует .pptx: текст, таблицы, заметки докладчика и встроенные изображения через VLM-анализ. Раньше пользователю предлагалось сначала сохранять презентации в PDF.

  • Усиление безопасности и устойчивости первого запуска. В релизе закрыт обход защиты от записи через символические ссылки в Python 3.10/3.11, расширены ограничения записи ещё на четыре файловых инструмента, а также исправлена ошибка диагностики повреждённой модели, из-за которой могла запускаться повторная загрузка примерно 25 ГБ данных.

GAIA развивается как локальная альтернатива облачным AI-сервисам: данные остаются на машине пользователя, а выполнение можно переносить между CPU, GPU и NPU в зависимости от задачи. Для AMD это ещё и демонстрация практического применения Ryzen AI не только как маркетингового блока в процессоре, но и как отдельного вычислительного устройства для локальных агентов.

>>> Источник

★★★★★

Проверено: cetjs2 ()
Последнее исправление: cetjs2 (всего исправлений: 1)

Вообще нигде и никогда не видел тесты (ни скорости ни энергосбережения) на реальных моделях сколько и чего дает AMD NPU.

Вулкан и почти есть ROCm, и для всего хватает.

One ★★★★★
()

Вообще нет смысла локальным агентам, они в любом случае будут уступаит веб агентам. Даже если как взять с собой ИИ, это всё равно меркнет перед вебом)

REDDERa
()

ну и теги xdna xilinx, потому что все npu в soc amd - xilinx, внезапно. +200м блобов.

etwrq ★★★★★
()
Последнее исправление: etwrq (всего исправлений: 1)

интересно, попробую.

сейчас пользую лимонад, субъективно flm (запускается на npu) проигрывает движкам на gpu.

идеально было бы, чтобы можно было ипользовать npu+gpu одновременно: префил на npu, генерацию на gpu.

кажется, технически так можно уже делать, но пока не видел удобного инструмента для этого.

sgm
()
Последнее исправление: sgm (всего исправлений: 1)

А кто-нибудь помнит, что под тем же названием когда-то существовала картографическая программа, которую Google заставил убрать?..

hobbit ★★★★★
()
Ответ на: комментарий от REDDERa

Развивается софт, развивается железо, скорее всего мощностей скоро будет просто достаточно, чтобы пускать локально удовлетворительно умный ИИ, вот и АМД и идёт этой дорогой.

GAMer ★★★★★
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария