LINUX.ORG.RU

Ежели кому интересно

 ai-agent, , ,


0

2

Короче, захотелось мне лёгкого ИИ-агента, который не будет жрать токены вёдрами и сможет работать с небольшой (в моём случае granite4.1:3b-q4_0) локальной моделью, работающей прямо на CPU (да-да, причём древнем Intel Core i3-6300 CPU @ 3.80GHz + 16ГБ ОЗУ). Работает на FreeBSD (не официально), Linux, MacOS X и даже Windows. Умеет в Web-интерфейс.

Это не так наворочено, как, например, zeroclaw и picoclaw, нет поддержки мессенджеров, нет миллионов ненужных skills, но самое главное, может НОРМАЛЬНО (единственный из всех мною пробованных, а перепробовал я десятки сортов) с дохлой локальной моделью. И с удалёнными, не сжирая за пару запросов весь бюджет токенов.

Встречайте: https://github.com/sigoden/aichat/

// Если вы знаете что-то похожее, не стесняйтесь, - делитесь.

Перемещено CrX из talks

★★★★★

Последнее исправление: dataman (всего исправлений: 1)
Ответ на: комментарий от PcheloBiaka

почему вы рогами в землю упёрлись и не даёте реализовать возможность управлять окном?)

Можно конретнее, кто именно тебе не дает возможность управлять окном?

anonymous
()
Ответ на: комментарий от anonymous

Уже не раз это обсуждалось. Помоему в прошлом году в итоге появилось, но теперь каждый оконный менеджер должен это реализовать. Отдельно. Как прекрасен стал мир линукса после этого…

PcheloBiaka
()
Ответ на: комментарий от PcheloBiaka

Я с нетерпением жду тех кто объявит их устаревшим говном и заменит вейлянд на что-то впердепланетное.

:)))

А похоже что так и будет.

Стариков надо уважать! А то и ты, не ровён час, до старости доживешь. Ох и хлебнешь тогда! А рука, чтоб клюкой в ответ замахнуться, будет уже не так тверда!

wirewalk
()
Ответ на: комментарий от anonymous

Это происходит больше десятилетия. Уже везде впилили этот вейлянд. Писать что-то под иксы получается - писать в прошлое. А писать под вяленый просто трата времени потому что нет возможности получить одинаковое поведение в разных окружениях. Они разделили линукс, фрагментировали его больше, чем наличие дистрибутивов или окружений. Это то о чём Майки могли только мечтать. Это активно мешало мне. Это активно мешало разработчикам множества проектов. Даже куски меню улетают в сторону, если у тебя не то сочетание оконного менеджера и инструментов из необязательного экспериментального вороха инструментов вейлянда, которые могут быть всё равно не реализуемы, если ты работаешь на более «стабильном» дистрибутиве.

Моё отношение к Вейланду и тому как они блокируют совершенно разумные вещи строится на сломаном пользовательском опыте и невозможности просто взять и реализовать то что мне нужно. Сидите в браузере и думаете что на этом мир заканчивается?

PcheloBiaka
()
Ответ на: комментарий от IPR

Зачему, что «токены жрёт пц как» и «такое же говно» - это на тему его автономности и всеобъемлющей интеграции куда-только-можно? Если есть желание - используй nullclaw-агента, но обозвать *Claw-агентами, мол, «говном», - это ещё нужно уметь.

Если есть возможность работать вне-контекста текущей сессии, цитирую, «миллионов ненужных skills», где, собственно, не более 3-4 грамотно написанных skills не должно быть в контексте ИИ-агента, то почему бы и нет? Почему бы не добавить десяток или горсть skills и использовать их по назначению? Для меня загадка.


Под конец, возьму следующую цитату:

но самое главное, может НОРМАЛЬНО (единственный из всех мною пробованных, а перепробовал я десятки сортов) с дохлой локальной моделью. granite4.1:3b-q4_0

Я конечно понимаю, что люди разные и всё такое прочее, но на что мы используем данную модель? Для кодо-генерации, может быть, но как? Agentic Workflow, где она будет выступать в качестве главного супервизера, - идея быстро «обваливается» на практике. Что «НОРМАЛЬНО» она выполняет и, если мне не изменяет память, 131 тысяч токенов для большинства задач хватает «с лихвой» даже на более старых ИИ-моделях семейства IBM Granite.

Я говорю это ради простой мысли: чинить нужно не ИИ-агента, а себя, yourself. Если тебе не удаётся запустить ИИ-агента даже при <20% занятости контекста и он у тебя работает плохо, то ты попадаешь в тот «тупик» SLM - использование не по назначению и вне его scope.

TheLabAIRat
()
Ответ на: комментарий от ivbor

v0.30.0 Latest on Jul 7, 2025

Зачем этот артефакт из прошлого использовать?

Согласен. Прогресс в нейросетях такой, что актуальны модели, вышедшие в последние пол=года.

anonymous
()
Ответ на: комментарий от PcheloBiaka

Я тут потихоньку пилю своего claw-подобного агента на все руки, с голосовым вводом, мультиязычным TTS (хоть и корявым), навигацией по интернету и управлением рабочим столом на X11/Wayland, могу поделиться, если интересно Оно вроде как на 70% работает и теперь осталось добить воспроизводимость функциональности для e2e тестов

mazdai ★★★
()
Последнее исправление: mazdai (всего исправлений: 1)
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария