LINUX.ORG.RU

Ежели кому интересно

 ai-agent, , ,


0

2

Короче, захотелось мне лёгкого ИИ-агента, который не будет жрать токены вёдрами и сможет работать с небольшой (в моём случае granite4.1:3b-q4_0) локальной моделью, работающей прямо на CPU (да-да, причём древнем Intel Core i3-6300 CPU @ 3.80GHz + 16ГБ ОЗУ). Работает на FreeBSD (не официально), Linux, MacOS X и даже Windows. Умеет в Web-интерфейс.

Это не так наворочено, как, например, zeroclaw и picoclaw, нет поддержки мессенджеров, нет миллионов ненужных skills, но самое главное, может НОРМАЛЬНО (единственный из всех мною пробованных, а перепробовал я десятки сортов) с дохлой локальной моделью. И с удалёнными, не сжирая за пару запросов весь бюджет токенов.

Встречайте: https://github.com/sigoden/aichat/

// Если вы знаете что-то похожее, не стесняйтесь, - делитесь.

Перемещено CrX из talks

★★★★★

Последнее исправление: dataman (всего исправлений: 1)

может НОРМАЛЬНО (единственный из всех мною пробованных, а перепробовал я десятки сортов) с дохлой локальной моделью.

Так что может-то?

mamina_radost
()
Ответ на: комментарий от mamina_radost

Multi-Providers

Integrate seamlessly with over 20 leading LLM providers through a unified interface. Supported providers include OpenAI, Claude, Gemini (Google AI Studio), Ollama, Groq, Azure-OpenAI, VertexAI, Bedrock, Github Models, Mistral, Deepseek, AI21, XAI Grok, Cohere, Perplexity, Cloudflare, OpenRouter, Ernie, Qianwen, Moonshot, ZhipuAI, MiniMax, Deepinfra, VoyageAI, any OpenAI-Compatible API provider.

…и другие возможности. :)

dataman ★★★★★
()
Ответ на: комментарий от mamina_radost

Да в принципе как чятик, tools, анализировать код et cetera.

u@agent:~/aichat/target/debug#  ls / | ./aichat 'что это за система? Подробнее'
Это структура каталогов во FreeBSD или других Unix-подобных операционных систем. Каждый каталог служит для разного типа файлов и функций в системе.
u@agent:~/aichat/target/debug# cat /root/updports | ./aichat 'внимательно проанализируй скрипт. Для чего он?'
Этот скрипт используется для обновления портов в системе Unix. Он выполняет следующие действия:
1. Проверяет, что он запущен с правами root.
2. Загружает список изменений в директории портов.
3. Пытается загрузить обновления в директории портов.
IPR ★★★★★
() автор топика

А ты давно его делаешь? Вроде был уже aichat в aur.

Я всё пытаюсь родить такую серебряную пулю, чтобы голосовой ввод, чтение с экрана, операции с компьютером, с окнами, приложениями, поиск в интернете, пополнение «базы знаний» и просто «по душам поболтать». И всё никак не получается. Пробовал много подходов, никак.

PcheloBiaka
()
Последнее исправление: PcheloBiaka (всего исправлений: 1)
Ответ на: комментарий от PcheloBiaka

А ты давно его делаешь? Вроде был уже aichat в aur.

Это не мой проект, просто нашёл.

Я всё пытаюсь родить такую серебряную пулю, чтобы голосовой ввод, чтение с экрана, операции с компьютером, с окнами, приложениями, поиск в интернете, пополнение «базы знаний» и просто «по душам поболтать». И всё никак не получается. Пробовал много подходов, никак.

Думаю, подобное будет в течении полугода, в виде мобильного приложения. Прост подожди.

IPR ★★★★★
() автор топика
Ответ на: комментарий от IPR

А я вспомнил еврейский анекдот в связи с этим.

― Доктор, мой сосед говорит, что может три раза за ночь.
― Ну так и вы говорите.

(ничего плохого сказать не хочу, если что)

Кстати, на форуме появился новый раздел: https://www.linux.org.ru/forum/ai/. Сам только сегодня случайно узнал.

knovich ★★
()
Ответ на: комментарий от IPR

Думаю, подобное будет в течении полугода, в виде мобильного приложения. Прост подожди.

Вот я и смирился (почти). Хотя нет, на выходных опять тыкал палочкой. Я хуже ИИ, у меня не работает даже то, что работает :)))

нашёл локальные. openai-compatible

PcheloBiaka
()
Последнее исправление: PcheloBiaka (всего исправлений: 1)

v0.30.0 Latest on Jul 7, 2025

Зачем этот артефакт из прошлого использовать?

в моём случае granite4.1:3b-q4_0

Вот эту модельку плохо подхватывают современные «агенты»? Она не дохлая, а вполне навороченная, свежая и оптимизированная

не так наворочено, как, например, zeroclaw и picoclaw

Все «…claw» штуки - это именно что «персональные ассистенты». Их суть в интеграциях с мессенджерами и прочими модными штуками. Такая «Алиска» на максималках.

По теме «агентов»: https://github.com/earendil-works/pi пробовал? В базовом варианте установки - самое простое и легкое из современного.

ivbor
()

но самое главное, может НОРМАЛЬНО (единственный из всех мною пробованных, а перепробовал я десятки сортов) с дохлой локальной моделью.

Так что же он может НОРМАЛЬНО?

Xintrea ★★★★★
()
Ответ на: комментарий от Xintrea

Ничего оно не может как и подобные микрокастраты - чтобы была хоть какая-то польза от держания агента он должен быть на модели не меньше чем кimi 2.6 и память должна быть хонча та же, короче взять гермесса если нетакусик и openclaw не подходит и хотя бы эта дура не будет прошлое сообщение забывать.

ponchik-2
()

zeroclaw и наворочено, лол, оно хоть скиллы само переписывать научилось? А еще помойка из архитектуры и коммиты про одно и тоже, один из слабейших проектов подобного рода уж лучше openfang если раст принципиален

ponchik-2
()
Последнее исправление: ponchik-2 (всего исправлений: 2)
Ответ на: комментарий от vazgen05

А почему именно эта модель? Как будто для русского языка такое себе.

Не уходит в вечный loop, большой контекст 128k, быстро отвечает, не срёт иероглифами.

IPR ★★★★★
() автор топика
Ответ на: комментарий от ponchik-2

память должна быть хонча

Кстати, вот поставил hermes agent, и думаю к нему память поставить, но эта honcho какая-то слишком замороченая. Как ее вообще ставить надо? Локально, юзать облачную бесплатный тир или платить подписку? Ты ее пробовал?

goingUp ★★★★★
()

granite4.1:3b-q4_0

Спасибо, а вот это хороший хайлайт.

anonymous
()
Ответ на: комментарий от ponchik-2

А что вы делаете с такими монстрами? Переводите с древнешумерского на китайский?
3b-модель с нетипичным для нее языком это конечно печально, но обмазав костылями и такую можно сделать полезной.

vazgen05 ★★★
()

Смущает что:

v0.30.0
Latest
on Jul 7, 2025

С одной стороны 0.30 - это значит что делать еще есть что, и даже дофига, и сам автор это осознает.
С другой стороны - не релизились уже год почти, изменения тоже не прям свежак.
Вот как к этому относиться?

wirewalk
()
Ответ на: комментарий от goingUp

Я локально поставил управлять ей дал openai, пока лучшее что тыкал, за месяц проблем не было, сам гермес ее настроил и проверил и я еще его заставил раз в пару дней отчет слать по состоянию.

ponchik-2
()
Ответ на: комментарий от wirewalk

Вот как к этому относиться?

С грустью и пониманием, пока не найдём что-то свежее.

Грустно, но вкусно (С)

IPR ★★★★★
() автор топика
Ответ на: комментарий от IPR

Да закиньте на опенроутер 2$ и пользуйтесь всякими qwen и подарочными моделями до посинения это будет лучше чем что угодно локальное. Сейчас бы токены считать при таком разнообразии китайцев.

ponchik-2
()
Ответ на: комментарий от ponchik-2

Opencode сейчас идет с халявной дикпик 4 флеш, даже ничего не нужно закидывать.

goingUp ★★★★★
()
Ответ на: комментарий от PcheloBiaka

Я всё пытаюсь родить такую серебряную пулю, чтобы голосовой ввод, чтение с экрана, операции с компьютером, с окнами, приложениями, поиск в интернете, пополнение «базы знаний» и просто «по душам поболтать».

Я опасаюсь таких серебряных пуль. Можно попасть в положение героя песни:

Крыша едет у соседа:
Как жену зовут, не помнит.
Ему компьютер собеседник,
Собутыльник и любовник…

hobbit ★★★★★
()
Ответ на: комментарий от hobbit

По классике – «в неё».

ок, наверное. даже соглашусь, не знаю зачем. я вообще обычно воспроизвожу по памяти, а память дырявая. так что все может быть. но «в нее» у меня вызывает другие ассоциации.

olelookoe ★★★★
()
Ответ на: комментарий от PcheloBiaka

Я всё пытаюсь родить такую серебряную пулю

Тебе принципиально, чтобы все тобой перечисленное в одном флаконе? Вроде всё перечисленное по отдельности существует. Или мне так кажется… Сам я весь пазл собирать не пытался, если что.

wirewalk
()
Ответ на: комментарий от hobbit

Эх. Люди нужны не только лишь всем.

А если серьёзнее, то комп-внешний мозг в том или ином виде существует уже давно. Один Obsidian и Ko чего стоят. Автоматизированые скрипты, которыми обвешиваются линуксоиды. И т.д. Всё это для упрощения жизни. И не достаёт лишь одной нотки. ИИ.

Мне не нравятся невидимые клешнеботы. Это действительно опасно. И мне не нравятся персонажи, которые создают на базе LLM, с сисястыми тянками. Мой ассистент должен и оставаться ассистентом. А «за жысь поговорить» - ну… Вот задал я вопрос ИИ - «почему везде глобальное потепление, а уже второй год холодно?» Он накидал мне кое чего, поговорили. Вот где бы я нашёл собеседника на эту тему? Спросил обзор составить на пневмо-моторы. Он составил. И мы обсудили детали. В этом смысле мне просто не к кому обратиться. Вокруг выжженая пустыня из… необразованных людей.

Воздействие ИИ на человечество будет разрушительным не потому, что он ужасен, а потому что люди и без него стремительно бегут в пропасть,как те хомячки. А я стою сбоку и обсуждаю со своим ИИ вотэтавот всё

PcheloBiaka
()
Последнее исправление: PcheloBiaka (всего исправлений: 1)
Ответ на: комментарий от wirewalk

Обычно всё или отдельными сущностями делается, типа, нажал кнопку,начитал текст в активное окно. или тупо чатик через который общаться. А мне должно работать со всеми окнами. И тут вейляндовцы так насрали… Хотя потихоньку запиливают нужные мне фичи. Уже даже kdotools стал делать нужное. А когда станет беспроблемной работа сокнами, кто- о гораздо умнее меня и запилит правильного ассистента.

PcheloBiaka
()
Ответ на: комментарий от anonymous

IBM Granite Models are a family of enterprise-ready, open foundation models that support multilingual capabilities, coding, retrieval-augmented generation (RAG), tool use, and structured JSON output. Released under Apache 2.0 license.

IPR ★★★★★
() автор топика
Ответ на: комментарий от IPR

Это не ответ на мой вопрос, а просто копипаста. Меня интересует скорее практическая сторона. Что именно можно сделать с этой маленькой моделью на компе с 16GB ОЗУ?

anonymous
()
Ответ на: комментарий от anonymous

Теоретически она тебе сожрет 16гб озу и чуток ядер процессора. Практически выдаст кучу мусора. Тебе мало?

LightDiver ★★★★★
()
Ответ на: комментарий от anonymous

Можно использовать как вспомогательную нейронку, сжимать контекст, извлекать из текста фичи итп.
Сделать сводку этого треда наверняка осилит.

vazgen05 ★★★
()
Ответ на: комментарий от PcheloBiaka

А когда станет беспроблемной работа сокнами, кто- о гораздо умнее меня и запилит правильного ассистента.

А тогда кто-то гораздо умнее скажет «да сколько можно!» - и перепишет вейланд.

wirewalk
()
Ответ на: комментарий от vazgen05

Сделать сводку этого треда наверняка осилит.

Мде, ну чет такое конечно.

**1. Main Project or Topic Discussed in [MAIN POST]:**  
The main project discussed is the development of a lightweight AI agent (aichat) capable of operating with a small local model (granite4.1:3b-q4_0) on CPU, supporting multiple operating systems including FreeBSD, Linux, MacOS X, and Windows. It emphasizes that this agent can work with heavy local models without consuming token budgets like many other solutions.

**2. Alternative Software Tools or Solutions Mentioned:**  
- Zeroclaw and Picoclaw (mentioned as more feature-rich but not needed for the described use case)  
- Various LLM providers through a unified interface (OpenAI, Claude, Gemini, Ollama, Groq, Azure-OpenAI, VertexAI, Bedrock, Github Models, Mistral, Deepseek, AI21, XAI Grok, Cohere, Perplexity, Cloudflare, OpenRouter, Ernie, Qianwen, Moonshot, ZhipuAI, MiniMax, Deepinfra, VoyageAI)  
- Hermes Agent (mentioned as an alternative for memory and functionality)

**3. Technical Complaints or Bugs Mentioned:**  
- The aichat project is noted to be outdated (v0.30.0 from July 7, 2025), suggesting potential issues with stability and lack of recent updates.  
- Concerns about the model's performance on Russian language tasks due to context limitations.  
- Issues related to memory management and token consumption not being optimal for heavy local models.

**4. Community Mood Summary:**  
The community mood is a mix of cautious optimism and skepticism. Positive reactions include praise for the project's ability to work normally with local models (e.g., "😊:1,🚮:1") and appreciation for its lightweight nature ("☕☕:5"). However, there are also notable criticisms such as concerns about outdated software versions, potential performance limitations with Russian language tasks, and doubts about the viability of using such a model compared to more modern alternatives. The overall tone leans toward cautious enthusiasm rather than outright dismissal, with several users suggesting alternative solutions or future improvements

vazgen05 ★★★
()
Ответ на: комментарий от wirewalk

Ну, похоже камень сдвигают с места. Оказывается многое уже давно было написано и не принималось вейляндцами по политическим и идеологическим причинам. Им давно указывают на то, что во всём мире и даже в старых иксах это было десятилетия назад,это никак не влияет на безопасность. И этих долдонов потихоньку заставляют принять одно, другое. Со скрипом дело идёт. Вообще поменять бы ответственных за это -, давно бы всё было и в вейланде. Там какие-то сектанты заседают. Или на зарплате у майков, чтобы саботировать развитие линукса как десктопа. Они не зря в редхат ходили.

PcheloBiaka
()
Ответ на: комментарий от PcheloBiaka

Там какие-то сектанты заседают.

Это всегда так. Надо быть идейным, чтобы действовать в стиле «верю в себя, не замечаю препятствий». А совсем без фанатизма, на расслабоне, никакое дело с мертвой точки не сдвинуть.
Умом я все это понимаю и даже где-то оправдываю, но все эти «заседатели в комитетах» дико раздражают. Сидишь, читаешь какой-нибудь «драфт нового стандарта» и думаешь - вы там что курили?

wirewalk
()
Ответ на: комментарий от wirewalk

Блин. Писал долго,много и… Всё пропало :(

Ладно. Коротко.

Такие штуки это не просто так «писать на расслабоне» или"гореть идеей и лететь на крыльях". Такие штуки долго проектируются (а в открытом обществе хорошо бы с обсуждением от всех заинтересованых сторон) ДО написания кода. Они когда-то обвинялииксы в недопроектированности и написании всего на ходу, а сами сделали… ровно то же самое. Вплоть до практически полного переписывания вначале.Только с диким гонором типа «мы вам тут новое впердепланетное пишем вапчета, не лезьте всоим свиным рылом!».

Иксы писались действительно в процессе. Просто потому, что технологии появлялись в процессе. Невозможно спроектировать будущее. Хотя можно умно написать архитектуру так, чтобы при появлении нового не приходилось переписывать с нуля всё. И авторам вяленого нужно было только зафиксировать срез текущих технологий, с учётом того, что виднеется на горизонте и правильно спроектировать. Вместо этого они пошли по всем граблям демонстрируя не только неспособность проектировать (сказать, что вейлянд ни за что не отвечает - это очень плохое проектирование) и вахтёрство одновременно (если ваш вейлянд ни начто не отвечает,то почему вы рогами в землю упёрлись и не даёте реализовать возможность управлять окном?)

Но как и Лёнечка наш Поттеринг,они со временем умнеют, учатся и… становятся стариками. Я с нетерпением жду тех кто объявит их устаревшим говном и заменит вейлянд на что-то впердепланетное. И даже если это будет ужас как плохо, я хоть поехидничаю с вейляндописак

PcheloBiaka
()
Последнее исправление: PcheloBiaka (всего исправлений: 1)
Ответ на: комментарий от IPR

Подсказывать код, утилиты, флаги. Коротко описать что-то неизвестное. Анализировать логи, конфиги.

оно может это делать лучше, чем классические утилиты? ну кроме коротко описать что такое «шушпанцер».

anonymous
()
Ответ на: комментарий от knovich

Так что может-то?

Написано же — может НОРМАЛЬНО.

Учи русский. «НОРМАЛЬНО» это наречие, которое отвечает на вопрос «как?», а не «что?».

anonymous
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария