Посоветуйте ai chat bot

В идеале безплатный

Квен

Хорошо бы если б оно помимо помощи в кодинге умело бы генерировать картинки и реалистичные видео.

Квен

Те что видел - с задержкой появления каждой буквы в ответе.

Локальные модели, так же генерируют ответ. Это особенность всех ллм.

Это для идиотов?

Да.

einhander ★★★★★
(03.05.26 08:31:13 MSK)

реалистичные видео

fullHD. например что-то типо 2 красивые сероглазые девушки лижутся 2 часа. сейчас же много порно на порносайтах делается с помощью ПО. какого?

teod0r ★★★★★
(03.05.26 08:31:23 MSK) автор топика

Ответ на: комментарий от einhander 03.05.26 08:31:13 MSK

Локальные модели, так же генерируют ответ.

ЯННП

Это особенность всех ллм.

неправда. видел ботов без задержки перед буквами.

teod0r ★★★★★
(03.05.26 08:33:30 MSK) автор топика

Это визуально сокращает время отклика. Иногда ответ длинный, по мере его появления ты читаешь и сокращаешь время, так быстрее. Это с человеком ты не можешь видеть текст по мере набора, но это не значит что так быстрее. Смотришь, читаешь по мере появления ответа и понимаешь, не туда пошли, остановить бесполезную работу и опять не тратишь время и гигаватты. Но люди, которые этим пользуются скорее всего идиоты, да, они же могли бы важно надув щёки сидеть и с соседом делиться «равда все вокруг тупые?» - «да, вообще тупые, а я даже не улыбаюсь никогда, потому что я умный».

PcheloBiaka ★
(03.05.26 08:36:40 MSK)

Ответ на: комментарий от PcheloBiaka 03.05.26 08:36:40 MSK

так быстрее

нет.

по мере его появления ты читаешь

нет.

остановить бесполезную работу и опять не тратишь время и гигаватты.

lol

teod0r ★★★★★
(03.05.26 08:40:27 MSK) автор топика

Ответ на: комментарий от einhander 03.05.26 08:31:13 MSK

Квен

там есть задержка перед буквами?

teod0r ★★★★★
(03.05.26 08:44:00 MSK) автор топика

Я пользуюсь Gemini.

С Chatgpt давно ушел, т.к. одно время он начал требовать с меня фото паспорта (что дальше? Фото с флажком в жопе, чтобы заслужить честь пользоваться вашим говночатом?). Ну и бесило то, что чем больше пишешь, тем больше он начинает тормозить.

Китайские мне не понравились еще со времен «the service is busy».

Чатик от Машка тоже не зашел.

MoldAndLimeHoney ★★★
(03.05.26 08:44:55 MSK)
Последнее исправление: MoldAndLimeHoney 03.05.26 08:45:53 MSK (всего исправлений: 1)

Ответ на: комментарий от teod0r 03.05.26 08:33:30 MSK

неправда. видел ботов без задержки перед буквами.

Пользуйся ими. Данные от ллм будут накапливаться в буффер,показать их сразу или когда буфер будет заполнен задача фронта. Большинство решили, что показывать данные сразу удобнее.

einhander ★★★★★
(03.05.26 08:49:36 MSK)

Ответ на: комментарий от MoldAndLimeHoney 03.05.26 08:44:55 MSK

С Chatgpt давно ушел, т.к.

Интересует не какя-то модель, а конечая реализация в виде какого-то конкретного сайта.

teod0r ★★★★★
(03.05.26 08:50:01 MSK) автор топика

Ответ на: комментарий от teod0r 03.05.26 08:50:01 MSK

а конечая реализация в виде какого-то конкретного сайта.

Ну.. я про это и написал или я не понял вообще о чем-то.

https://gemini.google.com
chatgpt.com

и т.д.

MoldAndLimeHoney ★★★
(03.05.26 08:53:22 MSK)
Последнее исправление: MoldAndLimeHoney 03.05.26 08:53:36 MSK (всего исправлений: 1)

Ответ на: комментарий от einhander 03.05.26 08:49:36 MSK

Большинство решили, что показывать данные сразу удобнее.

а если подумать? ты думаешь ответ нейронка по 1 буковке составляет с задержками между ними?

teod0r ★★★★★
(03.05.26 08:53:30 MSK) автор топика

Ответ на: комментарий от teod0r 03.05.26 08:53:30 MSK

Gemini показывает не сразу, но и не по одной букве. Довольно быстро и как бы предложениями или даже абзацами.

MoldAndLimeHoney ★★★
(03.05.26 08:54:27 MSK)

Ответ на: комментарий от MoldAndLimeHoney 03.05.26 08:53:22 MSK

или я не понял вообще о чем-то.

ты привёл ссылки на официальных владельцев моделек. на этих моделях есть куча реализаций и сайтов на них.

teod0r ★★★★★
(03.05.26 08:55:38 MSK) автор топика
Последнее исправление: teod0r 03.05.26 08:56:24 MSK (всего исправлений: 1)

Ответ на: комментарий от teod0r 03.05.26 08:40:27 MSK

Я в самом начале своих экспериментов делал так, чтобы текст появлялся целиком. И очень быстро отошёл от этого. Это реально быстрее и удобнее. Особенно на локальных моделях. В конце концов, читаешь ты тоже последовательно.

Напиши хоть один плюс того, чтобы ждать ответа целиком.

PcheloBiaka ★
(03.05.26 09:29:21 MSK)

Ответ на: комментарий от teod0r 03.05.26 08:53:30 MSK

ты вообще понимаешь как оно работает? Ёлки… Запусти модель хоть на pytorch локально и понаблюдай как генерируется ответ непосредственно, без чатов, через твой неповторимый код.

Кстати, с удовольствием посмотрел бы на текст, который генерируется как картинка - из шума в осмысленный текст целиком. Правда, у картинки есть заранее заданные границы и формат. Но всё равно интересно

PcheloBiaka ★
(03.05.26 09:32:17 MSK)
Последнее исправление: PcheloBiaka 03.05.26 09:36:31 MSK (всего исправлений: 1)

Ответ на: комментарий от teod0r 03.05.26 08:31:23 MSK

Тебе для личного пользования или ты решил порносайт открыть?

firkax ★★★★★
(03.05.26 10:13:30 MSK)

Ответ на: комментарий от teod0r 03.05.26 08:53:30 MSK

Она не просто «составляет по 1 букве», но на генерацию каждой буквы (или слога) там перелопачиваются гигабайты оперативной памяти. Генерация работает по принципу «определить наиболее вероятную следующую букву/слог в уже имеющемся начале текста», то есть это автодополнение, но учитывающее не только последнее слово, а весь предыдущий текст и имеющее огромную базу статистик внутри своей реализации. Если бы оно пыталось угадывать хотя бы целое следующее слово - всё было бы намного сложнее, разных слов очень много. Угадать букву/слог - вычислительно намного проще.

Это для идиотов?

Да. Очевидно, только идиоты могут чатиться с движком автодополнения.

firkax ★★★★★
(03.05.26 10:18:36 MSK)
Последнее исправление: firkax 03.05.26 10:22:48 MSK (всего исправлений: 2)

В идеале безплатный.

duck.ai

https://chat.qwen.ai/

Платные через API - платишь за каждый запрос: bothub.chat, принимает и рубли. Куча моделей для всего.

hakavlad ★★★
(03.05.26 10:22:00 MSK)

chat-bot

Это для идиотов?

да

amd_amd ★★★★★
(03.05.26 10:23:16 MSK)

Ответ на: комментарий от PcheloBiaka 03.05.26 09:29:21 MSK

Напиши хоть один плюс того, чтобы ждать ответа целиком.

я не могу читать, когда перед глазами что-то маячит.

teod0r ★★★★★
(03.05.26 10:27:24 MSK) автор топика

Ответ на: комментарий от firkax 03.05.26 10:13:30 MSK

для личного пользования

teod0r ★★★★★
(03.05.26 10:28:02 MSK) автор топика

Ответ на: комментарий от teod0r 03.05.26 10:27:24 MSK

Пользуясь всем в Телеграмме. Там оно тебе целым сообщением отправил все.

vitruss ★★★★★
(03.05.26 10:31:45 MSK)

Ответ на: комментарий от firkax 03.05.26 10:18:36 MSK

Она не просто «составляет по 1 букве», но на генерацию каждой буквы (или слога) там перелопачиваются гигабайты оперативной памяти. Генерация работает по принципу «определить наиболее вероятную следующую букву/слог в уже имеющемся начале текста», то есть это автодополнение, но учитывающее не только последнее слово, а весь предыдущий текст и имеющее огромную базу статистик внутри своей реализации.

не верю. какой в этом смысл? зачем вычислять следущую букву, если нужно просто выдать ЦЕЛУЮ ФРАЗУ из бд энциклопедий.

teod0r ★★★★★
(03.05.26 10:32:00 MSK) автор топика

Ответ на: комментарий от hakavlad 03.05.26 10:22:00 MSK

bothub.chat, принимает и рубли. Куча моделей для всего.

выводит ответ целиком?
скока рублей 1 ответ?

teod0r ★★★★★
(03.05.26 10:34:19 MSK) автор топика

Ответ на: комментарий от teod0r 03.05.26 10:32:00 MSK

не верю. какой в этом смысл? зачем вычислять следущую букву, если нужно просто выдать ЦЕЛУЮ ФРАЗУ из бд энциклопедий.

У них нет никакой БД энциклопедий. Есть сеть из токенов и связей между ними. Суть LLM как раз в том, чтобы угадывать, какой токен с большей вероятностью идёт после совокупности предыдущих. Про буквы, конечно, неправильно — подавляющее большинство токенов больше, чем одна буква, обычно это простое слово, иногда часть сложного слова, реже несколько коротких связных слов часто встречающихся.

Показ юзеру всей этой генерации в процессе лучше, чем делать это скрыто, а потом выдавать целиком. Экономит очень много времени, причём несколькими способами: во-первых, можно читать в процессе генерации, и если это длинная портянка, ты половину уже прочитаешь, пока она закончит; во-вторых юзеру может быть достаточно первых одного-двух абзацев из 10+, например, и он может отменить дальнейшую генерацию и не тратить почём зря время и токены, по разным причинам, хоть потому что нужная инфа уже дана, хоть потому что оно отвечает явно не то, и надо переформулировать промпт.

Скрывать этот процесс, а потом вываливать простыню — бессмысленно, тупо трата времени. Но запуская локальную LLM так сделать тоже можно. Даже из коробки есть такая опция.

CrX ★★★★★
(03.05.26 10:37:39 MSK)

Ответ на: комментарий от teod0r 03.05.26 10:28:02 MSK

Рекомендую проконсультироваться с психологом или психиатром по этому поводу.

firkax ★★★★★
(03.05.26 10:45:00 MSK)

Те что видел - с задержкой появления каждой буквы в ответе. Это для идиотов?

Это для тех, кто не видит проблемы с нехваткой ресурсов. Или вообще запускает на cpu вместо видеокарты

Хорошо бы если б оно помимо помощи в кодинге умело бы генерировать картинки и реалистичные видео.

И фару ему на лоб, фару

В идеале безплатный

Ты еще не представляешь, сколько ты потратишь на железо с ценами и ситуацией в мире. Навскидку - около миллиона

router ★★★★★
(03.05.26 11:01:33 MSK)

Ответ на: комментарий от teod0r 03.05.26 08:31:23 MSK

fullHD. например что-то типо 2 красивые сероглазые девушки лижутся 2 часа

Так и пиши в гугле :D. Еще добавь «бесплатно без смс»

router ★★★★★
(03.05.26 11:03:15 MSK)

Как вариант duck.ai, если нужно просто окошко чата, а не агент и прям сложные задачи решать не нужно.

anonymous_sama ★★★★★
(03.05.26 11:07:23 MSK)

Интересует не какя-то модель, а конечая реализация в виде какого-то конкретного сайта.

Для кодинга можно пользоваться не сайтом. Попробуй opencode-cli, например: https://github.com/anomalyco/opencode/blob/dev/README.ru.md.

dataman ★★★★★
(03.05.26 11:30:30 MSK)

Ответ на: комментарий от CrX 03.05.26 10:37:39 MSK

Показ юзеру всей этой генерации в процессе лучше, чем делать это скрыто, а потом выдавать целиком.

там нет такого. там анимация для идиотов после вывода каждой буквы.

teod0r ★★★★★
(03.05.26 11:37:06 MSK) автор топика

Ответ на: комментарий от firkax 03.05.26 10:45:00 MSK

Рекомендую проконсультироваться с психологом или психиатром по этому поводу.

т.е. если б я не для личного использованмя, то с психами консультироваться не надо было бы?

teod0r ★★★★★
(03.05.26 11:38:23 MSK) автор топика

Ответ на: комментарий от router 03.05.26 11:01:33 MSK

Ты еще не представляешь, сколько ты потратишь на железо с ценами и ситуацией в мире. Навскидку - около миллиона

какое железо? при чём тут сайт с чатботом?

teod0r ★★★★★
(03.05.26 11:42:32 MSK) автор топика

Ответ на: комментарий от teod0r 03.05.26 11:37:06 MSK

там нет такого.

Есть.

там анимация для идиотов после вывода каждой буквы.

Анимация сделана для плавности. Она тебе даёт меньше, чем полсекунды задержки (отставания от последнего сгенерированного токена), а экономия при этом десятки секунд.

Ну и хз, где «там». Локальные модели выплёвывают именно по токену за раз, а не по одной букве.

Наверное, эту анимацию можно отключить, но лучше от этого не станет, только хуже — более дёргано, и всё.

CrX ★★★★★
(03.05.26 12:09:59 MSK)

Ответ на: комментарий от teod0r 03.05.26 11:38:23 MSK

Верно.

Если бы ты хотел открыть сайт сгенерированного порно - это означало бы, что ты просто аморальный коммерсант, желающий заработать на показе рекламы нуждающимся во врачебной помощи, а так же количество этих нуждающихся увеличить. Аморальность исправляется (если получится) воспитателями, а не врачами.

firkax ★★★★★
(03.05.26 12:19:46 MSK)

Ответ на: комментарий от CrX 03.05.26 12:09:59 MSK

Локальные модели выплёвывают именно по токену за раз, а не по одной букве.

Я когда-то читал, что при работе с русским языком токены идут как раз обычно по одной букве, с английским - примерно по слогам. Хотя это было год-два назад, может быть сейчас уже длиннее. Сам не проверял разумеется ни тогда ни сейчас.

firkax ★★★★★
(03.05.26 12:22:48 MSK)

Ответ на: комментарий от firkax 03.05.26 12:22:48 MSK

Врядли сейчас есть модели с побуквенной токенизацией. Ты стоимость представляешь? И по слогам нет смысла. Особенно английский. Как ты в английском собрался по слогам разбивать? «lear-ning»? «learn-ing»?

Погугли BPE.

LightDiver ★★★★★
(03.05.26 12:57:50 MSK)

Ответ на: комментарий от LightDiver 03.05.26 12:57:50 MSK

Какую стоимость?

Как ты в английском собрался по слогам разбивать? «lear-ning»? «learn-ing»?

Прямо таки критическая проблема.

firkax ★★★★★
(03.05.26 13:00:10 MSK)
Последнее исправление: firkax 03.05.26 13:02:49 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 03.05.26 13:00:10 MSK

Побуквенная токенизация увеличивает тексты во много раз. И стоимость - стоимость вычислений. Количество простейших операций. Представь, рост квадратичный.

Если у вас 2 токена (например, [«я», «сплю»]), связей между ними будет 4 (2*2).

Квадратичный рост: Если токенов становится 4 ([«я», «очень», «хочу», «спать»]), связей уже 16 (4*4).

     я   _   с   п   л   ю
я  [ x,  x,  x,  x,  x,  x ]
_  [ x,  x,  x,  x,  x,  x ]
с  [ x,  x,  x,  x,  x,  x ]
п  [ x,  x,  x,  x,  x,  x ]
л  [ x,  x,  x,  x,  x,  x ]
ю  [ x,  x,  x,  x,  x,  x ]

Матрица 6×6. 6² = 36

Видишь проблему?

Тут еще весь вопрос - чья модель и как на чем обучалась. А это большая разница.

LightDiver ★★★★★
(03.05.26 13:06:16 MSK)
Последнее исправление: LightDiver 03.05.26 13:09:09 MSK (всего исправлений: 1)

Рекомендую начать с чего-то типа Russian AI.

ya-betmen ★★★★★
(03.05.26 13:13:37 MSK)

Ответ на: комментарий от LightDiver 03.05.26 13:06:16 MSK

Эта двумерная матрица взята из какой-то реальной теории работы llm, или ты её от балды придумал? Я сомневаюсь что подобные структуры там имеются.

А с токенами дело совсем в другом и всё получается наоборот. Если у тебя всего 50 вариантов токенов (буквы+цифры+несколько знаков, допустим), то корреляции придётся вычислять и хранить между этими 50 вариантами. Если уже у тебя токен - слово, которых сотни тысяч и больше, то придётся тебе хранить корреляции между сотнями тысяч слов. Даже составить таблицу попарных корреляций между словами - получается больше чем 100000 в квадрате, то есть больше 10 миллиардов параметров. А для работы llm такой таблицы явно не хватит (с ней то максимум цепи Маркова сможешь генерить), но при этом модели с меньшим числом параметров вполне существуют. Так если токен где-то и может быть словом, то только в совсем гигантских моделях, и то вычислительная выгода от этого сомнительна.

А ещё учти, что они умеют придумывать новые слова, и если ты заранее составишь список известных токенизированных слов - такое было бы невозможно.

firkax ★★★★★
(03.05.26 13:19:24 MSK)
Последнее исправление: firkax 03.05.26 13:22:05 MSK (всего исправлений: 2)

Ответ на: комментарий от teod0r 03.05.26 10:32:00 MSK

Вы полагаете, LLM просто так без причины иногда называют в шутку продвинутым T9? Впрочем, насколько мне известно, размер токена обычно больше одной буквы и может составлять слово. Но это уже детали реализации.

Leupold_cat ★★★★★
(03.05.26 13:46:28 MSK)
Последнее исправление: Leupold_cat 03.05.26 13:50:02 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 03.05.26 12:22:48 MSK

Ну могу лишь сказать, что сегодня это точно не так. Я и насчёт двух лет назад сомневаюсь на самом деле, но фиг его знает. Можно ещё допустить, что читал ты два года назад, но на момент написания оно уже было неактуально.

CrX ★★★★★
(03.05.26 14:23:59 MSK)

Ответ на: комментарий от CrX 03.05.26 14:23:59 MSK

Ну, послоговые токены в русском языке можно понять, но токенизацию именно по словам - затруднительно, причины я выше описал. А как ты определяешь это? Алгоритмы изучаешь или исходя из внешних признаков?

firkax ★★★★★
(03.05.26 14:33:38 MSK)

Ответ на: комментарий от teod0r 03.05.26 08:55:38 MSK

ты привёл ссылки на официальных владельцев моделек.

Нет, он привел ссылки на готовые продукты

goingUp ★★★★★
(03.05.26 15:19:29 MSK)

Ответ на: комментарий от firkax 03.05.26 14:33:38 MSK

Ну, послоговые токены в русском языке можно понять, но токенизацию именно по словам - затруднительно, причины я выше описал.

Она не прямо по словам, где как получается, где-то пара слогов, где-то целое слово.

А как ты определяешь это? Алгоритмы изучаешь или исходя из внешних признаков?

ollama позволяет выплёвывать по одному токену за раз, в json, тестом, и т.д., чтобы обрабатывать дальше (например вот если ты как в сабже пишешь веб-чатик, который обращается к бэкэнду и выводит юзеру плавно).

Промпт на токены можно разделить так:

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("используемая_модель")
prompt = "Напиши краткое эссе о важности локальных LLM." 
tokens = tokenizer.encode(prompt_text)  # Дальше хоть len(tokens), хоть итерируй по ним и т.д.

CrX ★★★★★
(03.05.26 15:31:09 MSK)

arena.ai посмотри что тебе лучше подходит

pinachet ★★★★★
(03.05.26 15:45:53 MSK)

Ответ на: комментарий от teod0r 03.05.26 08:53:30 MSK

ты думаешь ответ нейронка по 1 буковке составляет с задержками между ними?

Да, так и есть. Не веришь мне запусти нейронку сам, без видеокарты даже можно запустить, как раз увидишь этот эффект.

einhander ★★★★★
(03.05.26 15:53:54 MSK)

Ответ на: комментарий от teod0r 03.05.26 10:34:19 MSK

дешевывые модели 1-2 рубля, последние GPT-Pro Могут брать несколько тысяч за сложные задачи.

https://gist.github.com/hakavlad/fc177e5a223256698bdcd7e6552b2357 это 5к стоило (не стоило того. Лучше брать GPT 5.4, за сотку делает то же примерно)

Gemini 3.1 Pro по несколько десятков руб за ответ

hakavlad ★★★
(03.05.26 16:14:25 MSK)

Это для идиотов?

Судя потому, что ты пишешь и как…

mamina_radost ★
(03.05.26 16:49:09 MSK)

Похожие темы