LINUX.ORG.RU

Посоветуйте ai chat bot

 , ,


1

2

Кто какими ai chat-bot сайтами пользуется?
Те что видел - с задержкой появления каждой буквы в ответе. Это для идиотов?

Хорошо бы если б оно помимо помощи в кодинге умело бы генерировать картинки и реалистичные видео.
В идеале безплатный.

Интересует не какя-то модель, а конечая реализация в виде какого-то конкретного сайта.

Перемещено CrX из science

Перемещено hobbit из talks

★★★★★

Последнее исправление: teod0r (всего исправлений: 1)

В идеале безплатный

Квен

Хорошо бы если б оно помимо помощи в кодинге умело бы генерировать картинки и реалистичные видео.

Квен

Те что видел - с задержкой появления каждой буквы в ответе.

Локальные модели, так же генерируют ответ. Это особенность всех ллм.

Это для идиотов?

Да.

einhander ★★★★★
()

реалистичные видео

fullHD. например что-то типо 2 красивые сероглазые девушки лижутся 2 часа. сейчас же много порно на порносайтах делается с помощью ПО. какого?

teod0r ★★★★★
() автор топика
Ответ на: комментарий от einhander

Локальные модели, так же генерируют ответ.

ЯННП

Это особенность всех ллм.

неправда. видел ботов без задержки перед буквами.

teod0r ★★★★★
() автор топика

Это визуально сокращает время отклика. Иногда ответ длинный, по мере его появления ты читаешь и сокращаешь время, так быстрее. Это с человеком ты не можешь видеть текст по мере набора, но это не значит что так быстрее. Смотришь, читаешь по мере появления ответа и понимаешь, не туда пошли, остановить бесполезную работу и опять не тратишь время и гигаватты. Но люди, которые этим пользуются скорее всего идиоты, да, они же могли бы важно надув щёки сидеть и с соседом делиться «равда все вокруг тупые?» - «да, вообще тупые, а я даже не улыбаюсь никогда, потому что я умный».

PcheloBiaka
()
Ответ на: комментарий от PcheloBiaka

так быстрее

нет.

по мере его появления ты читаешь

нет.

остановить бесполезную работу и опять не тратишь время и гигаватты.

lol

teod0r ★★★★★
() автор топика

Я пользуюсь Gemini.

С Chatgpt давно ушел, т.к. одно время он начал требовать с меня фото паспорта (что дальше? Фото с флажком в жопе, чтобы заслужить честь пользоваться вашим говночатом?). Ну и бесило то, что чем больше пишешь, тем больше он начинает тормозить.

Китайские мне не понравились еще со времен «the service is busy».

Чатик от Машка тоже не зашел.

MoldAndLimeHoney ★★★
()
Последнее исправление: MoldAndLimeHoney (всего исправлений: 1)
Ответ на: комментарий от teod0r

неправда. видел ботов без задержки перед буквами.

Пользуйся ими. Данные от ллм будут накапливаться в буффер,показать их сразу или когда буфер будет заполнен задача фронта. Большинство решили, что показывать данные сразу удобнее.

einhander ★★★★★
()
Ответ на: комментарий от teod0r

а конечая реализация в виде какого-то конкретного сайта.

Ну.. я про это и написал или я не понял вообще о чем-то.

https://gemini.google.com
chatgpt.com

и т.д.

MoldAndLimeHoney ★★★
()
Последнее исправление: MoldAndLimeHoney (всего исправлений: 1)
Ответ на: комментарий от einhander

Большинство решили, что показывать данные сразу удобнее.

а если подумать? ты думаешь ответ нейронка по 1 буковке составляет с задержками между ними?

teod0r ★★★★★
() автор топика
Ответ на: комментарий от MoldAndLimeHoney

или я не понял вообще о чем-то.

ты привёл ссылки на официальных владельцев моделек. на этих моделях есть куча реализаций и сайтов на них.

teod0r ★★★★★
() автор топика
Последнее исправление: teod0r (всего исправлений: 1)
Ответ на: комментарий от teod0r

Я в самом начале своих экспериментов делал так, чтобы текст появлялся целиком. И очень быстро отошёл от этого. Это реально быстрее и удобнее. Особенно на локальных моделях. В конце концов, читаешь ты тоже последовательно.

Напиши хоть один плюс того, чтобы ждать ответа целиком.

PcheloBiaka
()
Ответ на: комментарий от teod0r

ты вообще понимаешь как оно работает? Ёлки… Запусти модель хоть на pytorch локально и понаблюдай как генерируется ответ непосредственно, без чатов, через твой неповторимый код.

Кстати, с удовольствием посмотрел бы на текст, который генерируется как картинка - из шума в осмысленный текст целиком. Правда, у картинки есть заранее заданные границы и формат. Но всё равно интересно

PcheloBiaka
()
Последнее исправление: PcheloBiaka (всего исправлений: 1)
Ответ на: комментарий от teod0r

Она не просто «составляет по 1 букве», но на генерацию каждой буквы (или слога) там перелопачиваются гигабайты оперативной памяти. Генерация работает по принципу «определить наиболее вероятную следующую букву/слог в уже имеющемся начале текста», то есть это автодополнение, но учитывающее не только последнее слово, а весь предыдущий текст и имеющее огромную базу статистик внутри своей реализации. Если бы оно пыталось угадывать хотя бы целое следующее слово - всё было бы намного сложнее, разных слов очень много. Угадать букву/слог - вычислительно намного проще.

Это для идиотов?

Да. Очевидно, только идиоты могут чатиться с движком автодополнения.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 2)
Ответ на: комментарий от firkax

Она не просто «составляет по 1 букве», но на генерацию каждой буквы (или слога) там перелопачиваются гигабайты оперативной памяти. Генерация работает по принципу «определить наиболее вероятную следующую букву/слог в уже имеющемся начале текста», то есть это автодополнение, но учитывающее не только последнее слово, а весь предыдущий текст и имеющее огромную базу статистик внутри своей реализации.

не верю. какой в этом смысл? зачем вычислять следущую букву, если нужно просто выдать ЦЕЛУЮ ФРАЗУ из бд энциклопедий.

teod0r ★★★★★
() автор топика
Ответ на: комментарий от teod0r

не верю. какой в этом смысл? зачем вычислять следущую букву, если нужно просто выдать ЦЕЛУЮ ФРАЗУ из бд энциклопедий.

У них нет никакой БД энциклопедий. Есть сеть из токенов и связей между ними. Суть LLM как раз в том, чтобы угадывать, какой токен с большей вероятностью идёт после совокупности предыдущих. Про буквы, конечно, неправильно — подавляющее большинство токенов больше, чем одна буква, обычно это простое слово, иногда часть сложного слова, реже несколько коротких связных слов часто встречающихся.

Показ юзеру всей этой генерации в процессе лучше, чем делать это скрыто, а потом выдавать целиком. Экономит очень много времени, причём несколькими способами: во-первых, можно читать в процессе генерации, и если это длинная портянка, ты половину уже прочитаешь, пока она закончит; во-вторых юзеру может быть достаточно первых одного-двух абзацев из 10+, например, и он может отменить дальнейшую генерацию и не тратить почём зря время и токены, по разным причинам, хоть потому что нужная инфа уже дана, хоть потому что оно отвечает явно не то, и надо переформулировать промпт.

Скрывать этот процесс, а потом вываливать простыню — бессмысленно, тупо трата времени. Но запуская локальную LLM так сделать тоже можно. Даже из коробки есть такая опция.

CrX ★★★★★
()

Те что видел - с задержкой появления каждой буквы в ответе. Это для идиотов?

Это для тех, кто не видит проблемы с нехваткой ресурсов. Или вообще запускает на cpu вместо видеокарты

Хорошо бы если б оно помимо помощи в кодинге умело бы генерировать картинки и реалистичные видео.

И фару ему на лоб, фару

В идеале безплатный

Ты еще не представляешь, сколько ты потратишь на железо с ценами и ситуацией в мире. Навскидку - около миллиона

router ★★★★★
()
Ответ на: комментарий от teod0r

fullHD. например что-то типо 2 красивые сероглазые девушки лижутся 2 часа

Так и пиши в гугле :D. Еще добавь «бесплатно без смс»

router ★★★★★
()

Как вариант duck.ai, если нужно просто окошко чата, а не агент и прям сложные задачи решать не нужно.

anonymous_sama ★★★★★
()
Ответ на: комментарий от CrX

Показ юзеру всей этой генерации в процессе лучше, чем делать это скрыто, а потом выдавать целиком.

там нет такого. там анимация для идиотов после вывода каждой буквы.

teod0r ★★★★★
() автор топика
Ответ на: комментарий от firkax

Рекомендую проконсультироваться с психологом или психиатром по этому поводу.

т.е. если б я не для личного использованмя, то с психами консультироваться не надо было бы?

teod0r ★★★★★
() автор топика
Ответ на: комментарий от router

Ты еще не представляешь, сколько ты потратишь на железо с ценами и ситуацией в мире. Навскидку - около миллиона

какое железо? при чём тут сайт с чатботом?

teod0r ★★★★★
() автор топика
Ответ на: комментарий от teod0r

там нет такого.

Есть.

там анимация для идиотов после вывода каждой буквы.

Анимация сделана для плавности. Она тебе даёт меньше, чем полсекунды задержки (отставания от последнего сгенерированного токена), а экономия при этом десятки секунд.

Ну и хз, где «там». Локальные модели выплёвывают именно по токену за раз, а не по одной букве.

Наверное, эту анимацию можно отключить, но лучше от этого не станет, только хуже — более дёргано, и всё.

CrX ★★★★★
()
Ответ на: комментарий от teod0r

Верно.

Если бы ты хотел открыть сайт сгенерированного порно - это означало бы, что ты просто аморальный коммерсант, желающий заработать на показе рекламы нуждающимся во врачебной помощи, а так же количество этих нуждающихся увеличить. Аморальность исправляется (если получится) воспитателями, а не врачами.

firkax ★★★★★
()
Ответ на: комментарий от CrX

Локальные модели выплёвывают именно по токену за раз, а не по одной букве.

Я когда-то читал, что при работе с русским языком токены идут как раз обычно по одной букве, с английским - примерно по слогам. Хотя это было год-два назад, может быть сейчас уже длиннее. Сам не проверял разумеется ни тогда ни сейчас.

firkax ★★★★★
()
Ответ на: комментарий от firkax

Врядли сейчас есть модели с побуквенной токенизацией. Ты стоимость представляешь? И по слогам нет смысла. Особенно английский. Как ты в английском собрался по слогам разбивать? «lear-ning»? «learn-ing»?

Погугли BPE.

LightDiver ★★★★★
()
Ответ на: комментарий от LightDiver

Какую стоимость?

Как ты в английском собрался по слогам разбивать? «lear-ning»? «learn-ing»?

Прямо таки критическая проблема.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от firkax

Побуквенная токенизация увеличивает тексты во много раз. И стоимость - стоимость вычислений. Количество простейших операций. Представь, рост квадратичный.

Если у вас 2 токена (например, [«я», «сплю»]), связей между ними будет 4 (2*2).

Квадратичный рост: Если токенов становится 4 ([«я», «очень», «хочу», «спать»]), связей уже 16 (4*4).

     я   _   с   п   л   ю
я  [ x,  x,  x,  x,  x,  x ]
_  [ x,  x,  x,  x,  x,  x ]
с  [ x,  x,  x,  x,  x,  x ]
п  [ x,  x,  x,  x,  x,  x ]
л  [ x,  x,  x,  x,  x,  x ]
ю  [ x,  x,  x,  x,  x,  x ]

Матрица 6×6. 6² = 36

Видишь проблему?

Тут еще весь вопрос - чья модель и как на чем обучалась. А это большая разница.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от LightDiver

Эта двумерная матрица взята из какой-то реальной теории работы llm, или ты её от балды придумал? Я сомневаюсь что подобные структуры там имеются.

А с токенами дело совсем в другом и всё получается наоборот. Если у тебя всего 50 вариантов токенов (буквы+цифры+несколько знаков, допустим), то корреляции придётся вычислять и хранить между этими 50 вариантами. Если уже у тебя токен - слово, которых сотни тысяч и больше, то придётся тебе хранить корреляции между сотнями тысяч слов. Даже составить таблицу попарных корреляций между словами - получается больше чем 100000 в квадрате, то есть больше 10 миллиардов параметров. А для работы llm такой таблицы явно не хватит (с ней то максимум цепи Маркова сможешь генерить), но при этом модели с меньшим числом параметров вполне существуют. Так если токен где-то и может быть словом, то только в совсем гигантских моделях, и то вычислительная выгода от этого сомнительна.

А ещё учти, что они умеют придумывать новые слова, и если ты заранее составишь список известных токенизированных слов - такое было бы невозможно.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 2)
Ответ на: комментарий от teod0r

Вы полагаете, LLM просто так без причины иногда называют в шутку продвинутым T9? Впрочем, насколько мне известно, размер токена обычно больше одной буквы и может составлять слово. Но это уже детали реализации.

Leupold_cat ★★★★★
()
Последнее исправление: Leupold_cat (всего исправлений: 1)
Ответ на: комментарий от firkax

Ну могу лишь сказать, что сегодня это точно не так. Я и насчёт двух лет назад сомневаюсь на самом деле, но фиг его знает. Можно ещё допустить, что читал ты два года назад, но на момент написания оно уже было неактуально.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Ну, послоговые токены в русском языке можно понять, но токенизацию именно по словам - затруднительно, причины я выше описал. А как ты определяешь это? Алгоритмы изучаешь или исходя из внешних признаков?

firkax ★★★★★
()
Ответ на: комментарий от teod0r

ты привёл ссылки на официальных владельцев моделек.

Нет, он привел ссылки на готовые продукты

goingUp ★★★★★
()
Ответ на: комментарий от firkax

Ну, послоговые токены в русском языке можно понять, но токенизацию именно по словам - затруднительно, причины я выше описал.

Она не прямо по словам, где как получается, где-то пара слогов, где-то целое слово.

А как ты определяешь это? Алгоритмы изучаешь или исходя из внешних признаков?

ollama позволяет выплёвывать по одному токену за раз, в json, тестом, и т.д., чтобы обрабатывать дальше (например вот если ты как в сабже пишешь веб-чатик, который обращается к бэкэнду и выводит юзеру плавно).

Промпт на токены можно разделить так:

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("используемая_модель")
prompt = "Напиши краткое эссе о важности локальных LLM." 
tokens = tokenizer.encode(prompt_text)  # Дальше хоть len(tokens), хоть итерируй по ним и т.д.
CrX ★★★★★
()
Ответ на: комментарий от teod0r

ты думаешь ответ нейронка по 1 буковке составляет с задержками между ними?

Да, так и есть. Не веришь мне запусти нейронку сам, без видеокарты даже можно запустить, как раз увидишь этот эффект.

einhander ★★★★★
()
Ответ на: комментарий от teod0r

дешевывые модели 1-2 рубля, последние GPT-Pro Могут брать несколько тысяч за сложные задачи.

https://gist.github.com/hakavlad/fc177e5a223256698bdcd7e6552b2357 это 5к стоило (не стоило того. Лучше брать GPT 5.4, за сотку делает то же примерно)

Gemini 3.1 Pro по несколько десятков руб за ответ

hakavlad ★★★
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария