А нейросеточка способна нарисовать картинку, где всё будет чётенько?

картинки, неосилятор, фон

Картинки от ИИ в стиле «фотореализм» совершенно естественно имеют размытый задний план. Ибо, таков массив обучающих изображений. Но, с другой стороны, можно же фотографировать объекты так, что в фокусе будет всё, техника позволяет. Если не пейзажи, там в силу наличия атмосферы, чем дальше, тем размытее. Но и там красный светофильтр рулит.

Так вот, даже если попросить ИИ-шечку нарисовать что-либо так, чтобы детали заднего фона были в резкости, она не могёт. Хотя, казалось бы, ну нарисуй ты детали фона в большом размере, чётенько, отмасштабируй в меньшую сторону, расположи правильно с учётом z-буфера, ~~отсеки невидимые грани~~ну ты понел… А не могёт!

Ссылка

← Кратко про нейронные сети. Тестирование

Git for AI →

А не могёт!

Может ты в правильный prompt не могешь? Напиши «фото с глубиной резкости от нуля до бесконечности»

Byers
(07.06.26 20:36:45 MSK)

Ответ на: комментарий от Byers 07.06.26 20:36:45 MSK

Неа. Нана банана не справляется.

tiinn ★★★★★
(07.06.26 20:57:28 MSK) автор топика

можно же фотографировать объекты так, что в фокусе будет всё

Ну не прям всё, есть ограничения из-за дифракции и иных законов физики, можешь палец к глазу (второй закрой) поднести и посмотреть на луну. Палец размоется. Это только в компьютерных игрушках картинка и вдаль и рука под носом всё в фокусе. Но да, можно большую зону фокуса делать.

peregrine ★★★★★
(07.06.26 21:13:47 MSK)

Ссылка

Ответ на: комментарий от tiinn 07.06.26 20:57:28 MSK

ХЗ, другую модельку пробуй тогда.

peregrine ★★★★★
(07.06.26 21:15:08 MSK)

Ссылка

А не могёт!

Смогёт, ежели обучить на фото-гиперреализме © (fotosklad.ru).

quickquest ★★★★★
(07.06.26 22:06:13 MSK)

Ссылка

Не угадал автора по заголовку.

А по сути – меня больше расстраивает, что нейросеть, генерирующая картины, обычно совсем не умеет в текст. Если на картине встречается номер автомобиля или модель тепловоза – обычно в кадр попадают кракозябры неизвестного землянам алфавита.

hobbit ★★★★★
(07.06.26 23:38:27 MSK)

Ответ на: комментарий от hobbit 07.06.26 23:38:27 MSK

Художник не умеющий читать, вот и всё.

peregrine ★★★★★
(07.06.26 23:48:44 MSK)

Ссылка

Теоретически, сферическая в вакууме нейронка может. А вот те которые есть – те да, будет зависеть от того на чём и как они обучены.

даже если попросить ИИ-шечку нарисовать что-либо так, чтобы детали заднего фона были в резкости, она не могёт

Во многих сервисах ты можешь ставить оценку результату, так что если считаешь что нейронка тебя не поняла, то ставь палец вниз, может твой кейс учтут вдальнейшем.

Bad_ptr ★★★★★
(07.06.26 23:54:44 MSK)

Ссылка

Ответ на: комментарий от hobbit 07.06.26 23:38:27 MSK

Последние модели прекрасно умеют.

https://www.reddit.com/r/singularity/comments/1p2qrtk/impressed_by_nano_banana_pro_edits_text_accuracy/

вот пример. Всё сгенерировано. Правда в самом тексте опечатки, но может это в промпте так было написано, сам текст правильный. Вроде с иероглифами ещё не всё гладко.

vbr ★★★★★
(08.06.26 00:01:44 MSK)
Последнее исправление: vbr 08.06.26 00:03:33 MSK (всего исправлений: 2)

Ссылка

Обмани её, проси скриншот, а не фото

legolegs ★★★★★
(08.06.26 00:05:27 MSK)

Ссылка

Для псевдофотографий пользуюсь ai arena, можно попытаться идеал модели под себя найти долбясь со сравнением вариантов https://arena.ai/image/direct

~~One~~ ★★★★★
(08.06.26 00:22:48 MSK)

Ссылка

Ответ на: комментарий от hobbit 07.06.26 23:38:27 MSK

Последние пару месяцев прям прорыв с текстами на русском языке, на голову сейчас лучше стала генерация изображений с текстом

~~One~~ ★★★★★
(08.06.26 00:23:59 MSK)
Последнее исправление: One 08.06.26 00:24:20 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от tiinn 07.06.26 20:57:28 MSK

А ~~Боромир~~DLSS 5 сможет

cobold ★★★★★
(08.06.26 00:27:24 MSK)

Ссылка

Ответ на: комментарий от hobbit 07.06.26 23:38:27 MSK

Гугловская нано банана, или последняя Алиса - могут в русский текст, и хорошо.

tiinn ★★★★★
(08.06.26 08:03:58 MSK) автор топика

Ответ на: комментарий от hobbit 07.06.26 23:38:27 MSK

А по сути – меня больше расстраивает, что нейросеть, генерирующая картины, обычно совсем не умеет в текст. Если на картине встречается номер автомобиля или модель тепловоза – обычно в кадр попадают кракозябры неизвестного землянам алфавита.

Год назад было так, сейчас с текстом уже обычно нет проблем, даже у ChatGPT. Изредка может быть какая-то «опечатка» типа магкого знака вместо твёрдого или И вместо Н, но в большинстве случаев всё с текстом пристойно, а прям инопланетных крякозябр я уже давно не видел.

P.S. Ну как давно… Как я и говорил, где-то год–два назад обычным делом были.

CrX ★★★★★
(08.06.26 08:05:37 MSK)

Ответ на: комментарий от CrX 08.06.26 08:05:37 MSK

Да не, все старые генераторы - модель Flux или яндексовский Шедеврум, - продолжают генерировать кракозяблы.

tiinn ★★★★★
(08.06.26 08:08:11 MSK) автор топика

Ответ на: комментарий от tiinn 08.06.26 08:08:11 MSK

Да, похоже на то. Но многие более новые научились делать нормально.

CrX ★★★★★
(08.06.26 08:40:18 MSK)

Ссылка

Ответ на: комментарий от tiinn 08.06.26 08:03:58 MSK

Я на тему рисования общался с Кандинским от Сбера. Про иероглифы уже написал, с колёсами тоже беда – то, что он рисовал, тронуться с места никак не могло, особенно рельсовый транспорт. Но он тоже развивается, поэтому надо будет попробовать ещё раз.

Ещё я попросил его нарисовать парня с девушкой на берегу озера рядом с автомобилем «Нива». Получилось почти нормально, но перед Нивы выныривает прямо из-за спин парочки, а зада нет вообще. Прямо вспоминается машинка из «Назад в будущее», так что я постановил считать это не багом, а фичей, а картину провести по жанру фантастики.

hobbit ★★★★★
(08.06.26 10:15:01 MSK)