LINUX.ORG.RU

А нейросеточка способна нарисовать картинку, где всё будет чётенько?

 , ,


0

1

Картинки от ИИ в стиле «фотореализм» совершенно естественно имеют размытый задний план. Ибо, таков массив обучающих изображений. Но, с другой стороны, можно же фотографировать объекты так, что в фокусе будет всё, техника позволяет. Если не пейзажи, там в силу наличия атмосферы, чем дальше, тем размытее. Но и там красный светофильтр рулит.

Так вот, даже если попросить ИИ-шечку нарисовать что-либо так, чтобы детали заднего фона были в резкости, она не могёт. Хотя, казалось бы, ну нарисуй ты детали фона в большом размере, чётенько, отмасштабируй в меньшую сторону, расположи правильно с учётом z-буфера, отсеки невидимые гранину ты понел… А не могёт!

★★★★★

Последнее исправление: tiinn (всего исправлений: 1)

А не могёт!

Может ты в правильный prompt не могешь? Напиши «фото с глубиной резкости от нуля до бесконечности»

Byers
()

можно же фотографировать объекты так, что в фокусе будет всё

Ну не прям всё, есть ограничения из-за дифракции и иных законов физики, можешь палец к глазу (второй закрой) поднести и посмотреть на луну. Палец размоется. Это только в компьютерных игрушках картинка и вдаль и рука под носом всё в фокусе. Но да, можно большую зону фокуса делать.

peregrine ★★★★★
()

Не угадал автора по заголовку.

А по сути – меня больше расстраивает, что нейросеть, генерирующая картины, обычно совсем не умеет в текст. Если на картине встречается номер автомобиля или модель тепловоза – обычно в кадр попадают кракозябры неизвестного землянам алфавита.

hobbit ★★★★★
()

Теоретически, сферическая в вакууме нейронка может. А вот те которые есть – те да, будет зависеть от того на чём и как они обучены.

даже если попросить ИИ-шечку нарисовать что-либо так, чтобы детали заднего фона были в резкости, она не могёт

Во многих сервисах ты можешь ставить оценку результату, так что если считаешь что нейронка тебя не поняла, то ставь палец вниз, может твой кейс учтут вдальнейшем.

Bad_ptr ★★★★★
()
Ответ на: комментарий от hobbit

Последние модели прекрасно умеют.

https://www.reddit.com/r/singularity/comments/1p2qrtk/impressed_by_nano_banana_pro_edits_text_accuracy/

вот пример. Всё сгенерировано. Правда в самом тексте опечатки, но может это в промпте так было написано, сам текст правильный. Вроде с иероглифами ещё не всё гладко.

vbr ★★★★★
()
Последнее исправление: vbr (всего исправлений: 2)

Обмани её, проси скриншот, а не фото

legolegs ★★★★★
()

Для псевдофотографий пользуюсь ai arena, можно попытаться идеал модели под себя найти долбясь со сравнением вариантов https://arena.ai/image/direct

One ★★★★★
()
Ответ на: комментарий от hobbit

Последние пару месяцев прям прорыв с текстами на русском языке, на голову сейчас лучше стала генерация изображений с текстом

One ★★★★★
()
Последнее исправление: One (всего исправлений: 1)
Ответ на: комментарий от hobbit

А по сути – меня больше расстраивает, что нейросеть, генерирующая картины, обычно совсем не умеет в текст. Если на картине встречается номер автомобиля или модель тепловоза – обычно в кадр попадают кракозябры неизвестного землянам алфавита.

Год назад было так, сейчас с текстом уже обычно нет проблем, даже у ChatGPT. Изредка может быть какая-то «опечатка» типа магкого знака вместо твёрдого или И вместо Н, но в большинстве случаев всё с текстом пристойно, а прям инопланетных крякозябр я уже давно не видел.

P.S. Ну как давно… Как я и говорил, где-то год–два назад обычным делом были.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Да не, все старые генераторы - модель Flux или яндексовский Шедеврум, - продолжают генерировать кракозяблы.

tiinn ★★★★★
() автор топика
Ответ на: комментарий от tiinn

Да, похоже на то. Но многие более новые научились делать нормально.

CrX ★★★★★
()
Ответ на: комментарий от tiinn

Я на тему рисования общался с Кандинским от Сбера. Про иероглифы уже написал, с колёсами тоже беда – то, что он рисовал, тронуться с места никак не могло, особенно рельсовый транспорт. Но он тоже развивается, поэтому надо будет попробовать ещё раз.

Ещё я попросил его нарисовать парня с девушкой на берегу озера рядом с автомобилем «Нива». Получилось почти нормально, но перед Нивы выныривает прямо из-за спин парочки, а зада нет вообще. Прямо вспоминается машинка из «Назад в будущее», так что я постановил считать это не багом, а фичей, а картину провести по жанру фантастики.

hobbit ★★★★★
()
Ответ на: комментарий от tiinn

Жаль.

Ладно, я так понял, что сейчас с Алисой тоже можно общаться прямо в браузере без сильных приседаний. Попробую её.

hobbit ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.