LINUX.ORG.RU

Релиз digiKam 8.7.0 с мощными AI-инструментами

 , , , , менеджер фотографий


1

2

Привет! Любишь фотографировать? Тогда менеджер фотографий digiKam — это именно то, что тебе надо. В новой версии digiKam 8.7.0 появилось несколько полезных функций, которые пригодятся как профессионалам, так и обычным пользователям. Никогда не поздно навести порядок в своей коллекции! :)

Одно из главных новшеств digiKam 8.7.0 — новый AI-плагин для поворота изображений. Также с прошлой версии (digiKam 8.6.0) была значительно доработана функция распознавания лиц. В последнее время функция распознавания лиц стала золотым стандартом во всех более менее серьезных программах и сервисах для работы с изображениями, и разработчики digiKam здесь тоже не отстают.

Основные изменения:

  • Улучшение распознавания лиц с помощью AI:
    • Теперь можно настроить сканирование распознавания лиц в режиме автостарта нового распознавания лиц, когда новые лица подтверждаются или помечены тегом. Включается в меню: Settings > Miscellaneous > Behaviour > Background.
    • Сопоставление лиц с помощью AI не идеально, и совпадения лиц не всегда точны. Чтобы справиться с этой проблемой и повысить точность, digiKam теперь сохраняет отклоненные совпадения лиц (для обучения) и предлагает следующее наилучшее совпадение (если оно есть).
    • Также разработчики доработали алгоритмы распознавания лиц и повысили производительность и точность.
  • Появился тест AI GPU:
    • В новом апдейте представлен тест AI GPU, который позволяет пользователям проверить доступность обработки GPU с помощью AI. Можно сделать это в меню: Settings > Miscellaneous > Behaviour > System.
    • Тест проверит, поддерживает ли ваша система использование аппаратного ускорения GPU при запуске AI-моделей, проверяя наличие необходимых библиотек и драйверов OpenCV и OpenCL.
    • Это знание полезно, т.к. digiKam может использовать GPU для ускорения некоторых функций, таких как анализ изображений и распознавание лиц.
  • Новый AI-плагин для поворота изображений:
    • С новым AI-плагином вертеть картинки стало проще и веселее! Плагин позволяет автоматизировать привычный подход и автоматически исправляет правильное положение фотографий при сканировании или пакетном импорте изображений.
    • Хотя в digiKam давно была опция автоматического поворота изображений, но она требует первоначального ручного ввода и предполагает, что все изображения в рабочем процессе одной ориентации нужно поворачивать одинаково.
    • Новая версия digiKam поставляется с новым плагином, который автоматически определяет ориентацию изображений через анализ содержимого с использованием движка глубокого обучения.
    • Как и с другими AI-инструментами, результаты могут быть непредсказуемыми, в зависимости от содержания картинок. Может оказаться, что вы тратите больше времени на исправление ошибок AI, чем если бы сделали корректировки сами.
  • Прочие изменения:
    • Исправлено 241 ошибок.
    • Библиотека Libraw обновлена до версии 2025-05-12.
    • Программа ExifTool обновлена до версии 13.29.
    • Плагин G'MIC-Qt обновлен до версии 3.5.0.
    • Qt Framework обновлен до версии 6.8.3 (Windows & Linux) и 6.9.0 (MacOS).

Где скачать:

Официальный пакет Snap

Официальный пакет Flatpak

Официальный пакет Appimage

Более подробный анонс

>>> Подробности

★★★

Проверено: hobbit ()
Последнее исправление: unfo (всего исправлений: 3)

AI

Они используют что-то на их стороне (и потенциально коллектят все изображения, в том числе для тренировки), или можно подключить свой бэкенд?

mord0d ★★★★★
()
Ответ на: комментарий от James_Holden

Это же не LLM

DALL·E тоже не LLM. (=

типа определить

Определение будет работать и на тостере, но из новости я понял так, что они именно для обработки поворота используют нейросети (Diffusers?).

Я совершенно не удивлюсь, если это будет так, сейчас нейросети пихают везде, даже особенно где не надо.

mord0d ★★★★★
()
Последнее исправление: mord0d (всего исправлений: 1)

Привет! Любишь фотографировать? Тогда менеджер фотографий digiKam — это именно то, что тебе надо

святый боже, что эта жесть делает на глагне?

С новым AI-плагином вертеть картинки стало проще и веселее!

кот бы сомневался!

Как и с другими AI-инструментами, результаты могут быть непредсказуемыми, в зависимости от содержания картинок. Может оказаться, что вы тратите больше времени на исправление ошибок AI, чем если бы сделали корректировки сами.

ну сами же все прекрасно понимают! но нет, надо везде напихать как можно больше АИ-говна! по-моему, это чел-овечество уже не спасти - слишком много дегенератов. остановите Землю, я сойду!

PerdunJamesBond
()
Ответ на: комментарий от PerdunJamesBond

В digiKam плагины с AI были ещё за годы до того, как на AI начали хайпиться, и эта тема стала популярной среди не профессионалов. Это была фишка этого проекта, делающая его круче, чем аналогичные проекты на GTK… В частности, распознавание лиц с добавлением тегов с именами людей там очень неплохо работало, на моей личной и семейной коллекции фото ещё 3-4 года назад эта фича выдавала верное имя человека на фото в 100 случаях из 100.

lucentcode ★★★★★
()
Последнее исправление: lucentcode (всего исправлений: 1)

Интересно в 13 дебиан прилетит?

nikitalol ★★
()

По сабжу: на офисных печатных машинках оно не нужное и тормознутое, лучше будет обычная лёгкая галерея

Но вот как только у вас крепкий стацонар или игровой ноутбук с ссд, оно тут же заявляет о себе как о крутом органайзере именно за счёт аи-фишек, неполохого редактора и возмости жрати и обрабатывать файлы с разрешением от 50мп

nikitalol ★★
()
Последнее исправление: nikitalol (всего исправлений: 1)
Ответ на: комментарий от dataman

https://files.kde.org/digikam/

Спасибо большое.

Как минимум, они есть в aitools, autotags и facesengine.

ONNX.

Если они для этого используют GGML и написали всё на C++, то будет даже быстро. А вот если взяли готовую обвязку на Python, то работать будет не везде.

mord0d ★★★★★
()
Ответ на: комментарий от dataman

В GGML же свой GGUF.

В llama.cpp (который передан под покровительство GGML какое-то время назад) есть конвертер в GGUF. Правда, он тоже требует целую кучу питонопакетов.

В общем, нужно исходники Digikam смотреть. :)

Оно на плюсах, с тем же успехом я могу почитать документацию на китайском. (%

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

А потом вы все спрашиваете, зачем нужно знать плюсы. Лол. Ну вот, затем что весь софт на них и на сишке. Чтобы что-то почитать.

James_Holden ★★★★★
()
Ответ на: комментарий от mord0d

есть конвертер в GGUF.

Есть, но тогда зачем скачивать сотни мегабайт файлов .onnx и конвертировать их в .gguf на стороне пользователя?

с тем же успехом я могу почитать документацию на китайском

Попозже вчитаюсь в исходники. :)

dataman ★★★★★
()
Ответ на: комментарий от dataman

Глянул faceengine, там используется OpenCV, eigenface и LBPH алгоритм, вроде никакой тяжелой нейромагии.

А, вот там еще OpenCV DNN используется. Все на плюсах.

James_Holden ★★★★★
()
Последнее исправление: James_Holden (всего исправлений: 2)
Ответ на: комментарий от dataman

зачем скачивать сотни мегабайт файлов .onnx и конвертировать их в .gguf на стороне пользователя?

Некоторые запрещают изменение, но при этом не запрещают распространение. 🤷‍♂️

mord0d ★★★★★
()

менеджер фотографий

Интересно, а зачем менеджеру фотографий в зависимостях такие вещи, как upower, udisks2, polkit? Кеды в своём репертуаре.

u5er ★★
()

Такой текст - и без эмодзи. Требую немедленно исправить.

thesis ★★★★★
()
Ответ на: комментарий от mord0d

А учитывая что это кедософт, там не просто плюсы, там ещё и boost.

Напраслина, Boost в проектах KDE редко используется. Обычно хватает Qt и своих библиотек.
В digiKam из Boost только boost/uuid и boost/graph. Ну и boost/thread/shared_mutex в сторонней xmp_sdk.

dataman ★★★★★
()
Ответ на: комментарий от dataman

А учитывая что это кедософт, там не просто плюсы, там ещё и boost.

Напраслина, Boost в проектах KDE редко используется. Обычно хватает Qt и своих библиотек. В digiKam из Boost только boost/uuid и boost/graph. Ну и boost/thread/shared_mutex в сторонней xmp_sdk.

ещё и boost

Напраслина

boost

boost

boost

(%

Кедософт использует boost. Понемножку, но всё же.

mord0d ★★★★★
()

У кого-нибудь работает аппаратное ускорение при использовании appimage?

unC0Rr ★★★★★
()
Ответ на: комментарий от dataman

предлагаю предложить

Зачем? Их всё устраивает, пусть будет как есть.

А я просто воздержусь от изучения исходного кода.

mord0d ★★★★★
()

Внимательно слежу за проектом, уже лет 10 пытаюсь на него переехать с Lightroom. Каждый раз почти-почти но... Но чую ещё лет пять и может получится.

п.с. пробовал ai-категаризацию тегов. Задумка хороша, реализация пока очень далека от получения хоть какой-то пользы, на сотню фото может десяток релевантных тегов выставит.

anonymoos ★★★★★
()
Последнее исправление: anonymoos (всего исправлений: 1)

Привет! Любишь фотографировать?

ai

ai gpu

AI-плагин

Всё ясно - реклама.

Goat ★★★
()

Улучшение распознавания лиц с помощью AI:

Это хорошее применение технологии. Надеюсь на этом и остановятся (вру, не надеюсь) и не станут посредством нейронок улучшать фотографии, превращая снимок в рисунок-фантазию на заданную тему.

ugoday ★★★★★
()

Зачем ИИ для поворота? Для масштабирования понятно, там есть проблемы, где ИИ может и поможет. А поворот при квадратных пикселях выполняется очень и очень просто, надёжно и даже без потерь (если формат без потерь брать).

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 1)
Ответ на: комментарий от peregrine

Чтобы автоматически определяло, в какую сторону вращать.

James_Holden ★★★★★
()

Молодцы, они одними из первых начали ИИ использовать. Хотя тогда он был малопригодным, просто показывал, что тут человек. И даже если это раскройка машинки бумажное не стеснялся :) И если ты ему скажешь, что это не человек, он при следующем сканировании опять выдавал то же самое. Сколько лет назад это было? Пятнадцать? Так и не приучился я фотки им коллекционировать.

R_He_Po6oT ★★★★★
()

Жалко, что пока для «недеструктивного» редактирования нельзя использовать sidecar-файлы, как в Darktable. А в целом же отличный проект, который, надеюсь, не превратится в совсем уж монстра.

pento ★★★★★
()

Кто-то новость-то саму читает или все сразу забивают на это бесполезное занятие и идут на сайт? Отвратительное нагромождение слов. Даже переводом это сложно назвать. Прочитать-то можно было вот это вот перед выкладыванием?

«Теперь можно настроить сканирование распознавания лиц в режиме автостарта нового распознавания лиц»

Как распознавание можно сканировать? Я уж про дальнейшую белиберду даже не спрашиваю.

Теперь можно настроить сканирование [фотографий] для распознавания лиц так, чтобы оно автоматически запускалось при подтверждении или пометке новых лиц.

«позволяет пользователям проверить доступность обработки GPU с помощью AI»

Хм. А зачем обрабатывать графический ускоритель с помощью AI?

…позволяет проверить, может ли ваша система использовать ускорение на GPU при запуске ИИ-моделей, проверяя наличие необходимых библиотек и драйверов для OpenGL и OpenCL.

«Плагин позволяет автоматизировать привычный подход»

Что за привычный подход? Ничего такого он себе не позволяет.

В DK добавлен новый плагин для поворота изображений, который использует ИИ, чтобы избавить от нудного поворота фотографий вручную. Это особенно полезно при сканировании старых снимков или пакетном импорте фотографий, у которых неправильно указана ориентация.

«она требует первоначального ручного ввода» да-да, именно этого функция и требует " в рабочем процессе одной ориентации", так сказать.

Хотя в диспетчере пакетной обработки digiKam уже давно есть функция автоповорота изображений при импорте, изначально она требует ручного вмешательства и работает исходя из предположения, что все изображения с одинаковой ориентацией в рамках одной операции нужно поворачивать одинаково.

Ну и последний абзац…

Как и с другими инструментами на базе ИИ, результаты могут быть разными — всё зависит от содержимого снимков. Возможно, вам придётся потратить больше времени на исправление его ошибок, чем у вас ушло бы на ручную корректировку.

jackill ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.