Релиз digiKam 8.7.0 с мощными AI-инструментами

digikam, face recognition, kde, искусственный интеллект, менеджер фотографий

1

2

Привет! Любишь фотографировать? Тогда менеджер фотографий digiKam — это именно то, что тебе надо. В новой версии digiKam 8.7.0 появилось несколько полезных функций, которые пригодятся как профессионалам, так и обычным пользователям. Никогда не поздно навести порядок в своей коллекции! :)

Одно из главных новшеств digiKam 8.7.0 — новый AI-плагин для поворота изображений. Также с прошлой версии (digiKam 8.6.0) была значительно доработана функция распознавания лиц. В последнее время функция распознавания лиц стала золотым стандартом во всех более менее серьезных программах и сервисах для работы с изображениями, и разработчики digiKam здесь тоже не отстают.

Основные изменения:

Улучшение распознавания лиц с помощью AI:
- Теперь можно настроить сканирование распознавания лиц в режиме автостарта нового распознавания лиц, когда новые лица подтверждаются или помечены тегом. Включается в меню: Settings > Miscellaneous > Behaviour > Background.
- Сопоставление лиц с помощью AI не идеально, и совпадения лиц не всегда точны. Чтобы справиться с этой проблемой и повысить точность, digiKam теперь сохраняет отклоненные совпадения лиц (для обучения) и предлагает следующее наилучшее совпадение (если оно есть).
- Также разработчики доработали алгоритмы распознавания лиц и повысили производительность и точность.
Появился тест AI GPU:
- В новом апдейте представлен тест AI GPU, который позволяет пользователям проверить доступность обработки GPU с помощью AI. Можно сделать это в меню: Settings > Miscellaneous > Behaviour > System.
- Тест проверит, поддерживает ли ваша система использование аппаратного ускорения GPU при запуске AI-моделей, проверяя наличие необходимых библиотек и драйверов OpenCV и OpenCL.
- Это знание полезно, т.к. digiKam может использовать GPU для ускорения некоторых функций, таких как анализ изображений и распознавание лиц.
Новый AI-плагин для поворота изображений:
- С новым AI-плагином вертеть картинки стало проще и веселее! Плагин позволяет автоматизировать привычный подход и автоматически исправляет правильное положение фотографий при сканировании или пакетном импорте изображений.
- Хотя в digiKam давно была опция автоматического поворота изображений, но она требует первоначального ручного ввода и предполагает, что все изображения в рабочем процессе одной ориентации нужно поворачивать одинаково.
- Новая версия digiKam поставляется с новым плагином, который автоматически определяет ориентацию изображений через анализ содержимого с использованием движка глубокого обучения.
- Как и с другими AI-инструментами, результаты могут быть непредсказуемыми, в зависимости от содержания картинок. Может оказаться, что вы тратите больше времени на исправление ошибок AI, чем если бы сделали корректировки сами.
Прочие изменения:
- Исправлено 241 ошибок.
- Библиотека Libraw обновлена до версии 2025-05-12.
- Программа ExifTool обновлена до версии 13.29.
- Плагин G'MIC-Qt обновлен до версии 3.5.0.
- Qt Framework обновлен до версии 6.8.3 (Windows & Linux) и 6.9.0 (MacOS).

Где скачать:

Официальный пакет Snap

Официальный пакет Flatpak

Официальный пакет Appimage

Более подробный анонс

>>> Подробности

Ссылка

←	OpenMW 0.49.0

Agama 16 — новая программа установки openSUSE

→

Видел тред пустым

James_Holden ★★★★★
(05.07.25 21:46:36 MSK)

Ссылка

AI

Они используют что-то на их стороне (и потенциально коллектят все изображения, в том числе для тренировки), или можно подключить свой бэкенд?

mord0d ★★★★★
(05.07.25 21:47:26 MSK)

Ответ на: комментарий от mord0d 05.07.25 21:47:26 MSK

Пока выглядит так, что все локально. Это же не LLM, там простые операции типа определить что картинка набок.

James_Holden ★★★★★
(05.07.25 21:50:36 MSK)

Ответ на: комментарий от James_Holden 05.07.25 21:50:36 MSK

Это же не LLM

DALL·E тоже не LLM. (=

типа определить

Определение будет работать и на тостере, но из новости я понял так, что они именно для обработки поворота используют нейросети (Diffusers?).

Я совершенно не удивлюсь, если это будет так, сейчас нейросети пихают везде, ~~даже~~ особенно где не надо.

mord0d ★★★★★
(05.07.25 22:01:07 MSK)
Последнее исправление: mord0d 05.07.25 22:10:05 MSK (всего исправлений: 1)

Ссылка

Текст новости тоже ИИ писал или просто рекламщик?

Naurim
(05.07.25 22:47:07 MSK)

Ответ на: комментарий от mord0d 05.07.25 21:47:26 MSK

Они скачивают на ваш ПК(куда-то в хомяк) модели, запускаемые локально. На сторону ничего не отправляют.

lucentcode ★★★★★
(05.07.25 23:16:40 MSK)

Привет! Любишь фотографировать? Тогда менеджер фотографий digiKam — это именно то, что тебе надо

святый боже, что эта жесть делает на глагне?

С новым AI-плагином вертеть картинки стало проще и веселее!

кот бы сомневался!

Как и с другими AI-инструментами, результаты могут быть непредсказуемыми, в зависимости от содержания картинок. Может оказаться, что вы тратите больше времени на исправление ошибок AI, чем если бы сделали корректировки сами.

ну сами же все прекрасно понимают! но нет, надо везде напихать как можно больше АИ-говна! по-моему, это чел-овечество уже не спасти - слишком много дегенератов. остановите Землю, я сойду!

PerdunJamesBond ★
(05.07.25 23:26:47 MSK)

Ответ на: комментарий от PerdunJamesBond 05.07.25 23:26:47 MSK

В digiKam плагины с AI были ещё за годы до того, как на AI начали хайпиться, и эта тема стала популярной среди не профессионалов. Это была фишка этого проекта, делающая его круче, чем аналогичные проекты на GTK… В частности, распознавание лиц с добавлением тегов с именами людей там очень неплохо работало, на моей личной и семейной коллекции фото ещё 3-4 года назад эта фича выдавала верное имя человека на фото в 100 случаях из 100.

lucentcode ★★★★★
(06.07.25 02:30:30 MSK)
Последнее исправление: lucentcode 06.07.25 02:31:41 MSK (всего исправлений: 1)

Ссылка

Интересно в 13 дебиан прилетит?

nikitalol ★★
(06.07.25 02:57:34 MSK)

Ссылка

По сабжу: на офисных печатных машинках оно не нужное и тормознутое, лучше будет обычная лёгкая галерея

Но вот как только у вас крепкий стацонар или игровой ноутбук с ссд, оно тут же заявляет о себе как о крутом органайзере именно за счёт аи-фишек, неполохого редактора и возмости жрати и обрабатывать файлы с разрешением от 50мп

nikitalol ★★
(06.07.25 03:01:21 MSK)
Последнее исправление: nikitalol 06.07.25 03:02:26 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от lucentcode 05.07.25 23:16:40 MSK

модели, запускаемые локально.

Узнать бы какие конкретно модели.

mord0d ★★★★★
(06.07.25 07:42:56 MSK)

Ответ на: комментарий от Naurim 05.07.25 22:47:07 MSK

Нет, ничего нового (см. драму)

mister_me ★
(06.07.25 07:50:01 MSK)

Ссылка

Ответ на: комментарий от mord0d 06.07.25 07:42:56 MSK

Узнать бы какие конкретно модели.

https://files.kde.org/digikam/

Как минимум, они есть в aitools, autotags и facesengine.

dataman ★★★★★
(06.07.25 08:18:37 MSK)
Последнее исправление: dataman 06.07.25 08:28:50 MSK (всего исправлений: 1)

Ответ на: комментарий от dataman 06.07.25 08:18:37 MSK

https://files.kde.org/digikam/

Спасибо большое.

Как минимум, они есть в aitools, autotags и facesengine.

ONNX.

Если они для этого используют GGML и написали всё на C++, то будет даже быстро. А вот если взяли готовую обвязку на Python, то работать будет не везде.

mord0d ★★★★★
(06.07.25 09:18:28 MSK)

Ответ на: комментарий от mord0d 06.07.25 09:18:28 MSK

ONNX.

Если они для этого используют GGML

В GGML же свой GGUF. В общем, нужно исходники Digikam смотреть. :)

dataman ★★★★★
(06.07.25 09:48:05 MSK)

Ответ на: комментарий от dataman 06.07.25 09:48:05 MSK

В GGML же свой GGUF.

В llama.cpp (который передан под покровительство GGML какое-то время назад) есть конвертер в GGUF. Правда, он тоже требует целую кучу питонопакетов.

В общем, нужно исходники Digikam смотреть. :)

Оно на плюсах, с тем же успехом я могу почитать документацию на китайском. (%

mord0d ★★★★★
(06.07.25 09:53:29 MSK)

Ответ на: комментарий от mord0d 06.07.25 09:53:29 MSK

А потом вы все спрашиваете, зачем нужно знать плюсы. Лол. Ну вот, затем что весь софт на них и на сишке. Чтобы что-то почитать.

James_Holden ★★★★★
(06.07.25 10:07:21 MSK)

Ответ на: комментарий от mord0d 06.07.25 09:53:29 MSK

есть конвертер в GGUF.

Есть, но тогда зачем скачивать сотни мегабайт файлов .onnx и конвертировать их в .gguf на стороне пользователя?

с тем же успехом я могу почитать документацию на китайском

Попозже вчитаюсь в исходники. :)

dataman ★★★★★
(06.07.25 10:11:13 MSK)

Ответ на: комментарий от dataman 06.07.25 10:11:13 MSK

Глянул faceengine, там используется OpenCV, eigenface и LBPH алгоритм, вроде никакой тяжелой нейромагии.

А, вот там еще OpenCV DNN используется. Все на плюсах.

James_Holden ★★★★★
(06.07.25 10:13:38 MSK)
Последнее исправление: James_Holden 06.07.25 10:15:51 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от James_Holden 06.07.25 10:07:21 MSK

и на сишке

К сишке претензий нет.

А учитывая что это кедософт, там не просто плюсы, там ещё и boost.

mord0d ★★★★★
(06.07.25 10:19:23 MSK)

Ответ на: комментарий от dataman 06.07.25 10:11:13 MSK

зачем скачивать сотни мегабайт файлов .onnx и конвертировать их в .gguf на стороне пользователя?

Некоторые запрещают изменение, но при этом не запрещают распространение. 🤷‍♂️

mord0d ★★★★★
(06.07.25 10:22:30 MSK)

Ссылка

менеджер фотографий

Интересно, а зачем менеджеру фотографий в зависимостях такие вещи, как upower, udisks2, polkit? Кеды в своём репертуаре.

u5er ★★
(06.07.25 10:30:20 MSK)

Ссылка

Такой текст - и без эмодзи. Требую немедленно исправить.

thesis ★★★★★
(06.07.25 10:36:28 MSK)

Ссылка

Ответ на: комментарий от mord0d 06.07.25 10:19:23 MSK

Ужас ужас

James_Holden ★★★★★
(06.07.25 10:53:02 MSK)

Ссылка

Ответ на: комментарий от mord0d 06.07.25 10:19:23 MSK

А учитывая что это кедософт, там не просто плюсы, там ещё и boost.

Напраслина, Boost в проектах KDE редко используется. Обычно хватает Qt и своих библиотек.
В digiKam из Boost только boost/uuid и boost/graph. Ну и boost/thread/shared_mutex в сторонней xmp_sdk.

dataman ★★★★★
(06.07.25 11:03:19 MSK)

Ответ на: комментарий от dataman 06.07.25 11:03:19 MSK

А учитывая что это кедософт, там не просто плюсы, там ещё и boost.

Напраслина, Boost в проектах KDE редко используется. Обычно хватает Qt и своих библиотек. В digiKam из Boost только boost/uuid и boost/graph. Ну и boost/thread/shared_mutex в сторонней xmp_sdk.

ещё и boost

Напраслина

boost

boost

boost

Кедософт использует boost. Понемножку, но всё же.

mord0d ★★★★★
(06.07.25 11:48:20 MSK)

У кого-нибудь работает аппаратное ускорение при использовании appimage?

unC0Rr ★★★★★
(06.07.25 11:55:26 MSK)

Ссылка

Ответ на: комментарий от mord0d 06.07.25 11:48:20 MSK

Ладно, предлагаю предложить им https://github.com/bobluppes/graaf вместо boost/graph. Я не буду. :)

dataman ★★★★★
(06.07.25 11:56:10 MSK)

Ответ на: комментарий от dataman 06.07.25 11:56:10 MSK

предлагаю предложить

Зачем? Их всё устраивает, пусть будет как есть.

А я просто воздержусь от изучения исходного кода.

mord0d ★★★★★
(06.07.25 12:01:15 MSK)

Ссылка

Ответ на: комментарий от mord0d 06.07.25 09:18:28 MSK

А вот если взяли готовую обвязку на Python

Посмотрел. Нет, как James_Holden уже написал, используются модули DNN OpenCV.

dataman ★★★★★
(06.07.25 12:07:13 MSK)

Ссылка

Внимательно слежу за проектом, уже лет 10 пытаюсь на него переехать с Lightroom. Каждый раз почти-почти но... Но чую ещё лет пять и может получится.

п.с. пробовал ai-категаризацию тегов. Задумка хороша, реализация пока очень далека от получения хоть какой-то пользы, на сотню фото может десяток релевантных тегов выставит.

anonymoos ★★★★★
(06.07.25 12:17:24 MSK)
Последнее исправление: anonymoos 06.07.25 12:20:30 MSK (всего исправлений: 1)

Ссылка

Привет! Любишь фотографировать?

ai

ai gpu

AI-плагин

Всё ясно - реклама.

Goat ★★★
(06.07.25 12:58:37 MSK)

Ссылка

Улучшение распознавания лиц с помощью AI:

Это хорошее применение технологии. Надеюсь на этом и остановятся (вру, не надеюсь) и не станут посредством нейронок улучшать фотографии, превращая снимок в рисунок-фантазию на заданную тему.

ugoday ★★★★★
(06.07.25 14:22:09 MSK)

Ссылка

Зачем ИИ для поворота? Для масштабирования понятно, там есть проблемы, где ИИ может и поможет. А поворот при квадратных пикселях выполняется очень и очень просто, надёжно и даже без потерь (если формат без потерь брать).

peregrine ★★★★★
(06.07.25 15:45:41 MSK)
Последнее исправление: peregrine 06.07.25 15:45:57 MSK (всего исправлений: 1)

Ответ на: комментарий от peregrine 06.07.25 15:45:41 MSK

Чтобы автоматически определяло, в какую сторону вращать.

James_Holden ★★★★★
(06.07.25 16:03:46 MSK)

Ссылка

Молодцы, они одними из первых начали ИИ использовать. Хотя тогда он был малопригодным, просто показывал, что тут человек. И даже если это раскройка машинки бумажное не стеснялся :) И если ты ему скажешь, что это не человек, он при следующем сканировании опять выдавал то же самое. Сколько лет назад это было? Пятнадцать? Так и не приучился я фотки им коллекционировать.

R_He_Po6oT ★★★★★
(06.07.25 19:13:53 MSK)

Ссылка

Жалко, что пока для «недеструктивного» редактирования нельзя использовать sidecar-файлы, как в Darktable. А в целом же отличный проект, который, надеюсь, не превратится в совсем уж монстра.

pento ★★★★★
(07.07.25 09:53:21 MSK)

Ссылка

Кто-то новость-то саму читает или все сразу забивают на это бесполезное занятие и идут на сайт? Отвратительное нагромождение слов. Даже переводом это сложно назвать. Прочитать-то можно было вот это вот перед выкладыванием?

«Теперь можно настроить сканирование распознавания лиц в режиме автостарта нового распознавания лиц»

Как распознавание можно сканировать? Я уж про дальнейшую белиберду даже не спрашиваю.

Теперь можно настроить сканирование [фотографий] для распознавания лиц так, чтобы оно автоматически запускалось при подтверждении или пометке новых лиц.

«позволяет пользователям проверить доступность обработки GPU с помощью AI»

Хм. А зачем обрабатывать графический ускоритель с помощью AI?

…позволяет проверить, может ли ваша система использовать ускорение на GPU при запуске ИИ-моделей, проверяя наличие необходимых библиотек и драйверов для OpenGL и OpenCL.

«Плагин позволяет автоматизировать привычный подход»

Что за привычный подход? Ничего такого он себе не позволяет.

В DK добавлен новый плагин для поворота изображений, который использует ИИ, чтобы избавить от нудного поворота фотографий вручную. Это особенно полезно при сканировании старых снимков или пакетном импорте фотографий, у которых неправильно указана ориентация.

«она требует первоначального ручного ввода» да-да, именно этого функция и требует " в рабочем процессе одной ориентации", так сказать.

Хотя в диспетчере пакетной обработки digiKam уже давно есть функция автоповорота изображений при импорте, изначально она требует ручного вмешательства и работает исходя из предположения, что все изображения с одинаковой ориентацией в рамках одной операции нужно поворачивать одинаково.

Ну и последний абзац…

Как и с другими инструментами на базе ИИ, результаты могут быть разными — всё зависит от содержимого снимков. Возможно, вам придётся потратить больше времени на исправление его ошибок, чем у вас ушло бы на ручную корректировку.

jackill ★★★★★
(08.07.25 19:15:36 MSK)

Ссылка

Для того чтобы оставить комментарий войдите или зарегистрируйтесь.

←	OpenMW 0.49.0

Open Source

Agama 16 — новая программа установки openSUSE

→

Похожие темы