LINUX.ORG.RU

Сообщения question4

 

Разоблачения reCAPTCHA ещё не обсуждали?

https://3dnews.ru/1117990/google-recaptcha-utratila-effektivnost-i-prevratilas-v-instrument-slegki
https://habr.com/ru/news/880802/
https://boingboing.net/2025/02/07/recaptcha-819-million-hours-of-wasted-human-time-and-billions-of-dollars-google-profit.html

Третья ссылка — на заблокированный сайт.

Вкратце: reCAPTCHA больше не защищает от роботов, зато хорошо следит за пользователями; пользователи потратили на неё 819 млн. часов, эквивалентные $6.1 млрд. (интересно, как считали?); заработок Гугла на этой информации оценивают почти в триллион ($888 млрд.).

 , ,

question4
()

Разделить stdin на несколько процессов и управлять их ходом

Есть скрипт, который берёт файл с изображением, преобразует его с разными наборами параметров (для простоты — гаммы) и сохраняет ещё 7 вариантов. Затем полученный набор изображения распознаются Tesseract-ом.

Хочется сделать то же самое с буфером обмена без сохранения промежуточных файлов. Желательно иметь возможность ограничивать число процессов.

Скрипт варьирования гаммы:

for g in 2 4 8 0.5 0.25 0.125 0.0625
    do
        sem -j8 --quote convert "$filename" -gamma $g "`basename "$filename" .jpg`"-$g.jpg; 
    done

Скрипт распознавания содержимого буфера обмена:

xclip -out -selection clipboard -target image/jpeg | { tesseract - - -l rus+eng+ukr+fra+spa; echo ; } | xclip -selection clipboard -in

(Формат JPEG — из-за проблем в Тессеракте.)

Мне нужно направить stdin в несколько процессов, затем последовательно собрать их stdout-ы и направить в буфер. Всюду рекомендуют tee, но он направляет на stdout и исходный бинарный битмап. Пока получилось что-то вроде:

function cr  () ( tesseract - - -l rus+eng+ukr+fra+spa; echo ; )

function vg () ( echo $1; convert - -gamma $1 -format jpeg - | cr )

xclip -out -selection clipboard -target image/jpeg | tee  \
    >( echo 1; cr ) \
    >( vg 2 ) \
    >( vg 4 ) \
    >( vg 8 ) \
    >( vg 0.5 ) \
    >( vg 0.25 ) \
    >( vg 0.125 ) \
    >( vg 0.0625 ) \
    | xclip -selection clipboard -in

Проблемы следующие:

  1. Все echo отрабатывают одновременно, не дожидаясь окончания convert и tesseract. Как сделать, чтобы результат подпроцесса шёл на stdout одной порцией по завершению подпроцесса? (Пока ставлю echo в конец, но это не столь удобно.)
  2. Не всегда удобно запускать 8 процессов одновременно. Иногда нужно ограничить их число 4 или даже 1. Как это сделать?
  3. Как в tee лучше заблокировать вывод исходного stdin? Или чем заменить tee? — ОТВЕТ: ... | tee >(...) >(...) > /dev/null | ...
  4. Как это записать покороче? Строки я сократил, вынеся всё в функции, но как разместить под tee цикл?
  5. Если выполняю скрипт в шелле без последней команды — без редиректа в xclip — получаю ошибки «bash: 62: команда не найдена», «bash: 1: команда не найдена», «bash: 4c: команда не найдена» и непонятно откуда в истории команд шелла появляется 62;1;4c. Что это? — ОТВЕТ: Побочный эффект от вывода JPEG в консоль.

 , tee

question4
()

Сколько времени нужно Hugin-у на обсчёт панорамы?

Захотел склеить все кадры короткого видео в одно фото. ffmpeg-ом сохранил 148 кадров 720x1280, открыл их в Hugin-е, нажал «Align…» Довольно быстро (с полчаса) процесс дошёл до «Step 2: Do whole panorama control point checking…» и задумался. htop говорит, что cpclean висит уже 13 часов.

Можно ли оценить, сколько времени ему понадобится? Стадия «Align…», до «Create panorama…» я ещё не дошёл.

 ,

question4
()

Распознание речи на нескольких языках сразу

Пример: https://t.me/dfzwe4/65269 Чередуются реплики на нескольких языках.

Правильно ли я понимаю, что Whisper и Whisper.cpp должны уметь такое обрабатывать? Для роликов на русском Whisper.cpp мне иногда выдавал смесь русского и английского :) Но здесь всё опознал как английский. Модель large-v3-turbo-q8_0. Пробовать другие модели?

 , ,

question4
()

На что ориентироваться?

Некоторые, выбирая конфигурацию нового компьютера ставят всё по максимуму. Учитывая цены на видеокарты, мне это не по карману :) Некоторые советуют из экономии брать всё на ступень ниже — лучше соотношение цена ÷ производительность. Примерно так я взял карту с большим рейтингом в попугаях, но без OpenCL, CUDA и Vulkan-а :)

Некоторые советуют брать конфигурацию под одну из топовых игр. Какую из современных игр по вашему мнению следует считать ориентиром?

 ,

question4
()

Где задавать нубские вопросы про MS Visual Studio 2022?

Сунулся на RSDN — восстановление пароля не работает, регистрация нового пользователя тоже. Сунулся на Ru.Board — за день никто не ответил. Что ещё осталось?

(Проблема была в моём незнании различий между .NET Platform и .NET Framework, если интересно. Уже разобрался.)

 , ,

question4
()

Странное поведение Tesseract

Не первый раз уже сталкиваюсь, что Tesseract отказывается распознавать, пока не пошевелю гамму.

Скачал видео с субтитрами из Телеграма (MP4), сделал скриншоты в MPV (JPEG), откадрировал ImageMagick-ом (PNG), скормил Tesseract-у. Ничего не нашло. Чуть изменил гамму тем же ImageMagick-ом (convert -gamma), причём в любую сторону и в широком диапазоне (0.125-4) — нормально распознаётся.

В чём может быть дело?

$ tesseract --version
tesseract 5.4.1
 leptonica-1.83.1
  libgif 5.2.1 : libjpeg 6b (libjpeg-turbo 3.0.0) : libpng 1.6.44+apng : libtiff 4.4.0 : zlib 1.3.1 : libwebp 1.4.0 : libopenjp2 2.5.2
 Found AVX
 Found FMA
 Found SSE4.1
 Found OpenMP 201511
 Found libarchive 3.7.7 zlib/1.3.1 liblzma/5.6.2 bz2lib/1.0.8 libzstd/1.5.6
 Found libcurl/8.11.0 OpenSSL/3.3.2 zlib/1.3.1 brotli/1.1.0 zstd/1.5.6 c-ares/1.33.1 libidn2/2.3.7 libpsl/0.21.5 libssh2/1.11.1 nghttp2/1.62.1 nghttp3/1.6.0 librtmp/2.3 OpenLDAP/2.6.4

Модели с tessdata_best 4.1.0.

Пример текста: https://0x0.st/Xn4B.zip

 ,

question4
()

Speech to text

Кто имеет опыт работы с новыми средствами для распознавания речи? Что порекомендуете на десктопную машину без CUDA/OpenCL? Свободное или бесплатное. Английский, русский, французский, украинский, испанский. Скорость распознавания хотя бы 1:1.

P.S. Превращать в текст звуковые файлы.

Ответ: Vosk вполне устраивает.

 

question4
()

В новом KRDC нестабильно работает клавиатура

Gentoo. Обновился до kde-apps/krdc-24.08.1-r1, теперь Alt-Tab и Shift-Ins работают не на всех удалённых машинах. Иногда Alt-Tab перебирает окна исключительно в моей системе. Иногда клавиатура вообще не работает. Иногда клавиатура работает, но не работает Paste из контекстного меню. Удалённые ОС — Windows 10 и Server 2022.

Закрытие вкладки с сеансом и повторный иногда помогают на какое-то время.

Куда копать?

P.S. Теперь вообще стал падать с ошибкой сегментирования:

$ krdc 
KRDC: Starting RDP session
[07:28:50:865] [23707:23707] [WARN][com.freerdp.crypto] - Certificate verification failure 'self-signed certificate (18)' at stack position 0
[07:28:50:865] [23707:23707] [WARN][com.freerdp.crypto] - CN = xxx.xxx.xxx.xxx
[07:28:51:068] [23707:23707] [ERROR][com.winpr.timezone] - Unable to get current timezone rule
[07:28:51:369] [23707:23707] [INFO][com.freerdp.gdi] - Local framebuffer format  PIXEL_FORMAT_RGBX32
[07:28:51:369] [23707:23707] [INFO][com.freerdp.gdi] - Remote framebuffer format PIXEL_FORMAT_BGRA32
[07:28:51:379] [23707:23707] [INFO][com.freerdp.channels.rdpsnd.client] - [static] Loaded pulse backend for rdpsnd
[07:28:51:383] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel rdpsnd
[07:28:51:383] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel audin
[07:28:51:389] [23707:23707] [INFO][com.freerdp.channels.audin.client] - Loaded pulse backend for audin
[07:28:51:389] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel rdpgfx
Ошибка сегментирования

xxx.xxx.xxx.xxx — имя машины, с которой работал перед закрытием.

 , ,

question4
()

Дарл Макбрайд умер

Ещё в сентябре. От склероза. 64 года.

Википедия: https://en.wikipedia.org/wiki/Darl_McBride
Некролог: https://www.memorialutah.com/obituaries/darl-mcbride

Тем, кто давно не следит за этой историей, напомню, что с декабря 2020 он проходил процедуру личного банкротства (Chapter 13):
https://unicourt.com/case/pc-bk5-darl-charles-mcbride-1290201
Бывший CEO SCO -- банкрот
И похоже, с долгами расплатиться не успел.

Попытался найти в сети его мемуары, наткнулся на обложку Форбс 2004 года, где его назвали «врагом корпораций №1»: «Бизнес сходит с ума по свободному ПО. Этот человек утверждает, что владеет его частью. Поэтому он […] повсюду требует денег от больших компаний.»
https://i.ebayimg.com/images/g/pS4AAOSwAQpfd6-o/s-l1600.webp
https://www.befr.ebay.be/itm/326119716776

P.S. Интересно, кто-нибудь видел рекламировавшиеся им книги «Samizdat: And Other Issues Regarding the ‘Source’ Of Open Source Code» и «Snake Bytes: Story of a $34 Billion Software Heist»?

 

question4
()

Замена Outlook

Корпоративный Аутлук отказался ставиться на телефон Huawei — принимает его за рутованный, пишет «обратитесь к админам». Админы посоветовали поставить что-нибудь другое. Что посоветуете поставить вы?

 , , ,

question4
()

Кто чем конвертирует книги?

Вообще, понадобилось сконвертировать пачку PDF во что-нибудь с произвольной шириной страниц. Например, HTML. EPUB или FB2 тоже сгодятся.

В идеале нужно что-нибудь предельно простое в командной строке, типа soffice --convert-to html filename.pdf (который не работает).
Про Calibre знаю, но в его интерфейсе можно блуждать неделями. И он не умеет сохранять HTML.
pdftohtml из poppler работает, но картинки кладёт отдельными файлами. Хотелось бы, чтобы мог сразу в HTML внедрять.

Кто чем пользуется?

 , , ,

question4
()

LibreOffice Writer разучился открывать PDF?

Как заставить PDF открыться во Writer-е? Когда-то достаточно было открыть через File → Open или в консоли lowriter filename.pdf, но теперь он автоматически открывается в Draw.

Ответ: выбрать в диалоге в выпадающем списке типов «PDF - Portable Document Format (Writer) (*.pdf)»

Следующий вопрос: как это сделать при открытии из командной строки? Указывать ту же строку для --infilter= не помогает.

Ответ: --infilter=writer_pdf_import

 ,

question4
()

Драма! Перепродавец ноутбуков Clevo поцапался с CoreBoot

https://old.reddit.com/r/linux/comments/1g6f9rx/dont_support_the_coreboot_project/
https://www.opennet.ru/opennews/art.shtml?num=62079
https://old.reddit.com/r/linuxhardware/comments/15v2y21/stay_away_from_malibal/

Есть такая американская компания — Malibal. Судя по постам на ЛОРе 11-13 лет назад, продаёт ноутбуки Clevo под брендом Malibal. (Судя по ссылкам выше, компания сейчас состоит из 1 человека — сложно представить, как можно долго уживаться с таким скандалистом.) Не так давно Malibal пытался сотрудничать с CoreBoot — прислал недоделанную прошивку, обещал заплатить за доведение её до ума.

В итоге не договорились, никому не заплатили, Malibal ввёл санкции против Польши, Германии, Австрии, Техаса, Лихтенштейна и AMD за сотрудничество с CoreBoot.

Если верить коребутчикам, заказчик не видел разницы между «прошивку можно собрать» и «прошивка рабочая», не знал, где на его плате UART, требовал снизить расценки за работу пропорционально прожиточному минимуму в Польше. И постоянно скатывался на оскорбления.

Последнее подтверждают покупатели этих ноутбуков.

 ,

question4
()

Копировать в буфер иксов из редактора Midnight Commander

Редактор запущен в консоли. Для определённости — Konqueror. Чтобы скопировать текст из консоли в другую программу через буфер, его надо выделить мышью.

Но текст в редакторе MC можно выделять и стрелками с шифтом или через F3 и Shift-F3. Есть даже команда для копирования этого выделения в буфер обмена, но это свой отдельный буфер ~/.cache/mc/mcedit/mcedit.clip. В баг-трекере есть 2 просьбы использовать общеиксовый буфер, одна помечена как выполненная, но требует громоздить пирамиду костылей, другая висит 11 лет без изменений:
https://midnight-commander.org/ticket/30
https://midnight-commander.org/ticket/3081

Как пользоваться иксовым буфером обмена? Существует ли способ проще, чем по ссылкам?

 , ,

question4
()

Что с сервером?

Постоянно сыплются ошибки 404 и 502. Я уж сперва испугался, что Talks снесли.

 

question4
()

Гейман о пиратстве

Наткнулся: https://youtu.be/84M55-TL5go Датировано 26.11.2023.

Автоматическая расшифровка — в комментариях, чтобы не забивать ленту.

Вкратце — говорит, сперва боялся, что если не предпринимать мер к пиратам, автоматически теряет права на выложенные тексты, но потом обнаружил, что его пиратят в России, затем пираты переводят и выкладывают переводы, и когда он пытается издаваться в России, у него неожиданно высокие продажи. Попробовал на месяц выложить бесплатно «Американские боги» на английском — продажи в независимых магазинах подскочили. Приводит пример: примерно 5-10% впервые прочли своего любимого писателя в купленной в магазине книге, а 90-95% — в книге, которую они взяли почитать. Поэтому считает, что бояться пиратства и интернета не следует.

 ,

question4
()

Информационная безопасность и двухфакторная аутентификация

Получил новую машину (для тестирования кросплатформенных программ .Net/Mono), пытаюсь залогиниться в Джиру (на atlassian.net, авторизация через Microsoft), 2-факторная аутентификация, логин, пароль, жду SMS. Жду… Жду… Жду… Меняю способ авторизации на голосовой телефон. Приходит звонок, просит нажать любую кнопку, но все нажатия игнорирует. Иду к админам, беру код, логинюсь.

Вечером возвращаюсь домой, обнаруживаю, что все смс-ки пришли в WhatsApp. Который у меня только десктопный на домашней машине (веб-версия в Electron, если быть точным).

Atlassian Microsoft упрощает работу ЦРУ? :)

Продолжение:
Полез на другой сайт, где та же корпоративная авторизация, и куда давно не заходил. Снова запросило пароль, снова послало код на WhatsApp. Я этот код ввёл. Его отказалось принимать, как неверный. Я запросил новый код. Новый код пришёл по SMS.

 , ,

question4
()

Исправить разрешение в MP4

Есть 2 файла с видео в разрешении 320x240. При попытке запустить их в mpv одновременно командой
mpv --lavfi-complex="[vid1][vid2]vstack[vo];[aid2] acopy [ao]" 1.mp4 --external-file=2.mp4
получаю ошибку
[ffmpeg] Parsed_vstack_0: Input 1 width 480 does not match input 0 width 320.
Аналогично для hstack получаю
[ffmpeg] Parsed_hstack_0: Input 1 height 360 does not match input 0 height 240.
Если поменять файлы местами — ошибка та же. Насколько я понял, в свойствах видеопотоков прописано верное разрешение 320x240, но в свойствах контейнеров 480x360. И для главного файла (input 0) берутся параметры потока, а для external-file (input 1) — параметры контейнера.

(Кому интересно, такие файлы получаются, если сохранять видео с Ютуба через сайт ddownr.com если у видео разрешение ниже заданного в веб-форме. Но для формы минимальное разрешение — 360p.)

Вопрос: как изменить свойства файла, чтобы сделать верное разрешение? Вероятно, это делается одной командой ffmpeg, но я её пока не нашёл. -c copy сохраняет неправильное разрешение.

 

question4
()

Проблемы с подсветкой элементов списка в истории правок?

В списке Оффтопик-лист (изменён 03.09.2025) видно 24 пункта. Если открыть историю правок, в последнем варианте тоже 24 пункта. Но если включить подсветку изменений, пунктов будет 25, добавится «21. Обсуждение криптовалют, не имеющее непосредственного отношения к GNU/Linux.» В чём дело? Удалённый элемент списка не подсвечивается красным и сдвигает нумерацию?

 

question4
()

RSS подписка на новые темы