LINUX.ORG.RU
решено ФорумTalks

PDF не готов.

 , , , ,


0

3

Давно использую линукс без особых проблем, но шляпа подкралась незаметно, дорогие друзья (Debian Bookworm).

Делаю ремонт, и возникла необходимость взаимодействия с проектом посредством PDF. Дизайнер шлёт мне проект с комментариями на русском, и я делаю опредёлённые правки под себя и отсылаю ей обратно на переделку.

Так вот, проблема всплыла в таком месте, что я считал немыслимым в 2023.

Очень нужно скопировать номенклатуру и артикул из дизайн-проекта для оценки цены и размерности в поисковик, но в линуксе, оказывается, невозможно скопировать пометки на кириллице в буфер обмена из ПДФ. Латиница и цифры копируются нормально, а с кириллицей (а также с японицей и центральноевропейскими спецсимволами) вообще засада. Приходится набивать руками, а это такое себе.

Использованный софт: -evince/atril - вообще не в состоянии даже выделить текст на кириллице в документе.

-mupdf/qpdfview/foxitreader - текст копируется в буфер, но по ctrl-v вставляется только латиница и цифры, а вместо кириллицы - крокозябры.

Баг висит с 2012 года, но всем насрать, а это базовый функционал!

Приходится лезть в комп жены с православной десяточкой и SumatraPdf, там всё хорошо, но это некрасивый метод.

Кто сталкивался, может это дебиан-специфичный баг?

Проверил русскоязычный PDF (дока на электроизделие) в Okular — всё копируется и вставляется. ЧЯДНТ?

alegz ★★★★
()

извлеки из проблемного документа одну страницу и залей куда-нибудь на файлохостинг (кто захочет, скачает и проверит у себя копирование кириллицы)
иначе это будет гадание на кофейной гуще

d00fy ★★★
()

Попробуй по совету выше Okular. Ну и SumatraPDF имеет Gold совместимость с Wine (обычно для СПО под Windows).

Vsevolod-linuxoid ★★★★★
()

а sumatrapdf под wine уже не работает? зачем так усложнять? не могу понять, как в здравом уме ради софта в десятки килобайт может прийти в голову грузить на хосте ДЕСЯТКУ

mittorn ★★★★★
()

Что будет по pdftotext $имяфайла | less ? Можно попробовать pdftotext $имяфайла | enca и pdftotext $имяфайла | enconv | less

question4 ★★★★★
()

попробуй открыть документ в опенофисе.

dicos ★★
()

КМК, и гуглохром, и лиса умеют пдф-аннотации.

thesis ★★★★★
()

В Okular таких проблем нет.

Zhbert ★★★★★
()

Я так думаю, это у дизайнера ПО чудит (записывая кириллицу в какой-нибудь особой кодировке), а не у тебя

Avial ★★★★★
()
Последнее исправление: Avial (всего исправлений: 1)

Всем спасибо за ответы.

Так и есть, документ был сделан в свежем Adobe под Windows, и ссылается на виндовые шрифты, а не тащит их с собой.

Доустановка mscorefonts проблему решает.

lagavulin16
() автор топика

Открой pdf в браузере, если и там ен сработает, значит это у тебя с локалями беда какая-то.

faq2
()
Ответ на: комментарий от mittorn

Иногда проще накатить венду (в виртуалку например), чем засорять систему сотнями мегабайт 32-битных либ чтобы поставить вайн.

eternal_sorrow ★★★★★
()

Дизайнер шлёт мне проект с комментариями на русском, и я делаю опредёлённые правки под себя и отсылаю ей обратно на переделку.

Экие вы затейники. :)

dataman ★★★★
()
Ответ на: комментарий от mittorn

Да, но снести венду - это удалить 1 образ, или отформатировать диск. А вот снести вайн - это вычищать эти сотни мегабайт пакетов.

eternal_sorrow ★★★★★
()
Ответ на: комментарий от eternal_sorrow

это сделает пакетный менеджер. Впрочем, я не вижу смысла удалять wine и 32битные либы. мультилиб в системе и без wine часто нужен (спасибо valve, которые не могут портировать свой код на 64 бита, когда с этим справится студент за пару месяцев), а код не сильно много весит.
Особо упёртые уже могут собрать wine с wow64, для всяких суматр его уже пару лет как должно хватить, скоро мультилиб не понадобится

mittorn ★★★★★
()
Ответ на: комментарий от eternal_sorrow

установка/снос винды это издевательство над диском. если у тебя ssd - жалко должно быть

mittorn ★★★★★
()

невозможно скопировать пометки на кириллице в буфер обмена из ПДФ

Что такое «пометки»? Есть тонна вариантов как в pdf сделать что-то что можно назвать пометкой. Поля формы (прям значение, без AP), разные типы аннотаций и через дупу сделанные для них appearance stream’ы, прямое рисование текста на канвасе. Там такое количество вариантов все запороть что после пары лет работы с этим чудесным стандартом я вообще удивляюсь что есть софт способный его хоть как-то отрисовать. Не говоря уж про дополнения типа portfolio и эцп

upcFrost ★★★★★
()
Ответ на: комментарий от upcFrost

Беру свои слова назад - теперь комментарии на кириллице не копируются даже в Win10 в SumatraPDF - крокозябры. Сломанный базовый функционал формата ПДФ, родовая травма, видимо.

lagavulin16
() автор топика
Ответ на: комментарий от lagavulin16

Комментарии неплохо делает pdf xchange viewer, под wine тоже работает отлично.

einhander ★★★★★
()

Без примера pdf – это гадание на кофейной гуще.

Upd: в общем, это зависит от pdf, в некоторых русский текст копируется кракозябрами, в некоторых нормально.

Im_not_a_robot ★★★★★
()
Последнее исправление: Im_not_a_robot (всего исправлений: 1)

Выложи куда-нибудь тестовый документ — проверю у себя.

iZEN ★★★★★
()
Ответ на: комментарий от futurama

Pdf - электронная замена бумаги. Делать пометки и закладки на бумаге это нормально. Пытаться изменить содержимое бумаги - идиотия, но иногда нужно. Рассматривать pdf как формат стоит именно так.

einhander ★★★★★
()
Ответ на: комментарий от einhander

Pdf - электронная замена бумаги.

Схерали? Это формат для гарантированного правильного отображения/печати.

Впрочем можешь делать заметки – они там отдельным слоем делаются, оригинал не меняется.

futurama ★★★★★
()
Ответ на: комментарий от einhander

Пытаться изменить содержимое бумаги - идиотия, но иногда нужно

Ага, и жс туда пихать «идиотия но иногда нужно». И 3д-графику тоже. Чёт много идиотии.

Скачай вот зацени https://tetra4d.com/pdf-samples/. Работает только в акробате

upcFrost ★★★★★
()
Последнее исправление: upcFrost (всего исправлений: 1)
Ответ на: комментарий от futurama

Неистово плюсую. Пока там было view/print и максимум аннотации - стандарт был ещё плюс-минус читабелен. А когда туда влили три ушата помоев типа js, форм, 3d-графики, эцп и вложенных файлов-портфолио - весь этот шлак теперь даже в один стандарт не влезает и нужно бегать с тем же itext по десяткам файлов в попытках понять как же оно реально работает.

Та же эцп например по трем разных документам размазана (стандарт, дополнение и словарь dss из стандарта ЕС), и никаких кросс-ссылок между ними нет. А того же портфолио в стандарте просто нет, даже упоминаний нету. Кто будет рыть такое для foss-пет-прожекта хз

upcFrost ★★★★★
()
Последнее исправление: upcFrost (всего исправлений: 1)
Ответ на: комментарий от upcFrost

Про запихивание 3д в pdf я прекрасно знаю и считаю извратом, пока оно не стандартизовано должным образом. Если верно помню то все эти чудеса в решете, стандартом на pdf ISO 32000-1:2008, не описываются.

Раз уж мы заговорили про формат pdf, то мне кто-то здесь говорил, что он сжимает изображения не хуже djvu. А вот как это сделать я уже не помню. Может быть кто знает? Для справки из 60мб pdf у меня выходит 15мб djvu, с тем же качеством картинки.

einhander ★★★★★
()
Ответ на: комментарий от einhander

3d графика в стандарте есть в главе multimedia. Но там только базовые вещи типа ск и линий. На какой спек опирается акробат я хз, с графикой мало работаю, но чую как с эцп надо долго пинать гугель, скорее всего какое-то дополнение.

мне кто-то здесь говорил, что он сжимает изображения не хуже djvu

Native - может быть, хз, но native почти никто не юзает кмк. Обычно юзают jpeg filter, а жопег он везде жопег. Его в 1.5 завезли

upcFrost ★★★★★
()
Последнее исправление: upcFrost (всего исправлений: 1)
Ответ на: комментарий от einhander

Ну не знаю, что делается при сжатии в djvu

Кардинально можно уменьшить скан через scantailor

Попробуй добавить в строчку с gs -dPDFSETTINGS=/printer или -dPDFSETTINGS=/ebook

greenman ★★★★★
()
Последнее исправление: greenman (всего исправлений: 2)
Ответ на: комментарий от greenman

Кардинально можно уменьшить скан через scantailor

Всегда использую для исправления книг, иногда даже нормально отсканированные книги запихивают в pdf с перекосами и без разрезки на страницы.

Он выдаст папку с обработанными tiff файлами, каким образом их скормить gs для создания pdf?

einhander ★★★★★
()
Ответ на: комментарий от einhander

Вроде scantailor-advanced позволяет сразу выдать pdf

greenman ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)