LINUX.ORG.RU

[latex][cyrtimes] Русский текст не копируется из pdf в случае акробат ридер


0

0

Пакет cmap, видимо, не дружит с пакетом cyrtimes (русские таймсоподобные шрифты, есть в дебиане и в убунте). В итоге acrobat reader неверно копирует русский текст из pdf. С разными foxit/okular/evince проблем нет, но acrobat reader одинаково криво работает в виндоуз и в линукс.

Отключение пакета cyrtimes помогает в нижеследующем тестовом примере. Вопрос: как бы всё-таки исправить проблему, не отказываясь ни от cyrtimes (читаь удобнее, буквы толще), ни от ридера (стоит много где)?

 
\documentclass[a4paper,10pt]{article}

% это работает:
\usepackage{ucs}
\usepackage[utf8x]{inputenc}
\usepackage{cmap}
\usepackage[T1]{fontenc} %T2A или T1 -- не важно
\usepackage[english,russian]{babel}
\usepackage[unicode]{hyperref}
\usepackage{mathtext}
% а это ломает русский при копировании:
\usepackage{cyrtimes} %  %(

\begin{document}
В Acrobat Reader этот текст нормально не копипастится.
\end{document}
★★★★★

а чем собирается-то? в fprog все нормально копи-пастится через evince. правда там сборка напрямую через pdflatex и [utf8]{inputenc} вместо utf8x

ott ★★★★★ ()
Ответ на: комментарий от ott

> в fprog все нормально копи-пастится через evince.

С evince всё хорошо. Всё плохо с Acrobat Reader.

sv75 ★★★★★ ()

Замена uft8x на uft8 и отключение mathtext не помогают?

nnz ★★★★ ()

Попробуй изменить преамбулу:

--- orig	2010-06-09 10:34:05.000000000 +0700
+++ fixed	2010-06-09 10:38:16.000000000 +0700
@@ -1,15 +1,14 @@
 \documentclass[a4paper,10pt]{article} 
  
 % это работает: 
-\usepackage{ucs} 
-\usepackage[utf8x]{inputenc} 
+\usepackage[utf8]{inputenc} 
+\usepackage[T1,T2A]{fontenc} %T2A или T1 -- не важно 
+% а это ломает русский при копировании: 
+\usepackage{cyrtimes} %  %( 
 \usepackage{cmap} 
-\usepackage[T1]{fontenc} %T2A или T1 -- не важно 
 \usepackage[english,russian]{babel} 
 \usepackage[unicode]{hyperref} 
 \usepackage{mathtext} 
-% а это ломает русский при копировании: 
-\usepackage{cyrtimes} %  %( 
  
 \begin{document} 
 В Acrobat Reader этот текст нормально не копипастится.
По идее, должно сработать. Если что, можно немного поиграться с порядком загрузки пакетов.

srj ★★ ()
Ответ на: комментарий от annoynimous

> Подозреваю, что акробат пытается скопировать текст в другой кодировке — не utf8

примерно так, но гораздо хуже

я встречал русские пдф-ки, в которых кодировка определяется исходя из порядка букв, в котором они идут, т.е. в в случае, если пдф-ка содержит твой пост, то кодировка будет:

char encoding[] = «Подзреваю, чткбпысяиьуй-utf8»;

www_linux_org_ru ★★★★★ ()
Ответ на: комментарий от srj

>+\usepackage[T1,T2A]{fontenc} %T2A или T1 — не важно

\usepackage{cmap}
-\usepackage[T1]{fontenc} %T2A или T1 — не важно

По идее, это еще хуже, т.к. cmap надо грузить до фонтенка (и бабеля).

anonymous ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.