Mailing List CyrTeX-ru@vsu.ru Message #3113
From: Karlsson Karl <CyrTeX-ru@vsu.ru>
Subject: Re: : поиск русского текста в pdf
Date: Sat, 25 Feb 2012 16:45:53 +0400
To: Cyrillic TeX Users Group <cyrtex-ru@vsu.ru>
> 25.02.2012, 05:06, "Yuri Nefedov" <CyrTeX-ru@vsu.ru>:
> On Fri, 24 Feb 2012, Subscriber wrote:
>
>  Как я понимаю. Если у вас не установлены векторные шрифты
>  для латех, то вызов latex => dvips создаёт "бинарную
>  картинку", поиск в которой не работает по определению.
>  Если установлен пакет cm-super (в cm-super содержится
>  весь набор CM шрифтов в формате ps type 1), то получится
>  картинка в векторном формате и соответственно будет возможность поиска.
>  При этом не важно используете вы latex => dvips => pdf или pdflatex.
>
LaTeX делает нестандартные PDF файлы. Шрифты Type 1 (векторные) и Type 3 (растровые) отличаются только микропрограммой которой рисует сами глифы.
>
>  Про "cmap" ничего не знаю. Похоже, это способ организовать
>  поиск даже в "бинарной картинке".
>
Это способ сделать Standards compliant PDF. Но cmap работает только для Computer Modern.
Этот код работает для всех шрифтах
\input glyphtounicode.tex
\input glyphtounicode-cmr.tex
\pdfgentounicode=1
>
>  По поводу поиска, выделения и копирования. Многое зависит от самой
>  смотрелки.
>  acroread - я не использую.
>  xpdf - отказывается работать с русским.
>  Из тех что под рукой, с русским языком работают evince и zathura.
>
Если у evince и zathura имеются какие то внутренние алгоритмы исправления нестандартных PDF, это делает их лучше. Только сами PDF файлики остаются нестандартные.
Но Adobe Reader лучше для продолжительного чтения. Потому что качество отображения лучшее из всех.
Subscribe (FEED) Subscribe (DIGEST) Subscribe (INDEX) Unsubscribe Mail to Listmaster