Mailing List CyrTeX-ru@vsu.ru Message #3109
From: Шмаков Андрей <CyrTeX-ru@vsu.ru>
Subject: поиск русского текста в pdf
Date: Fri, 24 Feb 2012 11:47:54 +0700
To: <CyrTeX-ru@vsu.ru>
Добрый день, уважаемые знатоки LaTeX!

Есть ли возможность заставить работать поиск и нормально копировать фрагменты русского текста из pdf-файла, созданного методом
"latex => dvips ==> ps2pdf"? Сразу для определенности скажу, что использую связку   "debian + texlive + texmaker"

Предположим, для простоты, что есть файл примерно следующего содержания:

\documentclass[a4paper,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[TS1,T2A]{fontenc}
\usepackage[english,russian]{babel}
\begin{document}
Какой-то текст на русском языке.
\end{document}

Если я его собираю в таком виде, то в результате получаю pdf-файл, в котором невозможно нормально выделить текст и, соответственно, нельзя выделенный фрагмент текста никуда скопировать, поиск, естественно, тоже не работает.

Теперь, если добавить пакет "cmap" получим:

\documentclass[a4paper,12pt]{article}
\usepackage{cmap}
\usepackage[utf8]{inputenc}
\usepackage[TS1,T2A]{fontenc}
\usepackage[english,russian]{babel}
\begin{document}
Какой-то текст на русском языке.
\end{document}

В результате при сборке методом "pdflatex" получаем вполне пригодную pdf-ку, в которой работает поиск русского текста, и из которой без лишних заморочек осуществляется копирование фрагмента текста в любой другой редактор.

Можно ли сделать что-то, чтобы получить такую же нормальную pdf-ку при использовании сборки "latex => dvips ==> ps2pdf"?

Я нашел один из вариантов решения проблемы:

Во-первых, нужно установить пакет "scalable-cyrfonts-tex", содержащий кириллические шрифты.
Во-вторых, в тексте после начала документа добавить строку, отвечающую за выбор кириллического шрифта из установленного пакета.
В результате получаем:

\documentclass[a4paper,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[TS1,T2A]{fontenc}
\usepackage[english,russian]{babel}
\begin{document}
\usefont{T2A}{ftm}{m}{sl}
Какой-то текст на русском языке.
\end{document}

Однако, желаемого результата данный способ не дает. В результате получается pdf-ка, в которой нормально осуществляется выделение текста, но, по-прежнему, не работает поиск и при попытке скопировать фрагмент текста копируются непонятные каракули.

Может, можете что-нибудь посоветовать?

Заранее спасибо.

===========
С уважением,
Шмаков Андрей.
Subscribe (FEED) Subscribe (DIGEST) Subscribe (INDEX) Unsubscribe Mail to Listmaster