From: "=?KOI8-R?B?7MnEz9fTy8nKIPfMwcTJzcnS?=" Received: by relay1.vsu.ru (CommuniGate Pro PIPE 5.2.10) with PIPE id 133280290; Mon, 10 Nov 2008 12:29:45 +0300 X-drweb-hash: Received: from webmail5.yandex.ru ([213.180.200.38] verified) by relay1.vsu.ru (CommuniGate Pro SMTP 5.2.10) with ESMTP id 133275659 for cyrtex-ru@vsu.ru; Mon, 10 Nov 2008 12:20:12 +0300 Received-SPF: pass receiver=relay1.vsu.ru; client-ip=213.180.200.38; envelope-from=litwr@yandex.ru Received: from YAMAIL (webmail5) by mail.yandex.ru id S9453734AbYKJJUP for ; Mon, 10 Nov 2008 12:20:15 +0300 X-Yandex-Spam: 1 Received: from [88.84.200.34] ([88.84.200.34]) by mail.yandex.ru with HTTP; Mon, 10 Nov 2008 12:20:14 +0300 To: "Dipsy" In-Reply-To: References: Subject: =?KOI8-R?B?UmU6IMvByyDPwtLBws/UwdTYIFRlWM/NIHVuaWNvZGU=?= MIME-Version: 1.0 Message-Id: <57551226308814@webmail5.yandex.ru> Date: Mon, 10 Nov 2008 12:20:14 +0300 X-Mailer: Yamail [ http://yandex.ru ] 5.0 Content-Transfer-Encoding: 8bit Content-Type: text/plain; charset=KOI8-R X-DrWeb-FlyTrap-Class: NON-SPAM X-DrWeb-FlyTrap-CID: 1 X-DrWeb-FlyTrap-ID: 13849571 09.11.08, 16:20, "Dipsy" >а можно немножечко подробней, по данным подсказкам я буду день ковыряться.. >А вообще, благодарю! Интересная позиция... Но попробую поподробнее. Предложенный инструментарий, насколько мне известно, единственный, решающий проблему простой перекодировкой. На первом шаге текст приводится к виду, воспринимаемому программой rucnv, т.е. с уникодами в форме типа [U+0410]. Он выполняется стандартной для всех линоксоюниксов программой sed, которую можно для microsoft windows взять из множества источников (например, www.delorie.com). На втором шаге авторская программа rucnv транслирует формы [U+nnnn] в коды нужной вам кодировки, в частности, UTF-8. Проблем с трансляцией быть не может в любой системе, где есть Си++ (см. README). Если у вас Microsoft Windows без C++, то можно с авторского сайта litwr.boom.ru взять скомпилированный exe-файл. Буду рад ответить, если возникнут еще вопросы. Буду также рад пожеланиям по rucnv. 2008/10/27 Лидовский Владимир Добрый день! Если не пугают сценарии, то решение может быть таким 1) sed 's/\\unicode{\([^}]*\)}/[U+\1]/g' infile.tex >outfile.tex в outfile.tex \unicode{...} заменятся на [U+...] 2) rucnv 21u outfile.tex outfile.tex даст UTF-8 в otfile. Меняя цифры перед u, можнo получать любые кодировки. Rucnv можно взять с http://www.ibiblio.org/pub/linux/apps/misc/ файл rucnv-1.0.7.tar.bz2