From: Received: by relay1.vsu.ru (CommuniGate Pro PIPE 5.3.11) with PIPE id 287982504; Tue, 07 Dec 2010 10:07:04 +0300 X-drweb-hash: Received: from cm02fe.IST.Berkeley.EDU ([169.229.218.143] verified) by relay1.vsu.ru (CommuniGate Pro SMTP 5.3.11) with ESMTPS id 287982483 for CyrTeX-ru@vsu.ru; Tue, 07 Dec 2010 10:06:58 +0300 Received-SPF: none receiver=relay1.vsu.ru; client-ip=169.229.218.143; envelope-from=wodzicki@math.berkeley.edu Received: from cm03ws.ist.berkeley.edu ([169.229.218.165] helo=calmail.berkeley.edu) by cm02fe.ist.berkeley.edu with esmtpsa (TLSv1:AES256-SHA:256) (Exim 4.72) (auth login:wodzicki@math.berkeley.edu) (envelope-from ) id 1PPrhD-0000f1-6a for CyrTeX-ru@vsu.ru; Mon, 06 Dec 2010 23:10:44 -0800 Received: from 75.36.223.120 (SquirrelMail authenticated user wodzicki@math.berkeley.edu) by calmail.berkeley.edu with HTTP; Mon, 6 Dec 2010 23:10:43 -0800 Message-ID: <5e73f68e78aae28a61c8c7697a683d49.squirrel@calmail.berkeley.edu> In-Reply-To: References: Date: Mon, 6 Dec 2010 23:10:43 -0800 Subject: Re: disser+utf8 To: "Cyrillic TeX Users Group" User-Agent: SquirrelMail/1.4.21-2.berkeley MIME-Version: 1.0 Content-Type: text/plain;charset=utf-8 Content-Transfer-Encoding: 8bit X-Priority: 3 (Normal) Importance: Normal X-DrWeb-FlyTrap-Class: NON-SPAM X-DrWeb-FlyTrap-CID: 1 X-DrWeb-FlyTrap-ID: 89696679 > Чтобы автоматизировать выбор кодировки файла, можно использовать vim > modeline в tex-файле. > Ещё в конфигурационном файле .vimrc можно перечислить кодировки, > которые vim будет использовать для авто-определения кодировки файла. > В вашем случае: > set fileencodings=utf-8,cp1251,сз866,koi8-r > В подавляющем большинстве случаев авто-определение будет работать, и > вам не нужны будут алиясы. set fileencodings=utf-8,cp1251,сз866,koi8-r не будет работать: если VIM открывая файл находит, что его формат не совместим с кодировкой UTF-8, тогда считает, что файл закодирован в CP1251, независимо от настоящей кодировки файла -- будь это Latin1, CP866, или KOI8-R, так, что ваш пример, боюсь неправильный. Принцип работы весма прост: перебирать в списке заданным в "set fileencodings=" кодировки пока не попадется первая, которая не выдаст ошибку. Об этом уже раньше писал Алексей Крюков, который тоже предложил пользоваться механизмом "set fileencodings=". К сожалению этот механизм обладает именно тем недостатком, что работат всего для одной единственной восьми-битовой кодировки. Возникающее здесь затруднение особенно отчеливо испытывают пользователи операционных систем в средах где подавляющее количество локализованных документов например в Latin1/CP1252 или Latin2/CP1250, а им приходится работать также с документами в кирилических кодировках. Так, что отэ :е ++enc=cp1251 и т.п. боюсь никуда не деться пользуясь эдитором типа VIM. Я во всяком случае для себя давно решил все документы, которые содержат высшие ASCII (т.е. > 127) записывать исключительно в UTF-8, и не просто для моего личного удобства, а для того например, чтобы мои друзья в Москве могли правильно прочесть цитату, или даже название или просто фамилию, если те написаны по французски, итальянски и т.д., учитывая факт, что все современные европейские языки пользующиеся латинским алфавитом, все кроме английского, содержат буквы с акцентами (с той же проблемой сталкиваемся когда я тексте по русски хочется нам поместить даже самую короткую цитату на любом языке кроме английского). Мариуш