LINUX.ORG.RU

Переход с RedHat-7.x на RedHat-8.0.


0

0

Данное руководство адресованно в первую очередь тем, кто пока решил
остаться на предыдущих версиях RH, а именно RedHat-7.x, однако небольшое
изменение RH-8.0 в сторону традиционной локали koi8-r, делает эту систему
более привлекательной, так как позволяет использовать более современную
glibc и gcc, что дает большую стабильность и скорость в работе всех
приложений.....

>>> Подробности

★★★

Проверено: maxcom

Ответ на: комментарий от svu

Виноват, опечатался про XML - "будет иметь в качестве внутренних форматов разные языки XML - среди кодировок спокойно может оказаться UTF-8".

svu ★★★★★
()
Ответ на: комментарий от svu

> Извините, а как Вас угораздило накопить террабайты текстов? Без БД?

Ну, террабайтами нынче никого не удивишь. Я - сотрудник Астрономического Института, а в астрономии об'емы данных тоже астрономические. Впору уже задумываться: а какая там следующая единица, за террабайтами?

Да, да, Вы правы, это хорошо организованная двоичная информация и к Unicode она отношения практически никакого не имеет. А вот, где я имею дело с большим количеством текста, так это в издательстах. Давайте подсчитаем: публикация (книга) среднего размера занимает примерно 1Мб (чистого текста), хранить приходится несколько версий. В год только одно среднее издательство выпускает несколько сотен книг. Итого за 10 лет: 1Мб x 3 x 500 x 10 составит 0.015Тб. Это только одно издательство. Признаюсь, "террабайты" это некоторое преувеличение, но согласитесь, не слишком большое.

> Если же у Вас именно тексты - iconv Вас спасет.

Разумеется, iconv -f=koi8-r -t=utf8 переведет текст в UTF8, но такое прямолинейное решение вряд ли правильно, раз уж переводить все в Unicode, то и специальные символы тоже нужно перевести в соответсвующие символы Unicode, простой iconv здесь не поможет, хотя здесь можно обойтись и элементарными средствами, написав соответствующий скрипт, скажем на Perl'е.

Вопрос в другом. Какое-то, не такое уж малое, время придется работать одновременно и с 8 битной кодировкой и с Unicode. Как такую работу организовать - неизвестно. То есть, как-то это будет сделано, но не хотелось бы изобретать велосипед, желательно иметь какие-то стандартные, общепринятые средства.

Возвращаясь к астрономической тематике, вспомним о TeX'е. Старая система, но ничего лучше для публикации математических текстов не придумано, и вряд ли в ближайшее время положение изменится. Много усилий было положено, чтобы TeX одинаково работал и в CP1251, и в CP866, и в KOI8-R. TeX - восьмибитный просто по своей древности. Сделать его 16 битным не просто. Попытки такие есть, но их результаты пока не стали широкоиспользуемыми. Очевидный путь - пропустить входной поток через какой-то фильтр, например iconv, и выходной поток через аналогичный фильтр. Но, согласитесь, как то это не красиво.

> И, как я уже утверждал, РХ80 - это не для "простых пользователей". > Это "концепт-кар" или revolution #8. Подождите до 8.1 (или, лучше, 8.[23]).

Боюсь что эта проблема не будет решена ни в 8.1, ни в 8.2.

tit
()
Ответ на: комментарий от tit

Да, все эти проблемы, о которых Вы говорите - есть. И их нужно решать. Медленно и постепенно (разумеется, сначала это должны сделать хозяева соотв. софта - напр., ТеХа). Но не делать вид, что 8-битные кодировки - венец прогресса и все попытки заменить их уникодом - никому не нужное прожектерство.

> но не хотелось бы изобретать велосипед, желательно иметь какие-то стандартные, общепринятые средства.

Согласен на 101%. Имеете право стучать башмаком по столу. Или даже лучше - брать Перл в руки и... www.sourceforge.net открыт для создания проектов 24 часа в сутки:) Если серьезно - "искусство еще в большом долгу перед народом". Некоторые базовые тулзы уже есть (iconv). Для конкретных задач, наверное, придется изобретать "по месту". Опять же, если работать с xml - там вы ОБЯЗАНЫ указывать кодировку, поэтому любая сгодится - нормальные парсеры Вас поймут правильно... Про TeX - не знаю. Плохо подумал г. Кнут - нет там в стандарте указания кодировки документа. Может, кто-нибудь займется расширением стандарта?;)

svu ★★★★★
()
Ответ на: комментарий от svu

Посыпаю голову пеплом. Понапраслину я возвел на TeX. TUG'овский народ обо всем позаботился. TeX, кроме проектов, не получивших пока распространения, по крайней мере в России, конечно остается 8-битным, но понимает и Unicode. См. например, <a href="http://www.unruh.de/DniQ/latex/unicode">;. Соответствующий (S)RPMS можно найти на <a href="ftp://ftp.linux-ink.ru/pub/Russian/8.0/RPMS/latex-utf8-0.8-1.noarch.rpm>; </a>.

Надеюсь и остальные вопросы решатся.

tit
()

Все это здорово - вот только поставить его мне не удалось - на 3-х машинах купленный фирменный дистрибутив от UrbanSoft-Lynx (типа CyrillicEdition, на котором 3 первые диска копия iso с сервера RH а на третьем - средства для руссификации) - причем в 1-ой консоли он насыпал полсотни критических ошибок GTK и отвалился в kernel panik при выборе пакетов, в текстовой моде тоже вывалился, ничего не обьяснив - я думал, в машине дело, но ситуация повторилась и еще на 2-х машинах, заведомо рабочих (на одной 7.2 стоит, на второй - он же, но частично обновленный их 7.3) - так что вопрос о том, как же на эту систему перейти остался для меня открытым... Как бы теперь эту гадость на 4-х дисках вернуть продовцам, а то 400 рублей не то, что жалко, но приятнее пропить.

gennik
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.