LINUX.ORG.RU

8
Всего сообщений: 138

юникод, есть ли superscript/subscript для «±»

subj? Смотрел на педивикии но не нашёл, тут тоже пусто. Существует ли оно в виде отдельного символа вообще и как его тогда искать?

 ,

thunar ()

Плохие UTF-8 данные для тестов

Лень выдумывать самому, есть где такие? Что бы были все типы битых сторок и/или намеренно сломанные. Может с приколюхами какими. Главное что бы я смог покрыть все типы кривых строк.

 , , , ,

LINUX-ORG-RU ()

ranger знаки вопросов вместо кириллицы

Есть ли способ заставить ranger понимать кириллицу на кодировке, чуждой системе? Скажем, кодировка системы utf8, но мне нужно работать с флешкой кодированной cp1251.

 , , ,

towe ()

vim неверно перекодировывает файл - сбилась кодировка

Проблема с текстовым файлом. file -bi говорит: text/plain; charset=unknown-8bit, а по идее должен быть charset=utf-8. cat, less, mcedit выводят текстовой файл читаемым, а vim сам его перекодировывает во что-то нечитаемое вместо кириллицы. Графические kate, geany тоже видят кракозябры.

Что не так с файлом, если его базовые утилиты видят нормально, и во что его перекодировать, чтобы убрать проблему?
Как в vim при маркере [перекодировано] отменить перекодировывание обратно, если не знаешь из чего и во что он его перекодировывал?

 , ,

hikikomori ()

Не могу установить русскую локаль в Centos 8

Может показаться, что вопрос избитый, но я специально проверил настройки в centos 7 и 8, они одинаковые - локаль и /etc/vconsole.conf. Все ставлю из минималки со стандартными настройками. Но в 8 что-то не работает и русские символы отображаются или знаками вопроса или кодами utf8. localectl set-locale LANG=ru_RU.UTF-8 не отличается от LANG=ru_RU.utf8. Больше идей нет.

ls -al ...

drwxrwxrwx   2 1000 root 430 Jan  2 22:12 ''$'\320\244\320\270\320\273\321\214\320\274\321\213'

locale

LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=

localectl status

   System Locale: LANG=ru_RU.UTF-8
       VC Keymap: us
      X11 Layout: ru,us
       X11 Model: pc105
     X11 Options: terminate:ctrl_alt_bksp,grp:shifts_toggle,grp_led:scroll

 , ,

Lordwind ()

LaTeX <-> python

А есть-ли для python пакеты, позволяющие автоматически преобразовывать LaTeXную диакритику в utf8 и обратно? Например

{Tom\'{a}\v{s}} <-> Tomáš

 , ,

thunar ()

Проблемы с unicode на арче.

В общем, у меня проблемы с отображением некоторых utf8 символов, а точнее U+2420 и U+2409.

Я раньше такой же набор символов использовал в vimrc на федоре, а вот после переезда на arch всё отвалилось (firefox, geany и vim).

Пробовал несколько шрифтов (те nerdfonts, что стояли раньше + парочка системных), результат такой же везде.

 , , , ,

ZERG ()

[РЕШЕНО] strtoupper и кирилица 2

strtoupper (туловер тоже) превращает русские символы в знаки вопроса.

Эту тему читал: [php] strtoupper и кирилица но она не совсем про это.

PHP Version 7.0.32

mbstring.detect_order	no value	no value
mbstring.encoding_translation	Off	Off
mbstring.func_overload	2	2
mbstring.http_input	UTF-8	UTF-8
mbstring.http_output	UTF-8	UTF-8
mbstring.http_output_conv_mimetypes	^(text/|application/xhtml\+xml)	^(text/|application/xhtml\+xml)
mbstring.internal_encoding	UTF-8	UTF-8
mbstring.language	Russian	Russian
mbstring.strict_detection	Off	Off
mbstring.substitute_character	no value	no value

CentOS 7.

mb_convert_case('текст', MB_CASE_UPPER, «UTF-8»); работает нормально и пока использую его. Но что с strtoupper?!

UPD: нифига не нормально работает. Если первый символ текста уже капсом и кириллица, то она превращается в ?. Приходится присоединять пробел, а потом делать trim.

UPD2: Приношу всем извенения - моя ошибка - я не корректно провел исходное тестирование. Похоже сильно устал вчера. Проблема заключалась в том, что одна из библиотек, загружающаяся при инициализации проекта делала так:

mb_internal_encoding('ASCII');

 , , ,

Suntechnic ()

revtex с библиографией (utf8)

А может ли кто подкинуть рабочий шаблон статьи в ревтехе, с полной поддержкой юникода (и команды сборки)? Внезапно, обнаружил, что при сборке обычным latexmk теряются все неascii-буквы, а если подключаю \usepackage[utf8]{inputenc}, то начинается ругань на западноевропейские символы в bib-файле. Как оно забарывается?

 , , ,

thunar ()

вопрос про юникод

$ python
Python 3.6.4 (default, Jan  5 2018, 02:35:40) 
[GCC 7.2.1 20171224] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> print(bytes("И", "utf-8"))
b'\xd0\x98'
>>> print("\ud098")
킘
>>> print("\u98d0")
飐
>>> 

разве не должно быть «И» в одном из print'ов?

$ echo "И" > test
$ cat test 
И
$ hexdump test 
0000000 98d0 000a                              
0000003
$ 

я точно чего то не знаю о юникоде. и в его стандарте вроде какой то другой диапазон для русских букв.

Перемещено leave из talks

 , , ,

iluha16 ()

Сломалась кириллица в консоли слэквари

Привет, All.

Набор кириллицы в консоли выглядит кириллицей, но bash-4.3$ touch ТожеКириллица; ls выдает либо строчку восьмеричных кодов (вида «\260\342...») в tty1, либо строчку вопросительных знаков (в konsole). У MidnightCommander что-то непонятное с субшеллом - тут вопросы, а под Ctrl-O - кириллица...

/etc/rc.d/rc.font: setfont -v UniCyrExt_8x16.psf.gz

/etc/rc.d/rc.keymap: if [ -x /usr/bin/loadkeys ] then /usr/bin/loadkeys ruwin_ct_sh-UTF-8.map; fi

/etc/profile.d/lang.sh: export LANG=en_US.UTF-8

/etc/lilo.conf: append =" vt.default_utf8=1"

Есть еще пара скриптов для переключения локали: export LANG=en_US.UTF-8; echo -ne «\033%G» и export LANG=ru_RU.UTF-8; echo -ne «\033%G»

Да, все перечисленные скрипты executable. Вот еще: bash-4.3$ locale locale: Cannot set LC_ALL to default locale: No such file or directory LANG=en_US.UTF-8 ... LC_COLLATE=C ... LC_ALL= Поломалось, вроде, после установки с последующим откатом назад ряда пакетов из линейки slackware64-current.

С наилучшими, Максим.

 , , , ,

RabidDog ()

Нестандартные символы и utf8 в mysql, считает символы Ş и S одинаковыми

Привет

Странная штука произошла, по идее в базе с кодировкой в поле varchar слова AKKUŞSAN и AKKUSSAN должны считаться разными, но уникальный индекс считает их одним словом и выдает ошибку duplicate key

Кодировка базы utf8mb4, по идее оно должно правильно работать, так как Ş обычный юникодный символ

Это баг или так и должно быть ?

mariadb 10.1

 , ,

ism ()

проблемы с кодировкой в названии файлов

Перенес файлы с одного сервера на другой. Некоторые символы в названиях файлов стали отображаться как квадраты, например «№». Причем с этими файлами нельзя ничего сделать через файлменеджер, ни удалить, ни переименовать, т.к. пишет что файл не сущетвует (а его видно).


Вопрос в том, что сделать, чтобы названии таких файлов корректно отображались все символы?

 , ,

la_boum ()

Есть ли не зависимые от DE алтернативы «gucharmap», «gnome-characters», «kcharselect»?

Нужна простенкая программа с GUI для просмотра и ввода символов, доступных в конкретном шрифте.

Без зависимостей GTK+/KDE

 , ,

atsym ()

Не отображаются некоторые Unicode символы в Debian Stretch

Недавно заметил, что некоторые Unicode символы криво отображаются в системе. Например, https://unicode-table.com/en/1F5D8/ отображается в виде квадратиков в Firefox, Chrome, LibreOffice

https://i.stack.imgur.com/LI0MZ.png

При этом у товарища на Debian Buster отображение нормальное.

root@storm:/# gnome-shell --version
GNOME Shell 3.22.3
root@storm:/# uname -r
4.9.0-4-amd64
root@storm:/# locale
LANG=en_US.UTF-8
LANGUAGE=en_US:en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=en_US.UTF-8
LC_TIME=en_US.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=en_US.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=en_US.UTF-8
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT=en_US.UTF-8
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

Пакет «ttf-mscorefonts-installer» установлен, хотя не уверен, что дело в шрифте.

 , , ,

RomaNNN ()

Чем в Си можно выцыпить символ из utf8 строки?

В общем и весь вопрос.

 ,

normann ()

Поиск русского текста в файлах

Как найти файл с русским текстом в неизвестной кодировкой (одной из четырех)?

 , , ,

linuks ()

Современные приложения, работающие с однобайтовыми именами ф.с.

Остались ли до сих пор программы, которые поддерживают Load/Save в файлы на файловых системах с однобайтовой кодировкой?

Для этого обычно используется библиотека iconv?

Как программа детектит кодировку ф.с.?

Какие ф.с. имеют под Linux ключики, задающие принудительно кодировку при mount?

 , , ,

pacify ()

Как дела с UTF-8 во FreeBSD

Добрый день. При установке FreeBSD не нашёл в списке предложенных локалей UTF-8 и задался вопросом: а как с ней дела во FreeBSD? Нашёл информацию о том, что в драйвере vt (newcons) есть поддержка UTF-8, и даже нашёл инструкцию о том, как включить vt, равно как и инструкции насчёт настройки UTF-8 для всего остального, но все они - 10-летней давности и местами содержат упоминания о проблемах вроде неправильного отображения псевдографики, или требования отдельной настройки для $некоторая_программа и т.д. Пожалуйста, просветите - как _сейчас_ обстоят дела с UTF-8 во FreeBSD, можно ли его раз и навсегда быстро и легко настроить и не париться, иметь в этом смысле совместимость по кодировке имен/содержимого файлов и т.д. Ну и может кто в курсе - почему UTF-8 ещё не по умолчанию, и есть ли планы по изменению дефолта? Заранее спасибо.

 , , , ,

Norong ()

UTF-8 и UTF8 разные кодировки

Опытным путем и с треском для проекта, удалось определить, что UTF-8 и UTF8 совсем разные кодировки!

Как же такое могло произойти, и почему разработчики такое допустили?

Следующие строки дают разные результаты, причем во втором случае это "???" знаки вопросов вместо текста, при выборке с использованием mysqli_query.

mysqli_query($mysqlcon, "SET NAMES utf8");
mysqli_query($mysqlcon, "SET NAMES utf-8");

 , , , ,

morkovkin ()