Помогите новичку с вопросом по c++

0

1

Подскажите пожалуйста как в с++ заставить переменную типа char правильно понимать русские символы? Допустим в простом примере:

#include "iostream"
int main()
{
 char a = '0';
 std::cout << "Введите символ:\n"; 
 std::cin >> a;
 std::cout << "Вы ввели символ '" << a << "'\n" ;
 return 0;
}

При вводе «ф» программа выдает: Вы ввели символ '�'

Ссылка

← [python][магия]Подскажите, почему не работает??

Принципиальный вопрос о многопоточности, кешах ЦП. →

Русская 'ф' занимает один байт (а именно столько может вместить char) далеко не во всех кодировках.

Попробуйте std::string вместо char.

kulti ★★
(06.02.12 00:28:53 MSK)

Ты пытаешься ввести двухбайтный unicode-символ в однобайтную переменную. Вводится только первый байт, он же потом и выводится. Попробуй тип wchar_t.

#include «iostream»

Кавычки лучше ставить, когда заголовок лежит в том же каталоге, что и исходник, иначе надо писать так:

#include <iostream>

gentoo_root ★★★★★
(06.02.12 00:29:21 MSK)

Как-то так:

#include <iostream>
#include <locale>

int main()
{
 std::locale l("ru_RU.utf8");
 std::locale::global(l);
 wchar_t a = L'0';
 std::wcout << L"Введите символ:\n";
 std::wcin >> a;
 std::wcout<<a;
 std::wcout << L"Вы ввели символ '" << a << L"'\n" ;
 return 0;
}

Waterlaz ★★★★★
(06.02.12 00:36:44 MSK)

Ответ на: комментарий от Waterlaz 06.02.12 00:36:44 MSK

А вот пример того, почему iostream - говно:

#include <iostream>
#include <locale>

int main()
{
 std::locale l("ru_RU.utf8");
 std::locale::global(l);
 wchar_t a = L'0';
 std::cout<<"trololo\n"; // этот cout ломает всё, хотя сам по себе вполне корректен
 std::wcout << "Введите символ:\n";
 std::wcin >> a;
 std::wcout<<a;
 std::wcout << L"Вы ввели символ '" << a << L"'\n" ;
 return 0;
}
[[/code]]

Waterlaz ★★★★★
(06.02.12 00:41:51 MSK)

Ответ на: комментарий от kulti 06.02.12 00:28:53 MSK

Так со string никаких проблем не возникает, просто string занимает несколько больше чем char, или нет (именно на примере 1-ого символа)?

hikkikamori
(06.02.12 00:46:47 MSK) автор топика

Ответ на: комментарий от gentoo_root 06.02.12 00:29:21 MSK

спасибо, буду знать

hikkikamori
(06.02.12 00:53:08 MSK) автор топика

Ссылка

Ответ на: комментарий от hikkikamori 06.02.12 00:46:47 MSK

> Так со string никаких проблем не возникает, просто string занимает несколько больше чем char, или нет (именно на примере 1-ого символа)?

char — историческое обозначение байта в с/с++. на дворе уже третье тысячелетие, и длина символа давно переросла один байт (винду не считаем).

arsi ★★★★★
(06.02.12 00:54:58 MSK)

Ответ на: комментарий от Waterlaz 06.02.12 00:36:44 MSK

Спасибо принцип понял , только std::wcout<<a; тут кажется лишней. А разве Linux по умолчанию не utf8 использует?

 
hikkikamori@debian:~$ locale
LANG=ru_RU.utf8
LANGUAGE=
LC_CTYPE="ru_RU.utf8"
LC_NUMERIC="ru_RU.utf8"
LC_TIME="ru_RU.utf8"
LC_COLLATE="ru_RU.utf8"
LC_MONETARY="ru_RU.utf8"
LC_MESSAGES="ru_RU.utf8"
LC_PAPER="ru_RU.utf8"
LC_NAME="ru_RU.utf8"
LC_ADDRESS="ru_RU.utf8"
LC_TELEPHONE="ru_RU.utf8"
LC_MEASUREMENT="ru_RU.utf8"
LC_IDENTIFICATION="ru_RU.utf8"
LC_ALL=

и ещё в строчках std::locale l(«ru_RU.utf8»); std::locale::global(l); - l - маленькая, а допустим в wchar_t a = L'0'; - L - заглавная, почему?

hikkikamori
(06.02.12 01:03:25 MSK) автор топика

Ответ на: комментарий от arsi 06.02.12 00:54:58 MSK

т.е. char в с++ желательно обходить?

hikkikamori
(06.02.12 01:05:37 MSK) автор топика

Ответ на: комментарий от hikkikamori 06.02.12 01:05:37 MSK

> т.е. char в с++ желательно обходить?

куда обходить? о_О

char — это байт (8+ бит, согласно стандарту). постоянно используется при работе с «сырыми» данными или с ascii/latin1. в других случаях лучше «обходить» и использовать singned char/unsigned char вместо непостоянного char, но это уже из другой оперы :)

arsi ★★★★★
(06.02.12 01:11:53 MSK)

man wchar_t

shty ★★★★★
(06.02.12 01:12:35 MSK)

Ответ на: комментарий от shty 06.02.12 01:12:35 MSK

man std::string

~~r2d2~~
(06.02.12 01:13:43 MSK)

Ответ на: комментарий от arsi 06.02.12 01:11:53 MSK

Да! Ты правильно меня понял :) спасибо за ответ, теперь есть от чего скакать дальше. Начал читать книгу Страуструпа «Принципы и практика использования C++», а там к сожалению про ввод и вывод русских символов ничего не написано, что кажется вполне логичным.

hikkikamori
(06.02.12 01:28:02 MSK) автор топика

Ссылка

Ответ на: комментарий от hikkikamori 06.02.12 01:03:25 MSK

Спасибо принцип понял , только std::wcout<<a; тут кажется лишней.

Да, лишнее.

А разве Linux по умолчанию не utf8 использует?

В большинстве дистрибутивов - да. Но это не имеет значение. В идеале, следовало бы прочитать значение переменной окружения LANG и использовать локаль оттуда:

#include <iostream>
#include <locale>
#include <stdlib.h>

int main()
{
    std::locale l(getenv("LANG"));
    std::locale::global(l);
    wchar_t a = L'0';
    std::wcout << L"Введите символ:\n";
    std::wcin >> a;
    std::wcout << L"Вы ввели символ '" << a << L"'\n" ;
    return 0;
}
[[/code]]

[quote]и ещё в строчках std::locale l("ru_RU.utf8"); std::locale::global(l); - l - маленькая, а допустим в wchar_t a = L'0'; - L - заглавная, почему?[br][/quote]маленькая l - объект locale. Большая L - способ записи "юникодных" констант строк и символов. 

"Hello" - строка char
L"Hello" - строка длинных символов (юникод).

Waterlaz ★★★★★
(06.02.12 01:29:10 MSK)

Ответ на: комментарий от r2d2 06.02.12 01:13:43 MSK

man std::wstring

а если хочется вменяемого сразу решения - man ICU или, если используешь Qt, - QString

shty ★★★★★
(06.02.12 01:32:02 MSK)

Ссылка

Ответ на: комментарий от Waterlaz 06.02.12 01:29:10 MSK

Waterlaz благодарю за ответ, вы с arsi мне очень помогли :)

hikkikamori
(06.02.12 01:50:08 MSK) автор топика

Ссылка

Ответ на: комментарий от Waterlaz 06.02.12 00:41:51 MSK

А вот пример того, почему iostream - говно:

Нет, это пример почему нужно читать документацию перед написание программ. Попробуй так:

#include <iostream>
#include <locale>
#include <clocale>

int main()
{
 std::setlocale(LC_ALL, "");
 std::locale l("");
 std::locale::global(l);
 std::cout.imbue(l); 
 std::cerr.imbue(l); 
 std::clog.imbue(l); 

 std::wcout.imbue(l); 
 std::wcerr.imbue(l); 
 std::wclog.imbue(l); 
 std::ios::sync_with_stdio(false);
 wchar_t a = L'0';
 std::cout<<"trololo"<<std::endl; // RTFM
 std::wcout << L"Введите символ:"<<std::endl;
 std::wcin >> a;
 std::wcout<<a;
 std::wcout << L"Вы ввели символ '" << a <<std::endl;
 return 0;
}

Eshkin_kot ★★
(06.02.12 11:54:35 MSK)

Ответ на: комментарий от Eshkin_kot 06.02.12 11:54:35 MSK

Прекрасный пример того, какое говно iostream.

Waterlaz ★★★★★
(06.02.12 14:02:22 MSK)

Ссылка

Введите символ:
а
Вы ввели символ 'а'

Введите символ:
ф
Вы ввели символ 'ф'

Введите символ:
ы
Вы ввели символ 'ы'

Введите символ:
ЪВы ввели символ 'Ъ'

☺

~~Eddy_Em~~ ☆☆☆☆☆
(06.02.12 14:07:51 MSK)

Ответ на: комментарий от Eddy_Em 06.02.12 14:07:51 MSK

нехорошо, ой как нехорошо светить своей КОИ-8

do0dlez ★★
(06.02.12 14:42:25 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← [python][магия]Подскажите, почему не работает??

Development

Принципиальный вопрос о многопоточности, кешах ЦП. →

Похожие темы