LINUX.ORG.RU

Иероглифы и квадратики в строке


0

0

Привет. Такой вопрос: есть строка с квадратиками и иероглифами, нужно их отсечь и оставить только русские буквы английские пробел и цифры, есть ли стандартные методы, или только циклом перебирать все буковки?

★★★

Последнее исправление: pozitiffcat (всего исправлений: 1)

Ответ на: комментарий от x3al

я в DOS кодировку перевожу, мне это актуально, поидее ненужные символы должны отсекаться, но квадратики остаются

pozitiffcat ★★★
() автор топика
Ответ на: комментарий от pozitiffcat

Ну и отсеки их в DOS-кодировке. Там это делается намного проще, чем в юникоде.

циклом перебирать все буковки?

Э? Они же в непрерывных диапазонах.

x3al ★★★★★
()
Ответ на: комментарий от pozitiffcat

Изначально текст в Дос кодировке, я преобразовываю в юникод а там квадратов много помимо текста. Чтобы отсеч не нужные символы для этого я брал в массив чар засовывал строку, со всеми буквами русского, английского, большие, маленьке бууквы, перекодировал эту строку в дос, и ты еще оставалась в дос и прогонял цикл, там где буква не совпадает с набором правильных символов, убирать букву.. но почемуто этот метод не «прокатил» я в шоке чё за аномалия.. вот и думаю мож заюзать какой нибудь, стандартный способ если есть.

pozitiffcat ★★★
() автор топика
Ответ на: комментарий от Deleted

Спасибо всем за внимание, разобрался сам. Просто я когда выделял память по массив char нужно было обнулять символы вот и все =)

pozitiffcat ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.