LINUX.ORG.RU
ФорумTalks

Нужны ли заглавные буквы в юникоде?

 


0

1

В самом деле, ведь заглавная буква - это не другая буква, это другое начертание той же буквы. Тогда зачем иметь отдельные коды для заглавных и маленьких букв? Не разумнее ли иметь отдельные коды для букв, а признак заглавности - специальный модификатор? Ну и если он стоит, то для буквы берем не обычное ее начертание, а другое, заглавное.

★★★★★

это не другая буква, это другое начертание той же буквы

Весьма спорная точка зрения. Другое начертание: это, например, курсив. А заглавная - это уже немного другая штука.

Deleted ()

Как быть тогда с языками, где нет заглавных?

beastie ★★★★★ ()
Ответ на: комментарий от beastie

Не ставить модификатор «заглавности».

Deleted ()

Шрифт заглавных букв, шрифт строчных? Как со шрифтами для каждого начертания?

baka-kun ★★★★★ ()
Ответ на: комментарий от beastie

Как быть тогда с языками, где нет заглавных?

Как с теми, где нет курсива и полужирного?

baka-kun ★★★★★ ()
Ответ на: комментарий от Deleted

Модификатор «заглавности» и есть отдельный codepoint. В чём Профит тогда?

beastie ★★★★★ ()

Честно говоря, вообще не понимаю смысла существования заглавных букв.

sT331h0rs3 ★★★★★ ()
Ответ на: комментарий от StReLoK

Что значит «фас»? С одной стороны, наличие модификаторов - один из главных минусов юникода. С другой стороны, они в нём уже есть, и убирать их из него вряд-ли кто будет. И в этом контексте сколько и каких конкретно модификаторов в юникоде никакой погоды уже не делает. В этом смысле есть только две разных погоды - «модификаторов вообще нет» и «модификаторы таки есть».

saahriktu ★★★★★ ()
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от sT331h0rs3

Честно говоря, вообще не понимаю смысла существования заглавных букв.
Честно

Однако же пользуешься.

AP ★★★★★ ()
Ответ на: комментарий от sT331h0rs3

Примеров можно привести кучу, но самый простой - более наглядное начало нового предложения.

Deleted ()
Ответ на: комментарий от Deleted

Ну так сколько в русском языке букв - 33 или 66?

cvs-255 ★★★★★ ()
Ответ на: комментарий от cvs-255

Это всего лишь терминология. К примеру, можно сказать так: есть типографское понимание буквы и есть ее лингвистическое понимание.

В шрифтовых файлах, насколько я помню, вообще не оперируют понятием «буква». Там понятие «глиф».

То есть, «а» и «А» - одна буква, но два глифа. Более того, «а» курсивная - это уже третий глиф.

Deleted ()
Ответ на: комментарий от AP

Пользуюсь скорее по привычке. Таковы уж правила языка.

sT331h0rs3 ★★★★★ ()
Ответ на: комментарий от Deleted

это тогда три варианта будет - то есть больше одного бита на фигню эту

xmikex ★★★ ()

Заглавные буквы-то нужны (порой, в разных языках они сильно по-разному пишутся), а вот кодировки - не нужны. Например, буква С русская и C английская пишутся абсолютно одинаково, и можно было б сэкономить.

tiinn ★★★ ()
Ответ на: комментарий от tiinn

Например, буква С русская и C английская

Это вообще чья-то злая шутка. На qwerty-клавах они находятся на одной кнопке. Можно не ту поставить. (Актуально для кодинга или если потом будешь делать поиск по тексту).

Deleted ()
Ответ на: комментарий от Deleted

Более того, «а» курсивная - это уже третий глиф.

ну так что тогда, давайте для курсивных букв отдельный код?

cvs-255 ★★★★★ ()
Ответ на: комментарий от tiinn

Заглавные буквы-то нужны

Конечно нужны. Как и курсивные, и жирные, и с завитушками.

cvs-255 ★★★★★ ()

Как быть с капителью? Это начертание строчной, но соответствующее внешне прописной.

grem ★★★★★ ()
Ответ на: комментарий от cvs-255

Фиг знает. Загнал меня в дискуссионный тупик.

Еще я не уверен, не приведет ли описанная тобой схема к коллизиям в языках программирования, в которых важен регистр букв?

Deleted ()
Ответ на: комментарий от Deleted

Ну по идее, компилятор должен будет понимать юникод

cvs-255 ★★★★★ ()
Ответ на: комментарий от xmikex

Почему 3? Заглавная или не заглавная. Какой третий-то?

Deleted ()
Ответ на: комментарий от Deleted

А заглавная буква - это уже немного другая штука.

А заглавная цифра?

Dendy ★★★★★ ()
Ответ на: комментарий от Dendy

С технической точки зрения - не знаю.

Но вообще, «арабские» цифры, которыми мы пользуемся при наборе текстов на форуме - это как раз заглавные, «большие». В некоторых шрифтах есть минускульные, они же old-style цифры - т.е. «маленькие».

https://cdncms.fonts.net/images/5231ceea2850a9c9/B_Oldstyle_Figures.jpg

Deleted ()
Ответ на: комментарий от Deleted

Почему 3? Заглавная или не заглавная. Какой третий-то?

Суперзаглавная.

Вы удивитесь, но один мой знакомый из полиграфии, корректирующий книги, рассказал, что для заглавных букв используется другой шрифт, размер и начертание. И это нормальная практика, иначе петачный текст будет ШГ.

Dendy ★★★★★ ()
Ответ на: комментарий от Deleted

Первый раз вижу... Это где-то используется?

thunar ★★★★★ ()
Ответ на: комментарий от Dendy

Насколько я знаю, используется более светлое начертание.

К примеру, в MS Office дефолтный шрифт основного текста - Calibri, 11 пунктов. Заголовок же (Title) - 26 пунктов, шрифтом Calibri Light. Потому что обычный Calibri, хорошо смотрящийся в мелких кеглях, в крупных выглядит топорно.

Deleted ()
Ответ на: комментарий от Dendy

Юникод не имеет никакого отношения к шрифту, размеру и начертанию.

Deleted ()
Ответ на: комментарий от thunar

Кое-где видел. Сам уже не помню где. Очень редко.

Deleted ()
Ответ на: комментарий от Deleted

А в Адобовских шрифтах с этой целью встраивают optical size.

Deleted ()
Ответ на: комментарий от Deleted

Юникод не имеет никакого отношения к шрифту, размеру и начертанию.

В нём предусмотрены заглавные буквы. Это по сути другой шрифт и/или размер.

Dendy ★★★★★ ()

Il Il
заглавные буквы вообще не нужны и просто бред уровня «исторически сложилось».
не знаю какая теория вернее про появление заглавных, но если идея была сделать «удобнее» — это фэйл.
какого хрена мне нужно распознавать разные глифы как тот-же символ, но типа с дополнительной информацией о структуре предложения (начало предложения), точки не достаточно, да?

system-root ★★★★ ()
Ответ на: комментарий от system-root

Точка используется не только как окончание предложения. А так будет дополнительное указание на начало предложения.

cvs-255 ★★★★★ ()
Последнее исправление: cvs-255 (всего исправлений: 1)
Ответ на: комментарий от system-root

Если не ошибаюсь, долгое время была только заглавная латиница. Маленькие буквы появились позже, и их внешний вид был «скопирован» из рукописного письма.

Deleted ()

А еще можно сделать один символ для обозначения конца предложения, а модификатором обозначать, какой именно. Лингвисты ликуэ.

abraziv_whiskey ★★★★★ ()
Ответ на: комментарий от system-root

Вы из революционеров, что против? Согласен, что так сложилось исторически, в алфавите буква одна, а размеров два. Таким образом оно и до однобайтовых кодировок добралось, благодаря чему в ЯП имеем CamelCaseStyle, snake_style, MACRO_STYLE, spONgEbOb_STylE. А сложилось бы, скажем, использование жирных букв, кто знает какой бы зоопарк стилей кодирования был бы сейчас.

Dendy ★★★★★ ()
Последнее исправление: Dendy (всего исправлений: 1)
Ответ на: комментарий от Dendy

Стиль «Эппл-][» сложился бы. Там не было строчных букв, а в некоторых случаях для обозначения заглавной буквы использовался инверсный символ.

abraziv_whiskey ★★★★★ ()

В самом деле, ведь заглавная буква - это не другая буква, это другое начертание той же буквы.

што што што?

targitaj ★★★★★ ()
Ответ на: комментарий от sT331h0rs3

чтобы выделить, например, обращение к Существу от рассказы про вещество

targitaj ★★★★★ ()
Ответ на: комментарий от cvs-255

Хм, а вот это хорошо подмечено. В алфавите 33 ячейки, ага. В каждой ячейке по две буквы.

targitaj ★★★★★ ()
Ответ на: комментарий от targitaj

чтобы выделить, например, обращение к Существу от рассказы про вещество

Можно пофантазировать: +существо приняло -вещество @тчк

Dendy ★★★★★ ()
Ответ на: комментарий от beastie

с последним есть проблема: он не равен константе.

ckotinko ☆☆☆ ()
Ответ на: комментарий от cvs-255

точка используется не только как окончание предложения. а так будет дополнительное указание на начало предложения.

если представить себя на месте человека, который с латиницей и греческим никогда не был знаком, это же вынос мозга.
Точка, точка, точка — одно и тоже слово? ну ок, у первого и последнего разница только в размере, это нормально, а слово в середине?
"А так будет", «а так будет», «А ТАК БУДЕТ» — да тут 50% символов друг на друга не похожи, это точно не три разные фразы или не на разных языках?
оверкомпликейтед это всё, а не дополнительное указание.
просто нативам легко в этот бред ценою пары лет обучения в детстве, хотя можно было потратить это время на что-то полезное.

system-root ★★★★ ()
Ответ на: комментарий от system-root

эээээ дарагой, в твоём примере все буквы - ПЕЧАТНЫЕ. Давай ты рукописные сравнишь.

targitaj ★★★★★ ()
Последнее исправление: targitaj (всего исправлений: 1)
Ответ на: комментарий от targitaj

рукописные это вообще отдельная тема.
мне вчера нужно было сравнить точно ли переписан текст с экрана на бумагу, так там это.. арабская вязь какая-то. пришлось тому, кто писал читать вслух свои «рукописные каракули»

system-root ★★★★ ()
Последнее исправление: system-root (всего исправлений: 1)

Пробел тоже введён условно. Как пример, в иероглифах древности не было пробелов. Это условно придумано для удобства чтения нашими куриными мозгами.

xwicked ★★ ()
Ответ на: комментарий от Deleted

Прописная, строчная, капитель. Ещё вот суперзаглавную выше подсказывают.

grem ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.