LINUX.ORG.RU

Файловая система: Регистро-зависимая vs Регистро-независимая

 , osx, ,


0

1

Добрый день!

В одном из топиков была поднята «данная тема».
Поделитесь мнением: что/как/для чего/лучше/хуже/правильно/неправильно итд

Можно и просто побалагурить на «тему».

спасибо

p.s.
- поднятая тема в топике была: правильно / неправильно (т.е. this - это единственно правильно потому-то и потому-то или наоборот... или просто мысли на тему)

мне-то все давно понятно.
я завел эту тему, что-бы продолжить обсуждение тут а не в «офтоп-теме».
т.е то, что вы «тут обьясняете», вы объясняете, по сути, не мне, а «сообществу»

★★★★★

Последнее исправление: sunjob (всего исправлений: 1)
Ответ на: комментарий от watchcat382

Они могут назвать файл транслитом или каким-нибудь сокращением из латинских букв.

Зачем? Так читать неудобно. Мне вот например сложно читать русский язык в транслите. Больше времени будет тратится на поиск и выбор файла глазами.

Это допустимо если не предполагается пересылать файлы туда где не знают японского.

А это и не предполагается. Значительная часть бизнеса работает на внутренний рынок и нет необходимости пересылать документы заграницу. У вас какое-то профессиональное искажение разработкой открытого ПО.

X512 ★★★★★
()
Ответ на: комментарий от user_undefined

проще класть все документы за год в один каталог, без разбивки по типам

Я для подобного рода информации использую карточки org-roam. Так как карточка обладает разными заголовками и входит в разные иерархии одновременно, просто воссоздав логику как я мог это назвать и с какими другими карточками соединить, получается более-менее быстро всё отыскать.

ugoday ★★★★★
()
Ответ на: комментарий от X512

Программы, у которых проблемы с юникодом или пробелами в именах файлов отравляются в /dev/null.

А если программа узкоспецифична и альтернативы просто нет? В качестве примера - прошивальщики всяких железок, особенно не официальные. Их авторы фокусируются на основной задаче - прошить и не окирпичить железку. Заниматься написание побработки всех возможных ситуаций с юникодом они не будут.

watchcat382
()
Ответ на: комментарий от user_undefined

без проблем

И в какой из этих локалей у вас в системе описана эквивалентность русских букв Т-большое и т-маленькое?

К тому же судя по тому что у вас вообще вводится в командной строке и отображается слово «тест» - русский у вас на компе таки настроен. А вот что осталось «за кадром» - это вопрос.

watchcat382
()
Ответ на: комментарий от user_undefined

Допустим, как мне именовать файлик «Общий анализ крови.pdf»?

Если не собираетесь ехать в другую страну и показывать этот файл врачам там - то можно и по-русски. А вот если соберетесь - то таки придется переименовать. Ибо с высокой вероятностью у них на экране вместо русских букв будут крокозяблики или пустые места. А если даже вдруг русские буквы - то они их всё равно не знают.

прочитать доку по контроллеру это одно, объяснить таксисту как подъехать к дому - совсем другое.

Согласен.

watchcat382
()
Ответ на: комментарий от watchcat382

ебстебственно :) ибо в локали и прописывается преобразования регистра, и не только.
нет. при наличии текста в utf ни одна локаль не будет корежить буквы стороннеего языка, ибо код любой внесенной буквы в utf уникален. в чужой локали в таблице преобразования регистров просто не будет подходящих кодов.

pfg ★★★★★
()
Ответ на: комментарий от watchcat382

А если даже вдруг русские буквы - то они их всё равно не знают.

ВНЕЗАПНО! Ему, зато, очень поможет (нет), что файл ObstschijjAnalizKrovi.doc набран латиницей. Сразу поймёт, что здесь делать (тоже нет).

ugoday ★★★★★
()
Ответ на: комментарий от watchcat382

таблицу преобразования регистров могут впихнуть и в какуюнить дефолтную локаль… ибо универсальна для всех языков в UTF.
или вообще захаркодить, она меняется крайне редко или вообще уже давно не меняется.
сейчас в УТФ всякую медиахрень льют.

pfg ★★★★★
()
Последнее исправление: pfg (всего исправлений: 1)
Ответ на: комментарий от watchcat382

Например я учился русскому языку в школе на рубеже 70-80х. И вижу что современный русский довольно заметно отличается, особенно у молодых людей

А давай проведем эксперимент в комментариях. Прочитай:

К учению о методах. Какой-то естествоиспытатель произвел следующий опыт: в стеклянный сосуд, разделенный на две половины стеклянной же, совершенно прозрачной перегородкой, поместил по одну сторону щуку, а по другую — разную мелкую рыбу, которая обыкновенно служит щуке добычей. Щука не заметила прозрачной перегородки и бросилась на добычу, но, разумеется, только зашибла пасть. Много раз проделывала она свой опыт — и все с теми же результатами. Под конец, видя, что все ее попытки так печально кончаются, щука уже больше не пробовала охотиться, так что даже когда через несколько дней перегородку вынули, она продложала спокойно плавать между мелкой рыбой и уже боялась нападать на нее… Не происходит ли то же и с людьми? Может быть, их предположения о границах, отделяющих «посюсторонний» мир от «потустороннего», тоже, в сущности, опытного происхождения и вовсе не коренятся ни в природе вещей, как думали до Канта, ни в природе нашего разума, как стали утверждать после Канта. Может быть, перегородка действительно существует и делает тщетными обычные попытки перебраться за известные пределы познания — но, вместе с тем, может быть, в нашей жизни наступает момент, когда перегородка уже вынута. Но тогда в нас уже прочно укоренилось убеждение, что дальше известной черты нельзя идти, что дальше будет больно.

А теперь попробуй угадать год, не гугля.

Vidrele ★★★★★
()
Ответ на: комментарий от user_undefined

Допустим, как мне именовать файлик «Общий анализ крови.pdf»? «Obshii analiz krovi» или «Complete Blood Count»?

Лучше всего, конечно Comprehensive_Metabolic_Panel.pdf, чтобы было понятно и тем, кто знает английский. Это шутка, если что.

VIT ★★
()
Ответ на: комментарий от watchcat382

Тогда выдумывать костыли специально для этой программы. Иногда даже возникает необходимость запускать кривой софт в виртуальной машине. Не надо подстраивать всё под самое говно.

X512 ★★★★★
()
Ответ на: комментарий от kaldeon

1960-1980

Мне, тогда ещё студенту, на заседании философского клуба текст показался неожиданно современным. Сейчас я более наблюдателен и тоже вижу 60–70-е. Но можешь погуглить. Интригу раскроем, когда Вотчкрафт ответит.

Vidrele ★★★★★
()

Белгло пролистал тред.

Юникод решил проблему «кракозябр» в именах файлов. Одна кодировка всем. Это данность.

Если кто-то отправляет собеседнику файл названный на языке непонятном получателю - это не техническая проблема. Это отправитель - чудак на букву м.

Если кто-то называет файл «👉👌🤌.mkv» - это не техническая проблема. Это неисправленная педагогическая запущенность.

Если кто-то в файле Ls хранит сорцы из которых собирается бинарный ls, при сборке создаётся временный LS, а ошибки он пишет в lS и всё в одном каталоге - это чудак с неисправленной педагогической зависимостью. Его изолировать от общества надо, а не учитывать эти девиации.

Пробелы в имени файла - не проблема. Если пользователь работает в среде, где пробел - спецсимвол, он должен уметь его экранировать и пользоваться автодополнением. Не умеет - пусть идёт на курсы компьютерной грамотности, или окончательно отдаётся в рабство бигтеху (в онлайн сервисах «проблемы пробела» нет).
Если среда не может корректно обрабатывать пробелы в имени файла - это баг, его надо исправлять.

По вопросу из ОП: имя объекта ФС должно быть в нижнем регистре. Можно хранить и то «как пользователь писал», чтобы на экран выводить (но не обязательно, ибо лишнее место), а разрешать путь только приведя его в нижний регистр и вырезав непечатные символы и разделители.
Винде прекратить мракобесие и использовать слеши по назначению: прямой - разделитель, обратный - экранирование.

mogwai ★★★★★
()
Ответ на: комментарий от Vidrele

А мне вот как раз кажется, что прошлого — времена Эйнштейна. Хотя орфография послереволюционная. Значит наверное с некоторым лагом всё же. Пусть будет 1920.


Что касается вопроса, по поводу которого был дан сей тест, независимо от того, какого он на самом деле года окажется: мне кажется, вы о разном.

Есть два, как минимум, русский языка, а на деле больше. Но если брать наиболее крупными чанками, то уж два точно: письменный литературный и устный разговорный. Они могут смешиваться: в том числе в литературе может быть прямая речь на разговорном, на него могут скатываться журналисты иногда, и т.д., как и наоборот, в устной речи какой-нибудь лектор или профессор может выдавать давно заученные наизусть письменно-литературные фрагменты. Но как правило они всё же довольно существуют отдельно и легко отличимы один от другого. В устной речи люди очень редко употребляют причастные обороты, а деепричастные — почти никогда, часто используют неоконченные предложения, предложения с отсутствующими членами, которые были бы ошибкой в письменном языке, в целом тяготеют к упрощению и даже выкрикиванию отдельных слов, а также перестановкам, которые выглядят странно, если их записать например вместо «сходи на кухню и выключи чайник» человек зачастую в устной речи скажет что-нибудь «чайник на кухне — сходи выключи». Но мы этого не замечаем, если специально не подмечать, или не записывать.

Так вот, я думаю, что он говорит об устном разговорном языке. И я согласен, что он сегодня у молодёжи отличается от того, что было в 70-х. Более того, он отличается и от того, что было в 90-х. И я убеждён, что и в 70-е без сомнения отличался от 40-х. Устный язык вообще эволюционирует быстрее и испытывает больше различных флуктуаций. Намного. Часть из них прижзивается и, со временем, может отразиться и на письменном литературном языке. Но не всё и не сразу — некоторые явления просто не переживают проверку временем — как слова, так и грамматические конструкции. Предсказать это очень сложно, поскольку процесс во многом хаотичный, но можно пост-фактум констатировать, что осталось, а что ушло.

Отдельно отмечу, что в чатиках и чуть меньше на форумах может использоваться довольно странная смесь между письменным и устным языком, а также для вот этой интернет-речи характерны конструкции и слова, которые человек не употребляет в устной речи, но которые не входят и в литературную норму, например конструкция «умеет в [что-то]», или банально даже слово «лол». Хотя иногда оно и проникает в устную речь у некоторых людей, но всё же начало своё явно берёт в письменной речи в чатиках.

А ещё я диалектизмов не касался — но там вообще целый отдельный мир. Причём эти люди могут, когда надо, говорить и на привычном нам русском языке, и пишут тоже на литературном и грамотно. Но именно в устной речи употребляют много всего своеобразного.

Поэтому сравнивать между собой какие-то тексты из (квазифилософских?) публикаций в попытке показать, что речь молодёжи не сильно изменилась, не совсем корректно. Сравнивать надо устную речь с устной же.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 5)
Ответ на: комментарий от watchcat382

справедливо, работало нормально так как LANG=en_US.UTF-8, с «C» обломалось

> LANG=C   find . -iname "тест"
./????????

попробовал с рандомной *.UTF-8 локалью - тоже прекрасно нашлось. Если мы не путешествуем в прошлое, то хоть что-то на компе точно будет. Всякие микроконтроллеры не в счет, мы все-таки про десктопы говорим

user_undefined ★★
()

мне-то все давно понятно.

Ваше мнение я в топике вы не высказали.

Мое мнение если есть символ то он должен использоваться. Может надо уже переходить от utf 8 на utf 16 но ИИ говорит что большого смысла в этом нет. Потому что это все тот же юникод.

jura12 ★★★
()
Ответ на: комментарий от CrX

он говорит об устном разговорном языке. И я согласен, что он сегодня у молодёжи отличается от того, что было в 70-х. Более того, он отличается и от того, что было в 90-х. И я убеждён, что и в 70-е без сомнения отличался от 40-х.

На проблему можно взглянуть и с другой стороны. Устная речь постоянно меняется, каждое поколение придумывает свои особые словечки, но сама эта изменчивость остаётся неизменной. Свойство колебаться вокруг литературной нормы как было в 40-х, так и осталось в 70-х, 90-х да и прямо сейчас оно такое же.

ugoday ★★★★★
()