LINUX.ORG.RU
ФорумAdmin

Длинные имена... как хранить?

 , , long filenames,


0

5

Собственно суть в subj.
Не редкость в торрентах и/или рабочих корпоративных системах хранятся файлы с длинными именами на русском языке. Для себя переименовать обычно не проблема, исключая торренты(вроде и там можно переименовать, но не все клиенты поддерживают это).
Из файловых систем поддерживающие длинные имена (Linux) был reiserfs - которого ныне удалили из ядра.
Из оставшихся - по сути только ZFS наверное.. Да ещё привлекательно выглядит HAMMER под DragonFly BSD.
Для ext4 готовят установку кодировки, но ещё не доделана, поэтому только UTF8, соответственно длинна режется вдвое.

Сижу перед выбором...

Кто как решает проблемы(кроме административных способов)?
Оптимально также сообщить - для дома или для конторы.

★★★★★
Ответ на: комментарий от MirandaUser2

вот пример тайтл для аниме в 572 символа (согласно wc):

Я был предан товарищами в глубине подземелья, но благодаря своему навыку «Бесконечная гача» я обрёл союзников девять тысяч девятьсот девяносто девятого уровня, чтобы отомстить бывшим соратникам и всему миру! / Shinjiteita Nakama-tachi ni Dungeon Okuchi de Korosarekaketa ga Gift "Mugen Gacha" de Level 9999 no Nakama-tachi wo Te ni Irete Moto Party Member to Sekai ni Fukushuu & "Zamaa!" Shimasu!
  • вот добавьте еще суффикс в виде «S01E01.mp4» и попробуйте сохранить :)
necromant ★★
()
Ответ на: комментарий от necromant

Я был предан товарищами в глубине подземелья, но благодаря своему навыку «Бесконечная гача» я обрёл союзников девять тысяч девятьсот девяносто девятого уровня, чтобы отомстить бывшим соратникам и всему миру!

Ждём когда весь сюжет в название будут запихивать. Совсем долбанулись уже.

ptah_alexs ★★★★★
()
Ответ на: комментарий от peregrine

у оффтопика имя файла хранится в unicode point, а в ext4 в байтах. И если имя русское то только может сохранить только 127 символов кириллицы

Atlant ★★★★★
() автор топика
Ответ на: комментарий от ptah_alexs

Ждём когда весь сюжет в название будут запихивать

Это уже было модно лет 250-350 назад. Например, одна из популярнейших по сей день книжек называется «Жизнь, необыкновенные и удивительные приключения Робинзона Крузо, моряка из Йорка, прожившего 28 лет в полном одиночестве на необитаемом острове у берегов Америки близ устьев реки Ориноко, куда он был выброшен кораблекрушением, во время которого весь экипаж корабля, кроме него, погиб; с изложением его неожиданного освобождения пиратами, написанные им самим».

Были и покороче, конечно, например «Путешествия в некоторые отдалённые страны мира в четырёх частях: сочинение Ле́мюэля Гулливе́ра, сначала хирурга, а затем капитана нескольких кораблей»

Совсем долбанулись уже.

Уже или ещё — сложный вопрос. Вообще скорее от этого отошли. Те же книжки из примеров выше продаются сейчас, по крайней мере на русском, с сильно сокращёнными названиями «Робинзон Крузо» и «Путешествия Гулливера» соответственно. Но, видимо, отошли ещё пока не все. Ну или кто-то хочет сделать названия great again, так сказать…

CrX ★★★★★
()
Ответ на: комментарий от CrX

Ну или кто-то хочет сделать названия great again, так сказать…

Причина куда как банальнее: нынешняя оняме–индустрия окончательно скатилась в череду экранизаций трейлеров для графомании с японского аналога «Самиздата». А графоманы не умеют в нейминг по определению.

anonymous
()
Ответ на: комментарий от CrX

одна из популярнейших по сей день книжек называется

Вот только это не название, а краткая аннотация. Потому что концепция названия заглавия книги тогда ещё не сформировалась (за ненадобностью).

А самая популярная книга того времени дожила до наших времён и продолжает издаваться миллионными тиражами по всему миру без заглавия вообще.

LamerOk ★★★★★
()
Ответ на: комментарий от CrX

Японцы сейчас упоротые через это проходят. Названия бурятских порномультиков видел? Там сюжета больше, чем в самом поделии, а их ведь как правило по первоисточникам клепают (манга и новеллы). Жуть. Нас тоже ждёт, наверное в ближайшем будущем.

anonymous
()
Ответ на: комментарий от anonymous

Да не, у них как раз всё нормально, не только Гомера надо экранизировать (вон Голливуд в очередной раз Иллиаду делать будет, а ей уже 3000 годиков примерно). Это у всех остальных всё плохо, включая Голливуд. У кого раньше стало плохо, у кого позже.

anonymous
()
Ответ на: комментарий от anc

У оффтопика максимальная длина пути (не файла а всего пути) 244 символа, если не извращаться. У онтопика в ext4 4096 байт и 255 байт на само название файла. Да, если файл класть в корень на диск C то у оффтопика можно больше символов в многобайтных кодировках, но это же совсем упоротым надо быть чтоб всё в корне хранить. Сам путь на онтопике длиннее если не брать кодировки более 16 бит на символ.

anonymous
()
Ответ на: комментарий от anonymous

У оффтопика максимальная длина пути (не файла а всего пути) 244 символа

Это какой-то очень древний оффтопик видимо. CP/M ?

и 255 байт на само название файла

О чем и речь, в многобайтной кодировке длинна хуманом-воспринимаемая сокращается.

anc ★★★★★
()
Ответ на: комментарий от anonymous

У оффтопика максимальная длина пути (не файла а всего пути) 244 символа

Имя файла 255. Путь без имени файла 260. Но можно включить длинные пути (32767 символов), они работают только для локальных файлов, без UNC-путей.

dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

имя файла занимает именно 256 байт. строки в си добиваются нулевым байтом, отсюда максимальное ограничение на 255 байт. для юникода и того меньше. если все русские, то floor(255/2), а так - плавающая длина, например, эмоджи с флагом 8 байт занимают, символы ascii - один байт

  • под юникодом понимается utf-8
rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 3)
Ответ на: комментарий от dmitry237

флаг россии был 8 байт. а англии по моему нет в стандарте

new TextEncoder('utf-8').encode('🏴󠁧󠁢󠁥󠁮󠁧󠁿')
Uint8Array(28) [240, 159, 143, 180, 243, 160, 129, 167, 243, 160, 129, 162, 243, 160, 129, 165, 243, 160, 129, 174, 243, 160, 129, 167, 243, 160, 129, 191, buffer: ArrayBuffer(28), byteLength: 28, byteOffset: 0, length: 28, Symbol(Symbol.toStringTag): 'Uint8Array']

new TextEncoder('utf-8').encode('🇷🇺')
Uint8Array(8) [240, 159, 135, 183, 240, 159, 135, 186, buffer: ArrayBuffer(8), byteLength: 8, byteOffset: 0, length: 8, Symbol(Symbol.toStringTag): 'Uint8Array']

наверное в новом стандарте от гей оси добавили к бородатым женщинам

а еще одинаковые UTF8-строки могут по-разному кодироваться, поэтому разное количество байт занимать

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 3)
Ответ на: комментарий от LamerOk

А самая популярная книга того времени дожила до наших времён и продолжает издаваться миллионными тиражами по всему миру без заглавия вообще.

Еще и назвали книгу «Книга» (на самом деле не совсем, но суть примерно такая), совсем обленились.

t3n3t
()
Последнее исправление: t3n3t (всего исправлений: 1)
Ответ на: комментарий от LamerOk

Вот только это не название, а краткая аннотация. Потому что концепция названия заглавия книги тогда ещё не сформировалась (за ненадобностью).

Если оно плавает как название, ходит как название, крякает как название… Ну ты понял ☺

А самая популярная книга того времени дожила до наших времён и продолжает издаваться миллионными тиражами по всему миру без заглавия вообще.

Если речь о Библии, то вроде как название у неё есть (уж к тому времени точно), пусть и очень короткое и довольно странное, но опять же, оно написано на обложке, и если сказать кому угодно «у меня из книг только Библия, вторая и синяя», собеседник поймёт, какая конкретно книга в перечислении первая. Так что вполне себе с названием она, я бы сказал — даже коротким. Там другое дело, что чуть раньше она чаще продавалась всё же в двух томах — Ветхий и Новый завет. Но это тоже вполне названия.

На других языках немного отличается название, например в английском там ещё и Holy в начале. Но сути дела это не сильно меняет — это в принципе распространено довольно, что одна книга может иметь немного разные названия в зависимости от перевода — включая разницу сильнее, чем просто нюансы непосредственно перевода названия.

Кстати, если кто читать вздумает, такой совет**: ветхий можно нормально читать — там относительно весело, не сильно отличается от других эпосов других народов; а вот на новом завете можно задушиться прям очень сильно — кто не читал, спойлер неспойлер — там идут подряд 4 «Евангелия», и в них по сути одно и то же. Причём, если вы думаете, что как в современном романе с таким повествовательным приёмом — типа взгляд на одно событие с разных сторон — НЕТ! Там Евангелие от Марка повторяет Евангелие от Матфея текстуально примерно на 85% — то есть прям «копипаста», а из остальных 15% по большей части либо то же самое другими словами, либо прям вот в редких случаях новые подробности. В евангелиях от Луки и особенно от Иоанна чуть больше изменено, НО когда ты читаешь одно и то же не второй, а третий, и особенно четвёртый раз — уже прям душнилово офигенное начинается. Так что, хоть книгу я к прочтению и рекомендую (полезно хотя бы для того, чтобы понимать 90% отсылок из всех книг, написанных где-то до середины XX века, да и подавляющего большинства после тожех. Тут ещё Гомера правда надо, но не о нём сейчас), но дам такой совет читателям: не читайте Евангелия все подряд, как они идут. Это нормально — данная книга является сборником и изначально не предназначалась к прочтению прям подряд именно в том порядке, как страницы идут. Чтоб не офигеть от душноты и не повторить моих ошибок — разбавьте. Закончили Евангелие от Матфея — пролистайте до деяний святых апостолово, а после них, когда станет свободнее дышать — назад к Евангелию от Марка. Дочитал — дай себе воздуха, почитай послания Петра и Иоанна (они, впрочем, тоже довольно душные, но всё ж не то же самое по третьему кругу читать). Ну и так далее. Самая движуха в Откровение там, да.

** DISCLAIMER: это во-первых личное мнение, не претендующее на истину, а во-вторых совет в первую очередь для атеистов и представителей других религий, желающих ознакомиться с данной книгой. Христиане, для которых Библия священна в первую очередь, а литература уже во вторую, или ни в какую вообще — читайте тем образом, каким вам кажется правильно, мнение выше — не для вас.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Если речь о Библии, то вроде как название у неё есть

Нет, нету. "Библия" - это множественное число от "библион", что переводится с обычного греческого на обычный русский как "книга". Однокоренное слово в русском языке - "библиотека" ( не хранилище "Библий", а хранилище книг). То есть "библия" - это просто "книги". Буквально, без всякого названия.

оно написано на обложке, и если сказать кому угодно

Это в 21-ом веке что-то написано на обложке, чтоб отличить одну книгу от других. А ты поднял речь про "250-350 лет назад". Вот тебе обложка библии Гуттенберга, а вот тебе она же с первой страницей - попробуй найти тут заглавие самостоятельно.

На других языках немного отличается название,

В 21-ом веке оно отличается. А в 15-ом его просто не было. Русский тут исключение, потому что заимствовали греческое слово у греков, у которых опять же названия не было.

LamerOk ★★★★★
()
Последнее исправление: LamerOk (всего исправлений: 1)
Ответ на: комментарий от LamerOk

что переводится с обычного греческого на обычный русский как «книга»

«маленькие книги». Библия - это сборник. Причем еще и не полный.

Например в эфиопской библии книга Еноха является каноном, а в остальных - апокрифом. Ну и т.д. Александрийская БИБЛИОтека, кстати, вышла из чата, довольно давно.

t3n3t
()
Последнее исправление: t3n3t (всего исправлений: 1)
Ответ на: комментарий от CrX

Там другое дело, что чуть раньше она чаще продавалась всё же в двух томах — Ветхий и Новый завет. Но это тоже вполне названия.

Это не названия, это неотъемлемые части того, что и является библией. Кстати, тот же Псалтирь - это часть именно Ветхого Завета, например. Так что так просто разделить их не получится.

t3n3t
()
Ответ на: комментарий от CrX

Уже или ещё — сложный вопрос. Вообще скорее от этого отошли.

Когда-то я прочитал в журнале «Трамвай»:

Монолог черепахи, вновь посетившей через полчаса грядку с салатом, хотя ей давно было пора вкушать послеобеденный сон на клумбе среди голубых незабудок

Растительная пища –
Такая вкуснотища!

Vidrele ★★★★★
()
Ответ на: комментарий от CrX

А! Ну, и да.

Вот только это не название, а краткая аннотация. Потому что концепция названия заглавия книги тогда ещё не сформировалась (за ненадобностью).

Если оно плавает как название, ходит как название, крякает как название…

Вот только оно всего этого не делает. То, что ты процитировал, - это буквально та рекламная аннотация, которую сейчас печатают мелким шрифтом на задней обложке у дешёвых изданий. Так что оно ходит, плавает, крякает, танцует и поёт как аннотация.

LamerOk ★★★★★
()
Ответ на: комментарий от t3n3t

кста

история чтение от античности до наших дней

свитки vs кодэксы

ну и письмо без пробелов зато с отличиями глифа от положения в слове

и прочие изыски ад-рай сжатия

красная книжица всёж тиражней уже как век почти

qulinxao3 ★☆
()

Используй ИИ для преобразования имен. Ну через API ChatGPT говори «дай осмысленное короткое имя файлу с именем» + file_name. А потом автоматом сохраняй под этим именем. В качестве временного хранилища можно использовать tmpfs.

anonymous
()
Ответ на: комментарий от CrX

история чтения в западном мире от античности до наших дней

ну и

попса от Азимова

приход ночи

катастройка с бронзовеком вокруг Трои тож для контекста

зы: меж колонок перекрёстный индекс для навигации вполне хайтек

qulinxao3 ★☆
()
Ответ на: комментарий от LamerOk

не жди но дайджестируй pls

историю чтения от античности до наших дней Ковалы и Ромалы?(Бомбалы без бу ратини?)

ваш выхлоп?:

qulinxao3 ★☆
()
Последнее исправление: qulinxao3 (всего исправлений: 1)
Ответ на: комментарий от t3n3t

бестселер с очагом пыпы карлы обязан быть источником фанфиков

особлево когда при переводе зашили суть срединных элиннов - так получилось - никто не хотел плохого

зы

приход ночи Азимова ну и как читать Орла Мортимера

Гор Видал Создание/Творение - ковёр(не матрац) настолько дорог что тесть не смог зятю

qulinxao3 ★☆
()
Последнее исправление: qulinxao3 (всего исправлений: 1)
Ответ на: комментарий от qulinxao3

при переводе зашили суть срединных элиннов

Персов.

ЗЫ:

приход ночи Азимова

Предпочитаю Селина. Ну вот то самое путешествие..

t3n3t
()
Последнее исправление: t3n3t (всего исправлений: 1)
Ответ на: комментарий от qulinxao3

а не из широких штанин ли

четырнадцать

проезжая мимо пятого этажа

ну и негр преклонных годов конечно

нельзя забывать

восемьдесят ведь

раз уж повесил ружьё — изволь (Годзила там, Кинг Конг)

а то восемь выходит

и Кали

CrX ★★★★★
()