LINUX.ORG.RU

Программа для автоматического преобразования тегов для музыки

 , ,


1

1

Всем привет,

Сделал python скрипт который автоматически обновляет теги в аудиофайлах с кракозябр на нормальный читаемый текст. Знаю что многим надо, а толковых программ нет. Скрипт может обновлять теги в единичном файле или для всей коллекции песен. Автоматически сканирует указанную директорию и саб-директории
Скрипт целиком и полностью консольный, так что работать должен везде. Пользуйтесь.

https://github.com/mentax007/fix-music-tags



Последнее исправление: mentax (всего исправлений: 2)
Ответ на: комментарий от dmitry237

Я про image+cue. Православный вариант это flac+cue.

полный набор базовых данных

Вот именно что базовых, для воспроизведения/нарезки вполне достаточных, но для каталогизации нет. Намекну, что классику без ID3v2 вообще хрен опишешь.

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

Вот именно что базовых

А что надо для каталогизации и что это вообще?

Это уже ваши личные требования к библиотеке. У меня свои, примерно так выглядят метаданные файла:

$ metaflac --show-all './01 - Hells Bells.flac'
ADDED_TIMESTAMP=134129532578755957
ALBUM=Back In Black
ALBUMARTIST=AC/DC
ARTIST=AC/DC
DATE=1980
GENRE=Hard Rock
REPLAYGAIN_ALBUM_GAIN=-9.71 dB
REPLAYGAIN_ALBUM_PEAK=0.999969
REPLAYGAIN_TRACK_GAIN=-9.49 dB
REPLAYGAIN_TRACK_PEAK=0.999969
TITLE=Hells Bells
TRACKNUMBER=01
RATING=5
LAST_PLAYED_TIMESTAMP=134177822649509326
dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

Так это и есть ID3 внутри flac файла. А cue совсем для другого нужен, это индексная карта треков для заливки на диски или наоборот описания рипа диска. Там обычно только метки времени и названия. То что cue начали использовать для воспроизведения, как раз от недостатка нормальных метаданных.

Lordwind ★★★★★
()

python скрипт

...

работать должен везде

Ну ну

ya-betmen ★★★★★
()
Ответ на: комментарий от Lordwind

Или от того, что конвертация всего диска во flac с последующей разметкой через CUE позволяет легко делать точные копии диска, занимая при этом минимум места на HDD/SSD компьютера, когда как нарезка этого жирного flac на маленькие приводит к росту занимаемого места на диске и тому, что копия диска вполне может стать не копией, а чем-то чуть-чуть другим.

И причина этого не только в том, что метаданные для целого альбома частично одинаковы (название группы, год и так далее), а в той разнице, что есть между solid и не solid архивах. Любой кодек можно рассматривать как специализированный формат архива. И ИМХО, flac уже лет 5 как надо менять на что-то более эффективное по сжатию/универсальное по тегам и метаданным. Те же картинки с обложками в метаданных жать условным jpegxl. Но и так останется вопрос дублирования обложек, а они большие могут быть. Так что нужен формат на целые альбомы.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 5)
Ответ на: комментарий от peregrine

нарезка этого жирного flac на маленькие приводит к росту занимаемого места

и как же это может случиться? только не рассказывай что наколеночные скрипты вставляют левые паузы между треками, я ими все равно не пользуюсь

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

В первую очередь копия обложки когда она 1 на 10 треков и 1 на каждый трек, во-вторую LPR, хотя тут всё зависит от того насколько большие куски аудио требуют сохранения базовой информации.

peregrine ★★★★★
()
Ответ на: комментарий от Lordwind

То что cue начали использовать для воспроизведения, как раз от недостатка нормальных метаданных.

Есть что-то другое? Для «нормальных» метаданных есть библиотеки, базы данных. В cue только стандартные теги.

Так это и есть ID3 внутри flac файла

Нет, это Vorbis Comments. В отличии от стандартизированного ID3, в них могут быть произвольные теги. Правда их отображение, это задача самого пользователя, т.е. не каждый плеер способен выводить произвольные данные, которые понапридумывал пользователь.

dmitry237 ★★★★★
()
Ответ на: комментарий от peregrine

Во-первых, ID3 идут в конце файла и четко структурированы, испортить ими аудио невозможно. В разных контейнерах могут быть отличия, в ape теги реально странно себя ведут, но в mp3 и flac все ровно, я перезаписывал и теги и embedded art по многу раз без последствий. Я просто не знаю о чем ты говоришь. Это из разряда гипотетических событий наравне со случайной порчей данных на HDD из-за ошибки в контроллере, оперативной или самой постоянной памяти, то есть событие с ненулевой вероятностью, но никто никогда в жизни этого не видел вживую.

Во-вторых, хранение метаданных с данными это самое прекрасное что случилось с музыкой на сегодняшний день. Потому что с видео ничего подобного нет, mp4 и mkv контейнеры оказались заметно хуже по популярности и наполнению безотносительно технической готовности. Всё это позволяет один раз получить нужную комбинацию например lossless с полноценными тегами и качественной обложкой и потом это будет самодостаточный контент и источник истины для любого медиаплеера или медиасервера. Как диск на полочке с обложкой, буклетом и автографом. Когда мне например понадобился Navidrome, я получил готовый идеальный результат сразу искаропки просто потому что контент был идеальный.

Lordwind ★★★★★
()
Ответ на: комментарий от dmitry237

Vorbis Comments

Да, ок, с терминами есть путаница, мог и я что-то попутать. Есть нативные FLAC tags и есть Vorbis comments. Поскольку либы давно отполированы, то разница в поддержке и терминологии минимальная. Под музыкальными метаданными я подразумеваю все такие теги, т.к. cue совсем из другой оперы:

The original purpose of a cue sheet in CD authoring software was to lay out the disc, essentially specifying how the audio will be organized on the disc; some of the information ends up as the CD table of contents: the track numbers and locations, and the index points. Later CD-TEXT was added. But CD-TEXT is a very complex spec, and actually goes in the CD subcode data. It is internationalized, not through Unicode, but with several different character sets, some of them multi-byte. It even allows for graphics. In cue sheets, the TITLE/PERFORMER/etc tags are just a limited shorthand for authoring CD-TEXT, but when you rip, you almost never parse the CD-TEXT, you get it from another database, and it doesn't really belong in the FLAC CUESHEET block.

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

cue совсем из другой оперы

Тем не менее именно их прикладывают к образу диска.
Иначе можно слушать один большой файл без разметки на треки, т.е. в плейлисте будет название файла образа и его общая продолжительность.

Информации в cue достаточно для того, чтобы слушать потреково. Если не нравится образ диска, то его можно разрезать.

Базовые (стандартные) теги есть, ну а дальше это уже задача пользователя, тут каждый сам хозяин.

Некоторые плееры можно настроить на отображение кастомных тегов, это например foobar и deadbeef. Но абсолютное большинство умеют только стандартные теги, которые cue и содержит.

dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

их прикладывают к образу

Я понял твою мысль. Ты оперируешь термином образа, как iso/img/bin, но это модель хранения, а не использования. Бекапы хранят на лентах, но данные используют на дисках. Никто не запретит микроскопом гвозди забивать, но музыку именно с образа (даже flac формата) слушать в разы неудобнее. Софта с поддержкой сильно меньше, при стриминге оверхед на буферизацию и именно музыкальные метаданные хранить не в чем. А поскольку эпоха физических носителей прошла, то и смысла хранить их нет. Сейчас отраслевой стандарт это tracks+cue вместо image+cue, где cue это лишь артефакт рипа, а метаданные в tracks, причем при их отсутствии вменяемые плееры автоматом добирают инфу из cue.

Lordwind ★★★★★
()
Ответ на: комментарий от firkax

Пока использовал оффтоп - было везде либо 1251

Ты тут не в теме, в id3v1 разрешена только Latin-1 кодировка, а в id3v2 только Latin-1 и юникод. Так что cp1251 там или досовская это нарушение стандарта, ну и конечно же плохой дизайн «переключать кодировку» в плеере, ради экономии сотни байт на мегабайтных файликах, от которого уже сто лет назад отказались.

goingUp ★★★★★
()
Ответ на: комментарий от goingUp

Где latin1 там и другие однобайтные кодировки. Главное чтобы в плеере или ещё где правильно показывалось. Вот у автора неправильно показывается - он сделал перекодировщик, а пока этот момент не наступил - всё норм.

А «1251 или 866» это я не про теги писал а про вообще. В винде когда изредка сталкивался с юникодом в любых его проявлениях - это было мучение как его сконвертить в нормальный формат.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от firkax

Главное чтобы в плеере или ещё где правильно показывалось. Вот у автора неправильно показывается

…и это все, что нужно знать, дальше лишь отвлекающая информация)

goingUp ★★★★★
()
Ответ на: комментарий от Lordwind

Ты оперируешь термином образа, как iso/img/bin

В основном flac, но встречаются и другие lossless форматы.

музыку именно с образа (даже flac формата) слушать в разы неудобнее

Некоторые так не считают, оперируют тем, что соблюдаются все задумки авторов диска,

А поскольку эпоха физических носителей прошла, то и смысла хранить их нет

Я храню, моя коллекция, это то что я хочу слушать и не искать где-то там. Кроме того, это гибкость в плане составления плейлистов и получения статистики.
Например колличество прослушиваний (поле PC):

$ pbstat

PC Tracks Pls Log Total
-- ------ --- --- -----
 1     28   0   0  6665
 2   1362              
 3   1535              
 4   1386              
 5   1010              
 6    641              
 7    375              
 8    180              
 9     84              
10     38              
11     14              
12      7              
13      3              
16      1              
18      1              
dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

В основном flac, но встречаются и другие lossless форматы

Такое чувство что с нейронкой беседую. Поддержка софтом нормальная только у flac/alac.

оперируют тем, что соблюдаются все задумки авторов диска

Есть такие аудиофилы, которые оперируют собственной физикой. Для остальных есть спектрограммы.

Я храню, моя коллекция, это то что я хочу слушать и не искать где-то там.

Мне кажется ты отвечаешь на какие-то другие голоса в голове. При чем тут cue?

Кроме того, это гибкость в плане составления плейлистов и получения статистики

И? https://imgur.com/a/RAPBKVU

Кроме того вот такое точно не получится сделать без метаданных: https://imgur.com/a/B2piN1K

Lordwind ★★★★★
()
Последнее исправление: Lordwind (всего исправлений: 3)
Ответ на: комментарий от Lordwind

Есть такие аудиофилы, которые оперируют собственной физикой. Для остальных есть спектрограммы.

Дело не в качестве звучания, а скорее в первом, какой-то надуманной физике (или химии, не знаю что у них в голове)

При чем тут cue?

С его помощью нарезал треки и все. Я не храню cue-файлы.

И?

Что «И?», 37340? Я не мерюсь и мне все равно.

Кроме того вот такое точно не получится сделать без метаданных

Очевидно это так.

Вы вообще на какую тему спорите? Вроде мы выяснили, что в cue есть стандартный набор метаданных.

dmitry237 ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.