LINUX.ORG.RU

Программа для автоматического преобразования тегов для музыки

 , ,


1

1

Всем привет,

Сделал python скрипт который автоматически обновляет теги в аудиофайлах с кракозябр на нормальный читаемый текст. Знаю что многим надо, а толковых программ нет. Скрипт может обновлять теги в единичном файле или для всей коллекции песен. Автоматически сканирует указанную директорию и саб-директории
Скрипт целиком и полностью консольный, так что работать должен везде. Пользуйтесь.

https://github.com/mentax007/fix-music-tags



Последнее исправление: mentax (всего исправлений: 2)
Ответ на: комментарий от dmitry237

Я про image+cue. Православный вариант это flac+cue.

полный набор базовых данных

Вот именно что базовых, для воспроизведения/нарезки вполне достаточных, но для каталогизации нет. Намекну, что классику без ID3v2 вообще хрен опишешь.

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

Вот именно что базовых

А что надо для каталогизации и что это вообще?

Это уже ваши личные требования к библиотеке. У меня свои, примерно так выглядят метаданные файла:

$ metaflac --show-all './01 - Hells Bells.flac'
ADDED_TIMESTAMP=134129532578755957
ALBUM=Back In Black
ALBUMARTIST=AC/DC
ARTIST=AC/DC
DATE=1980
GENRE=Hard Rock
REPLAYGAIN_ALBUM_GAIN=-9.71 dB
REPLAYGAIN_ALBUM_PEAK=0.999969
REPLAYGAIN_TRACK_GAIN=-9.49 dB
REPLAYGAIN_TRACK_PEAK=0.999969
TITLE=Hells Bells
TRACKNUMBER=01
RATING=5
LAST_PLAYED_TIMESTAMP=134177822649509326
dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

Так это и есть ID3 внутри flac файла. А cue совсем для другого нужен, это индексная карта треков для заливки на диски или наоборот описания рипа диска. Там обычно только метки времени и названия. То что cue начали использовать для воспроизведения, как раз от недостатка нормальных метаданных.

Lordwind ★★★★★
()

python скрипт

...

работать должен везде

Ну ну

ya-betmen ★★★★★
()
Ответ на: комментарий от Lordwind

Или от того, что конвертация всего диска во flac с последующей разметкой через CUE позволяет легко делать точные копии диска, занимая при этом минимум места на HDD/SSD компьютера, когда как нарезка этого жирного flac на маленькие приводит к росту занимаемого места на диске и тому, что копия диска вполне может стать не копией, а чем-то чуть-чуть другим.

И причина этого не только в том, что метаданные для целого альбома частично одинаковы (название группы, год и так далее), а в той разнице, что есть между solid и не solid архивах. Любой кодек можно рассматривать как специализированный формат архива. И ИМХО, flac уже лет 5 как надо менять на что-то более эффективное по сжатию/универсальное по тегам и метаданным. Те же картинки с обложками в метаданных жать условным jpegxl. Но и так останется вопрос дублирования обложек, а они большие могут быть. Так что нужен формат на целые альбомы.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 5)
Ответ на: комментарий от peregrine

нарезка этого жирного flac на маленькие приводит к росту занимаемого места

и как же это может случиться? только не рассказывай что наколеночные скрипты вставляют левые паузы между треками, я ими все равно не пользуюсь

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

В первую очередь копия обложки когда она 1 на 10 треков и 1 на каждый трек, во-вторую LPR, хотя тут всё зависит от того насколько большие куски аудио требуют сохранения базовой информации.

peregrine ★★★★★
()
Ответ на: комментарий от Lordwind

То что cue начали использовать для воспроизведения, как раз от недостатка нормальных метаданных.

Есть что-то другое? Для «нормальных» метаданных есть библиотеки, базы данных. В cue только стандартные теги.

Так это и есть ID3 внутри flac файла

Нет, это Vorbis Comments. В отличии от стандартизированного ID3, в них могут быть произвольные теги. Правда их отображение, это задача самого пользователя, т.е. не каждый плеер способен выводить произвольные данные, которые понапридумывал пользователь.

dmitry237 ★★★★★
()
Ответ на: комментарий от peregrine

Во-первых, ID3 идут в конце файла и четко структурированы, испортить ими аудио невозможно. В разных контейнерах могут быть отличия, в ape теги реально странно себя ведут, но в mp3 и flac все ровно, я перезаписывал и теги и embedded art по многу раз без последствий. Я просто не знаю о чем ты говоришь. Это из разряда гипотетических событий наравне со случайной порчей данных на HDD из-за ошибки в контроллере, оперативной или самой постоянной памяти, то есть событие с ненулевой вероятностью, но никто никогда в жизни этого не видел вживую.

Во-вторых, хранение метаданных с данными это самое прекрасное что случилось с музыкой на сегодняшний день. Потому что с видео ничего подобного нет, mp4 и mkv контейнеры оказались заметно хуже по популярности и наполнению безотносительно технической готовности. Всё это позволяет один раз получить нужную комбинацию например lossless с полноценными тегами и качественной обложкой и потом это будет самодостаточный контент и источник истины для любого медиаплеера или медиасервера. Как диск на полочке с обложкой, буклетом и автографом. Когда мне например понадобился Navidrome, я получил готовый идеальный результат сразу искаропки просто потому что контент был идеальный.

Lordwind ★★★★★
()
Ответ на: комментарий от dmitry237

Vorbis Comments

Да, ок, с терминами есть путаница, мог и я что-то попутать. Есть нативные FLAC tags и есть Vorbis comments. Поскольку либы давно отполированы, то разница в поддержке и терминологии минимальная. Под музыкальными метаданными я подразумеваю все такие теги, т.к. cue совсем из другой оперы:

The original purpose of a cue sheet in CD authoring software was to lay out the disc, essentially specifying how the audio will be organized on the disc; some of the information ends up as the CD table of contents: the track numbers and locations, and the index points. Later CD-TEXT was added. But CD-TEXT is a very complex spec, and actually goes in the CD subcode data. It is internationalized, not through Unicode, but with several different character sets, some of them multi-byte. It even allows for graphics. In cue sheets, the TITLE/PERFORMER/etc tags are just a limited shorthand for authoring CD-TEXT, but when you rip, you almost never parse the CD-TEXT, you get it from another database, and it doesn't really belong in the FLAC CUESHEET block.

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

cue совсем из другой оперы

Тем не менее именно их прикладывают к образу диска.
Иначе можно слушать один большой файл без разметки на треки, т.е. в плейлисте будет название файла образа и его общая продолжительность.

Информации в cue достаточно для того, чтобы слушать потреково. Если не нравится образ диска, то его можно разрезать.

Базовые (стандартные) теги есть, ну а дальше это уже задача пользователя, тут каждый сам хозяин.

Некоторые плееры можно настроить на отображение кастомных тегов, это например foobar и deadbeef. Но абсолютное большинство умеют только стандартные теги, которые cue и содержит.

dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

их прикладывают к образу

Я понял твою мысль. Ты оперируешь термином образа, как iso/img/bin, но это модель хранения, а не использования. Бекапы хранят на лентах, но данные используют на дисках. Никто не запретит микроскопом гвозди забивать, но музыку именно с образа (даже flac формата) слушать в разы неудобнее. Софта с поддержкой сильно меньше, при стриминге оверхед на буферизацию и именно музыкальные метаданные хранить не в чем. А поскольку эпоха физических носителей прошла, то и смысла хранить их нет. Сейчас отраслевой стандарт это tracks+cue вместо image+cue, где cue это лишь артефакт рипа, а метаданные в tracks, причем при их отсутствии вменяемые плееры автоматом добирают инфу из cue.

Lordwind ★★★★★
()
Ответ на: комментарий от firkax

Пока использовал оффтоп - было везде либо 1251

Ты тут не в теме, в id3v1 разрешена только Latin-1 кодировка, а в id3v2 только Latin-1 и юникод. Так что cp1251 там или досовская это нарушение стандарта, ну и конечно же плохой дизайн «переключать кодировку» в плеере, ради экономии сотни байт на мегабайтных файликах, от которого уже сто лет назад отказались.

goingUp ★★★★★
()
Ответ на: комментарий от goingUp

Где latin1 там и другие однобайтные кодировки. Главное чтобы в плеере или ещё где правильно показывалось. Вот у автора неправильно показывается - он сделал перекодировщик, а пока этот момент не наступил - всё норм.

А «1251 или 866» это я не про теги писал а про вообще. В винде когда изредка сталкивался с юникодом в любых его проявлениях - это было мучение как его сконвертить в нормальный формат.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от firkax

Главное чтобы в плеере или ещё где правильно показывалось. Вот у автора неправильно показывается

…и это все, что нужно знать, дальше лишь отвлекающая информация)

goingUp ★★★★★
()
Ответ на: комментарий от Lordwind

Ты оперируешь термином образа, как iso/img/bin

В основном flac, но встречаются и другие lossless форматы.

музыку именно с образа (даже flac формата) слушать в разы неудобнее

Некоторые так не считают, оперируют тем, что соблюдаются все задумки авторов диска,

А поскольку эпоха физических носителей прошла, то и смысла хранить их нет

Я храню, моя коллекция, это то что я хочу слушать и не искать где-то там. Кроме того, это гибкость в плане составления плейлистов и получения статистики.
Например колличество прослушиваний (поле PC):

$ pbstat

PC Tracks Pls Log Total
-- ------ --- --- -----
 1     28   0   0  6665
 2   1362              
 3   1535              
 4   1386              
 5   1010              
 6    641              
 7    375              
 8    180              
 9     84              
10     38              
11     14              
12      7              
13      3              
16      1              
18      1              
dmitry237 ★★★★★
()
Ответ на: комментарий от dmitry237

В основном flac, но встречаются и другие lossless форматы

Такое чувство что с нейронкой беседую. Поддержка софтом нормальная только у flac/alac.

оперируют тем, что соблюдаются все задумки авторов диска

Есть такие аудиофилы, которые оперируют собственной физикой. Для остальных есть спектрограммы.

Я храню, моя коллекция, это то что я хочу слушать и не искать где-то там.

Мне кажется ты отвечаешь на какие-то другие голоса в голове. При чем тут cue?

Кроме того, это гибкость в плане составления плейлистов и получения статистики

И? https://imgur.com/a/RAPBKVU

Кроме того вот такое точно не получится сделать без метаданных: https://imgur.com/a/B2piN1K

Lordwind ★★★★★
()
Последнее исправление: Lordwind (всего исправлений: 3)
Ответ на: комментарий от Lordwind

Есть такие аудиофилы, которые оперируют собственной физикой. Для остальных есть спектрограммы.

Дело не в качестве звучания, а скорее в первом, какой-то надуманной физике (или химии, не знаю что у них в голове)

При чем тут cue?

С его помощью нарезал треки и все. Я не храню cue-файлы.

И?

Что «И?», 37340? Я не мерюсь и мне все равно.

Кроме того вот такое точно не получится сделать без метаданных

Очевидно это так.

Вы вообще на какую тему спорите? Вроде мы выяснили, что в cue есть стандартный набор метаданных.

dmitry237 ★★★★★
()
Ответ на: комментарий от Lordwind

Lidarr

Посмотрел это чудо, что-то пока впечатления двоякие - вроде бы много фич, но российским ip база по которой идёт поиск исполнителя кажет 403, а с прописанными маршрутами не хочет с моей торрентокачалкой жениться.

И не всю коллекцию правильно потрекало, но тут в принципе ожидаемо.

Пока завел из разряда на посмотреть что там новенького у исполнителей в полуручном режиме)

Flacon

@Zhbert спасибо, годнота. ЛОР - торт! :)

frunobulax ★★★★
()
Ответ на: комментарий от Zhbert

Попробуй Flacon, кстати. Вполне прикольная штука для нарезок.

Вот искать же пришлось! :)

https://github.com/flacon/flacon:

Audio File Encoder.

Flacon extracts individual tracks from one big audio file containing the entire album of music and saves them as separate audio files. To do this, it uses information from the appropriate CUE file. Besides, Flacon makes it possible to conveniently revise or specify tags both for all tracks at once or for each tag separately.

На C++ и Qt5 или Qt6.

dataman ★★★★★
()
Ответ на: комментарий от frunobulax

Да, с настройкой нужно помучаться, но это недолго. База у него MusicBrainz, который зобанен Роспотребнадзором еще лет 10 назад. Меня больше порадовало, что его с сусликом скрестили и он даже оттуда качает

Lordwind ★★★★★
()
Ответ на: комментарий от Lordwind

База у него MusicBrainz, который зобанен Роспотребнадзором еще лет 10 назад.

Хм. Странно немного, у меня пикард на домашнем интернете работает без всяких ухищрений. А вот именно в лидаре поиск не работает.

По моим ощущениям бан не со стороны ркн

frunobulax ★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.