LINUX.ORG.RU

перевести кривые названия песен в нормальные

 , ,


0

3

Есть:

Jennifer Lopez,Iggi Azalea – Booty(Original Edit)
Scor pions – Sti ll l oving you
Новинки DFM 2015 | Major Lazer & DJ Snake feat. MØ – Lean On
Evanescence – My Immortal (OST Тайны Смолвиля)
Есть например название песни, оно может быть в несколько извращенной форме, из-за того, что пользователи сами заполняют поля к приложениям. Порекомендуйте какой нибудь простой способ при помощи яндекс, гугл, вк или другого API, извращенные названия приводить к грамотным.

Нужно:

Jennifer Lopez, Iggi Azalea – Booty (Original Edit)
Scorpions – Still loving you
Major Lazer & DJ Snake feat. MØ – Lean On
Evanescence – My Immortal



Последнее исправление: preepunk (всего исправлений: 1)

Первое, что приходит на ум — Musicbrainz

olibjerd ★★★★★
()

Лучший вариант — не качать из таких клоак. Родина вам дала торрент-трекеры!

Вариант чуть похуже — musicbrains.

UPD: Или это у тебя что-то вроде ласт-фм, где юзеры скробблят теги? Тогда первый вариант отпадает, второй возможно тоже (если есть только теги), остаётся самому велосипедить. Я себе делал скрипт, который приводит теги в порядок, исправляя основные ошибки, но в такое он не умеет, там в основном правильная капитализация.

Psych218 ★★★★★
()
Последнее исправление: Psych218 (всего исправлений: 1)
Ответ на: комментарий от router

Да нет, видимо это не тот случай. У него похоже веб сервис, должно происходить без участия человека.

sin_a ★★★★★
()

Глядя на твой ник могу предложить только rm -rf ./*

ya-betmen ★★★★★
()
Ответ на: комментарий от Psych218

Никто никуда не скачивает, наоборот. Пользователи выставляют плохо оформленные названия.

preepunk
() автор топика
Ответ на: комментарий от sin_a

проблема не в редактировании тегов (мне это оне нужно), а в семантике названий, нужно автоматически исправлять их.

грубо говоря нужна f(x), подав вместо x построчно то, что я указал в первом списке требуется получить второй.

preepunk
() автор топика
Ответ на: комментарий от preepunk

Ну тут только велосипедить. Искать уже проверенные варианты в базе, проверять части, отделённые разными разделителями (типа «|») на совпадения и т.д. Сравнивать с эталоном. Опять же, если у кучи разных исполнителей одинаковый префикс, но хотя бы пара из них существуют без такого префикса, значит этот префикс скорее всего лишний (вот эта реклама откуда скачано, например). Ну расстановка пробелов перед открывающими скобками и после закрывающих тривиально.

В общем, тут слишком много всего, не общий случай. Готового решения почти наверняка нет. Только велосипедить своё. Но ничего особо сложного вроде бы.

Psych218 ★★★★★
()
Ответ на: комментарий от preepunk

Я думал, у тебя есть доступ к файлам, тогда бы вытащил просто да и все. А так хз вообще, разве что нечеткий поиск по musicbrains и ему подобным.

cdshines ★★★★★
()

Поставь kid3, у него есть интерфейс к musicbrainz и он умеет тегать файлы пачками. Самая удобная тулза из тех, что мне встречались.

alex_the_v ★★★
()
Ответ на: комментарий от preepunk

это просто строковые описания файлов в бд

А сами файлы у тебя есть? Если есть то можно прогонять их через распознавалку музыки и тогда вообще будет не важно что юзер написал.

ya-betmen ★★★★★
()
Ответ на: комментарий от Psych218

в том то и дело, что задача довольно общая, а велосипед получится очень крупный. я нашел уже http://developer.echonest.com/docs/v4/song.html вот такой интерфейс, но тут проблема в том, что половина песен отсутствует. Возможно придется работать тупо с гуглом и его исправлениями запросов.

preepunk
() автор топика
Ответ на: комментарий от cdshines

доступ есть, но данные удаленные и выкачивать данные ради этого слишком жирно

preepunk
() автор топика
Ответ на: комментарий от cdshines

я не думал кстати об этом, может быть можно вытащить теги без выкачивания файла целиком, однако не факт что в самих тегах есть валидная информация.

preepunk
() автор топика
Ответ на: комментарий от preepunk

Возможно придется работать тупо с гуглом и его исправлениями запросов.

Смотри, чтобы не забанили. Они могут при слишком частых запросах.

Psych218 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.