ну виниловый рип такая штука что сегодня доступен, а завтра уже нет. вон уже закатывают по 2-3 гб весом. всё не сохраняю, но то что нравится в основном да, и каждого экземпляра приходится часто по несколько вариантов, это же не цифра тут каждый имеет свои особенности, неповтримое как и всё в аналовом мире
мне не нужен низкий битрейт. у ogg vorbis и битрейт высокий в сравнении с mp3 и битность сохраняется и частота, а размер в несколько раз, даже раз в десять бывает меньше от исходного
меня устраивает размер пережатки в ворбис на максималке, мне интересно сторонне мнение, может есть что лучше, беспотерьный флак даёт слишком большой размер даже при алгоритме максимальной копрессии, а mp3 недостаточен для максималки. я в ворбис пережал у меня несколько десятков гб, но может я хнёй страдал и можно было получить лучшее качество в тех же размерах
Там ещё проблемы со стерео в этих mp3/aac/opus, что стерео они кодируют местами не очень, ну, на битрейтах 320 на простой акустике не реально найти изъян
Я слушал 192 Кгц 24, 48 битные треки синтезаторов и заметил, что частота дискретизации всё-таки многое даёт, даже 88200 уже на слух хорошо отличается от 44100, а 88200 от 192k уже отличать крайне сложно, а информации приходится передавать в разы больше
Цель сего действа? Кодируйте в aac кодеком от Nero (не самой Nero, у них лежат cammand-line кодеры) если надо на портативном устройстве проигрывать. Искать все решения и ссылки на Videohelp. Лучше все такие вещи делать через foobar2000.
если ты это сможешь сделать прослушиванием в двойном слепом тесте, а не ffprobe на компе, то у тебя есть шанс попасть в книгу рекордов гиннеса и в научные работы про мутации человека
Из flac можешь сделать ogg, а вот из ogg flac уже не вернуть. Поэтому подумай, стоит ли жидиться из-за размеров файлов, потом захочется другого и будешь перекачивать…
следовало начать с запруфанных сравнений двойным слепым тестом
Нет. Следовало начать со студенческой скамьи. Если тебе не приходилось восстанавливать сигнал из Фурье-разложения, то ты так никогда и не узнаешь, какое это г. и что сигнал после этого становится «необрабатываемым».
Конечно. А как не советовать. Он же этот факт совсем не учитывает. А ему то какая разница OGG это или FLAC, если битрейт приемлемый. И тут неожиданно бонус - звук остаётся «обрабатываемым».
Не совсем. Wavpack (ИМХО) пользуем что-то типа mp3 без психоакустики (простым обрубанием) вместо предсказания. То есть сигнал делится на «близкий» и дельту к нему. Как кодируется «близкий» сигнал надо уточнять, но по моему тоже с помощью DCT.
In the default lossless mode WavPack acts just like a WinZip compressor for audio files. However, unlike MP3 or WMA encoding which can affect the sound quality, not a single bit of the original information is lost, so there’s no chance of degradation. This makes lossless mode ideal for archiving audio material or any other situation where quality is paramount. The compression ratio depends on the source material, but generally is between 30% and 70%.
Что-то про DCT ничего нет. Напротив говорят что ни как MP3.
The lossy mode employs no subband coding or psychoacoustic noise masking. Instead, it is based on variable quantization in the time domain combined with mild noise shaping. This mode can operate from bitrates as low as 2.22 bits per sample up to fully lossless and offers considerably more flexibility and performance than the similar, but much simpler, ADPCM (Section 7.6). This makes the lossy mode ideal for high-quality audio encoding where the data storage or bandwidth requirements of the lossless mode might be prohibitive.
Finally, the hybrid mode combines the lossless and lossy modes into a single operation. Instead of a single output file being generated from a source, two files are generated. The first, with the extension wv, is a smaller lossy file that can be played on its own. The second is a “correction” file (wvc) that, when combined with the first, provides lossless restoration of the original audio. The two files together have essentially the same size as the output produced by the pure lossless mode, so the hybrid mode generates very little additional overhead.
Осталось только расшифровать, что такое:
Instead, it is based on variable quantization in the time domain combined with mild noise shaping.
И тогда всё OK. Ну да, похоже используется какая-то другая фитча, вместо DCT.
Да. Походу во многом LossyWav и WV(lossy) работают похожим образом (как минимум во временной области). При этом фильтрация у них во многом разная. WV упорот на неких показателях «шума» (аналог в графике - wiener filter), а LossyWav упорот на сходстве соседних отсчётов (аналог в графике - LossyPNG).
В lossy несколько другое представление о битности. Но, если кодеру подавать 32 bit float (или 24 bit), а декодер поддерживает декодирование в этих форматах (opensource декодеры обычно поддерживают, в отличии от коммерческих), то информация о 16+ битах сохраняется. Отличие от lossless в том, что декодировать можно в любой битности. То есть, даже если кодеру подавали 16 бит - декодировать можно в 32 float. Это полезно, так как потом можно понизить громкость и избавиться от клиппинга. Если уровень записи под 0dB, в lossy он неизбежно будет (правда, услышать его трудно, если небольшой). Потому полезно перед кодированием чуть уменьшить уровень до -1...-2dB, особенно, если кодер поддерживает только 16/24 бит. Избавиться от клиппинга реально только в 32 bit float (а есть еще 32 bit fixed point, тут ключевое слово float - плавающая точка или запятая).
Есть кодеры, которые перед кодированием обрезают до 16 bit, это, например, FDK AAC, хоть и едят на вход всё.
частота
Строго говоря, частота дискретизации выше 48 кГц избыточна. Человек не может слышать ультразвук (> 20 кГц).
можно было получить лучшее качество в тех же размерах
Можно и при меньших размерах, если использовать частоту дискретизации 48 кГц (мусор не будет занимать место) и обрезать до 16 бит (с дизерингом). У Opus алгоритмы сжатия лучше. В слепых тестах иной раз и 64 kbps от оригинала не отличишь, а на 200 kbps еще ни у кого не получилось.
Неправильно тестируешь, артефакты ресемплинга наверняка. Даже банальная небольшая разница в громкости достаточна, чтобы различить файлы (только на основе громкости). Поэтому важно слепой тест точно настраивать, выравнивать громкость по Replay Gain, применять качественный ресемплинг. Ты наверняка всего этого не делал. Просто у тебя звуковуха на высоких частотах дискретизации работает в других режимах или что-то в этом роде.