Техника

ЧТО и КАК сжимается при сжатии аудио файла формата МР3? Если подробно распишете. буду очень благодарна!

Сначала звук оцифровывается (формат Wave), и превращается в цепочку значений амплитуды, выраженных цифрами. Потом эта цепочка разбивается на отрезки (длина их зависит от настроек кодера) , которые расположены вдоль волны либо встык, либо с перехлестом. Потом каждый отрезок (порция цифр) прокручивается через преобразование Фурье. В результате получается ДВЕ цепочки цифр, но теперь они говорят не об амплитуде звука в каждый момент времени, а об амплитуде каждой спектральной составляющей звука в данном отрезке музыки, а также о фазе.
Затем этот набор данных прореживается: снижается разрешение данных о фазе. Потом из данных удаляются маскируемые мелочи. Например, на фоне громкого звука какой-либо частоты, все более слабые вокруг него по частотной шкале могут быть безболезненно удалены, их все равно невозможно расслышать. Так же, удаляются все мелкие подробности сигнала непосредственно после громких моментов - потому что человеческое ухо требует некоторого времени, чтобы восстановить чувствительность после сильного раздражения. Данные при разных настройках кодера могут разредиться от 2 до 30 раз примерно. Настройки кодера во многих программах оставляются доступными для ручной настройки, потому что качество сжатия сильно зависит от содержания музыки. Например, если музыка исполняется одноголосно или набором сходных тембров, то частотная ее характеристика будет содержать только одиночные пики на графике, а между ними все можно удалять подчистую. После этого звучание нисколько не теряет качества, хотя по объему сжимается в десять раз. Так же, хорошо сжимается музыка медленная, протяжная, кантиленного характера. Хорошо сжимаются тембры, близкие к синусоидальным - флейта, фортепиано. Но и инструменты со сложной и запутанной спектральной картиной (например, дисторшн-гитара в металлике) тоже сжимаются хорошо, т. к. их тембр изначально уродлив, искажен и грязен - появление грязи после сжатия его практически не портит.
После всех операций данные сохраняются в файле прямо в таком, спектральном виде.

При проигрывании программа синтезирует математически новую синусоиду разной частоты, масштабирует ее по амплитуде сообразно с сохраненными данными, и затем все эти синусоиды суммирует. Получается новая синтетическая волна, нисколько не похожая на исходную, но вполне соответствующая ей по спектру. В виде короткого фрагмента по времени. Наконец, ориентируясь на пометки в файле, программа складывает эти фрагменты друг с другом либо встык, либо с перехлестом - и получается опять цельная композиция.

Таким образом, сжатие МР3 достигается за счет удаления маскирующихся подробностей и преобразования звука в спектр и обратно.
Беккали Бакытбеков
Беккали Бакытбеков
62 435
Лучший ответ
Формат действует по принципу физиологии нашего слуха. Ухо слышит громкие звуки, а что тише не воспринимает. Если звучит барабан, то он заглушает тихие флейты и другие звуки, а раз не слышим, то зачем писать? Всё тихое можно не писать, экономя очень много места. Вот например днём громко и мы не слышим тиканье часов, шум листьев, тот же принцип.
так-как и фильмы: файл бьется на кадры, потом соседние кадры сравниваются и "статика" отделяется от "динамики" (так можно "выкинуть ненужное" которое ты всеравно не услышишь) ) ну итд
ЗЫ почитай подробнее в вики
AT
Alina Timofti
3 143

Похожие вопросы