Назад к списку

Война за громкость: к проблеме современной тенденции перекомпрессии фонограмм. 

Данная статья посвящена явлению, в котором видят причину ухудшения слуха у молодежи, ухудшении качества звучания фонограмм и, наконец, в падении продаж в музыкальной индустрии. Говоря «перекомпрессия», мы имеем в виду не компрессию данных в форматах аудио, а компрессию динамического диапазона, в данном случае – чрезмерную компрессию. «Википедия» дает следующее определение: «Война громкости (гонка громкости, война за громкость) – склонность музыкальной индустрии к постепенному увеличению громкости записываемой и распространяемой музыки в стремлении выделить свои записи на фоне остальных». Но только ли это?.. 


Немного теории 

Не секрет, что звукорежиссер, используя современные средства обработки, имеет много возможностей заставить свою фонограмму звучать громче фонограммы конкурентов. Более того, как правило, звукорежиссер старается сделать фонограмму громче. Зачем? На то есть несколько причин. Первая причина кроется в нелинейности восприятия человеческого слуха. В силу действия кривых равной громкости, человеческое ухо на тихих уровнях менее чувствительно к низким и высоким частотам, поэтому музыка воспринимается как менее энергичная, менее прозрачная и более приглушенная. Однако, с увеличением громкости восприятие становится более линейным, и человеку кажется, что низких (бас) и высоких (сибилянты, тарелки и т. д.) частот в фонограмме все больше и больше, а соответственно, звучание становится более «басовитым», «упругим», энергичным, ярким, разборчивым. 

Во-вторых, отчасти обвиняют психоакустический эффект маскировки. Например, разговор на автобусной остановке совершенно невозможен, если подъезжает шумный автобус. Говорят, что музыка попросту будет заглушаться, и ее не будет слышно, если слушать ее в шумном месте. Причем, как известно, музыка не статична и имеет как громкие, так и тихие места, и получается, что страдают преимущественно тихие участки. 

Соответственно, выход напрашивается сам собой: сделать тихие и средние по громкости участки громче, а громкие не трогать или, как говорят звукорежиссеры, применить динамическую обработку, в данном случае сжать динамический диапазон при помощи компрессии. 

Однако после такой обработки фонограмма будет звучать громче в целом. Это связано с темрадио, что человек воспринимает громкость не по пиковым значениям, а по средне-квадратичным (RMS, «средняя громкость») и, несмотря на то, что пиковые значения остались на прежнем месте, возросла «средняя громкость», и фонограмма нам кажется более громкой. При оценке динамического диапазона также используют понятие кросс-фактора, т. е. разности между пиковым значением и среднеквадратичным. Чем выше кросс-фактор, тем выше динамический диапазон произведения. 

Все бы хорошо, но динамика – это важнейшая составляющая музыкального произведения. Музыка «дышит» благодаря динамике, и получается, что те динамические оттенки, которые музыканты вложили в произведение, попросту удаляются при чрезмерной компрессии (перекомпрессии). 

Звукорежиссеры различают макродинамику и микродинамику, где макро – это разность громкости между частями произведения, а микро – это пульс музыки, единичные всплески. Чрезмерное использование компрессии удаляет как макро-, так и микродинамику. Сравним графики фонограмм с яроко выраженной макро- и микродинамикой – с графиком фонограммы, где музыка стала жертвой «войны за громкость» (такие фонограммы звукорежиссеры называют «горячими» – hot). 

Немного истории 

В 70х годах было замечено, что те произведения, которые звучали по радио громче остальных, нравились слушателям больше, а соответственно, аудионосители с этими произведениями лучше продавались. Так появился еще один способ увеличения продаж. В 1979 году термин «война громкости» использовал Роберт Орбан в статье, посвященной чрезмерной динамической обработке, применяемой на радио. В работе говорилось о том, как радиостанции в погоне за рейтингами нарушали все мыслимые и немыслимые границы, применяя чрезмерное компрессирование и лимитирование фонограмм. Но это на радио. На «виниле» же развернуться войне громкости мешали несколько факторов: во-первых, технические ограничения носителя – чрезмерный уровень мог заставить иглу «выпрыгнуть» из канавки. Во-вторых, большая громкость предполагала меньшую продолжительность звучания на носителе, в чем никто не был заинтересован. Ну и, наконец, виниловые диски не так часто прослушивались в шумных местах, а ни о каком портативном воспроизведении и речи быть не могло. Однако с изобретением CD ситуация стала меняться: все ограничения были сняты, а относительно портативные проигрыватели быстро стали пользоваться популярностью. На приводимом графике, полученном на основе анализа 4500 самых популярных фонограмм, показан рост «средней громкости» в период с 1969 по 2010 года; при этом до начала массового производства компакт-дисков в 1982 году можно видеть определенную стабильность «средней громкости». 

Проблемы 

«Войну громкости» обвиняют в порче музыки, в падении продаж, в причине потери слуха у большого числа молодых людей, в утомляемости при длительном прослушивании музыки. 

Так ли это? 

Как уже было сказано выше, использованием чрезмерной компрессии звукорежиссер лишает произведения как макро-, так и микродинамики. Кроме того, такая обработка вносит огромный процент нелинейных искажений, так как происходит клиппирование сигнала. Получается, что фонограмма звучит не только монотонно, однообразно, но и «грязно», непрозрачно. Звукорежиссер Боб Спир: «Музыка, которую мы слушаем последнее время – это не больше, чем сплошные ритмичные искажения!». Выходит, что произведение страдает, прежде всего, с художественной стороны, и особенно это слышно на записях акустических инструментов. На рисунках ниже изображено одно и то же произведение, но разных лет издания – 1982 и 2008. Версия 2008 года – это ремастеринг, который звучит в два раза громче, но менее музыкально. 

Было замечено, что огромная часть слушателей устанавливает громкость, ориентируясь на пиковые значения, доводя их до комфортного предела, однако звуковое давление (SPL) напрямую зависит от «средней громкости», и, соответственно, при прослушивании компрессированной музыки звуковое давление выше, чем при прослушивании не компрессированной. Кроме того, при воспроизведении, например, танцевальной электронной музыки басовая область звучит громко, но не энергично (так как почти отсутствует микродинамика), и обычный слушатель пытается это компенсировать увеличением громкости, доводя ее порой до немыслимых пределов. Как результат – проблемы со слухом у большого количества молодых людей. По результатам исследования, опубликованных в «Journal of the American Medical Association», в период с 1994 по 2005 год количество молодых людей, имеющих проблемы со слухом, увеличилось на 30 %. И цифры катастрофически растут. 

Интересно, что первый MP3-плеер попал в массы в 1996 году, и с его изобретением изменились условия прослушивания музыки – ее стало возможным слушать везде. Такие устройства чаще всего оснащены низкокачественными наушниками-вкладышами и нередко вносят искажения во время воспроизведения, особенно на пиковых значениях сигнала. Кроме того, формат MP3 – это формат сжатия с потерями (lossy), т. е. компромиссный, заведомо ущербный формат более низкого качества воспроизведения. Данный формат подходит больше для прослушивания музыки в ознакомительных целях, поэтому он так осуждаем аудиофилами и просто искушенными слушателями. Так появилась «горючая смесь»: формат MP3 + «война за громкость» + портативный MP3-проигрыватель. Известные производители высококачественного аудио-оборудования выражают беспокойство о будущем аудио-индустрии. По их мнению, на данный момент подрастает целое поколение людей, которые не ценят качественное воспроизведение музыки. В последнее время для продажи музыки все чаще используют музыкальные интернет-магазины (например, iTunes, Amazon), где можно оставить свой отзыв о приобретенном альбоме. Огромное количество слушателей выражают недовольство по поводу того, что музыка стала «утомительной для прослушивания». Часто потребители жалуются на то, что ее невозможно слушать длительное время. В статье Эрла Викерса, посвященной «войне громкости», проводится аналогия перекомпрессированной музыки с печатным текстом, где все буквы – заглавные (отсутствует микродинамика) и нет деления на абзацы (отсутствует макродинамика). Такой текст большинству людей читать довольно сложно. 

В результате описанных тенденций наблюдается – падение продаж музыки в аудиоиндустрии. Конечно, доказать взаимосвязь перекомпрессии и падения продаж нелегко. Исследований, проведенных в этом направлении, почти нет. Большинство людей в падении продаж склонно винить (впрочем, обоснованно) интернет-пиратство. Упомянем в этой связи работу Криса Джонсона, в которой проанализированы популярные альбомы последних десятилетий: автор приходит к выводу, что альбомы с большим динамическим диапазоном имели больший коммерческий успех. По данным RIAA (Recording Industry Association of America), одним из наиболее успешных альбомов всех времен является альбом группы «The Eagles» «Greatest Hits 1971–1975» , и он имеет чрезвычайно высокий динамический диапазон. 

Не секрет, что есть категория людей, которые ценят хорошее звучание, вкладывают деньги в высококачественное Hi-Fi, Hi-End оборудование и готовы также приобретать соответствующие аудионосители, но из-за разбушевавшейся «войны громкости» они удовлетворяющей их запросам музыки в продаже не находят. Многие из них и не подозревают о «войне громкости», но то, что музыка стала звучать хуже, согласятся все. Здесь вспоминается интересная статья с говорящим названием «Смерть Hi-Fi: в эпоху MP3 музыка стала звучать хуже, чем когда-либо». И есть огромное количество людей – «жертв MP3». Они совершенно не требовательны к качеству звучания, их устраивает перекомпрессированная музыка в низкокачественном формате MP3, размещенная бесплатно в интернет-сетях, зачастую на сайтах самих исполнителей в демонстрационных целях. Так о каких продажах может идти речь?! 

Решение проблемы 

Какие же существуют варианты решения проблемы на данный момент? Необходимо разработать решение для потребителей (слушателей) и для производителей (музыкантов, звукорежиссеров, продюсеров и т. д.). 

Потребителям необходимо иметь возможность слушать музыку с разной «средней громкостью» без постоянного обращения к регулятору уровня. Проще говоря, например, слушать «горячий» перекомпрессированный трек после некомпрессированного. Решением для потребителей является использование устройств, оснащенных алгоритмом громкостной нормализации (loudness normalization). Громкостную нормализацию не стоит путать с пиковой нормализацией, которая абсолютно бесполезна для этих задач. Громкость – это субъективный параметр, который зависит не только от RMS, но и от спектрально-временного состава. Соответственно, должен быть психоакустический алгоритм, который выравнивал бы по громкости произведения, записанные в разные годы с разным RMS, крест-фактором, спектром и т. д. Такие алгоритмы существуют. Например, в программной среде это реализовано в подключаемом модуле ReplayGain и в аудиопроигрывателе от компании Apple iTunes (опция SoundCheck). Данные программы в момент загрузки сканируют файл методом психоакустического анализа и уменьшают громкость фонограммы на необходимую величину. В результате фонограмма, которая звучала в 10 раз тише предыдущей, звучит с той же громкостью. ReplayGain использует эталонный уровень 89 дБ SPL (Target level) и RMS -14 дБ FS. Для радиовещания компанией Dolby разработан алгоритм Dialnorm, который преследует те же самые задачи, используя при этом RMS -31 дБ FS. 

Что касается производителей, то аудиоиндустрия давно нуждается в стандартах. Когда-то компания Dolby разработала звуковой стандарт для кинематографа, и «война громкости» его обошла стороной. Почему бы то же самое не сделать для аудиоиндустрии?! Как отправную точку при разработке стандартов можно использовать рекомендации немецкого звукорежиссера мастеринга Фридмана Тишмаера (таблица ниже) или рекомендации американского звукорежиссера Боба Катца, опубликованные в его работе «Мастеринг аудио: наука и искусство»: 

Jazz: не более – 16 dBFSRMS 

Classical: неболее – 18 dBFS RMS 

Rock/Hardrock/Metal/Punk: неболее – 10 dBFS RMS 

Techno/trance/Hard Electro: неболее – 10 dBFS RMS 

Pop/RnB/Hiphop/Broadcast: неболее – 12 dBFS RMS 

Кроме принудительных методов решения можно использовать и поощрительные. Например, можно проводить конкурсы звукорежиссеров сведения и мастеринга, где важным пунктом была бы оценка динамического диапазона фонограммы. Также для целевой аудитории, которая ценит качественно звучащую музыку, можно выпускать специальные издания, помеченные особым логотипом широкого динамического диапазона и высокого разрешения (знаком качества). 

Заключение 

Война громкости – это порочный круг. Один известный продюсер в своем интервью как-то сказал, что все звукорежиссеры прекрасно понимают: перекомпрессия – это плохо, она разрушает фонограмму. Но все точно так же считают, что без ее применения фонограмма окажется неконкурентоспособной и звукорежиссер может лишиться работы. Убеждение, что более громкая музыка продается лучше, стало причиной серьезнейшей проблемы, которую нужно решать. В конце концов, как сказал Эрл Викерс: «Если бы при оценке мастерства громкость была определяющим фактором, то Вагнер считался бы самым величайшим композитором, превзойдя Моцарта, Баха, Бетховена вместе взятых. А в свою очередь Вагнеру было бы далеко до творчества современного реактивного самолета!» 

Ваша корзина пуста