Памятная марка, выпущенная по случаю смерти Вильгельма Фуртвенглера в 1954 году.
* * *
Сжатие звука
«Сырой» звук
Звуковая волна графически изображается на временной оси. Чтобы изобразить этот график на бумаге, нам потребуется лист, длина которого будет прямо пропорциональна длительности звука:
Иными словами, звуковая информация передается с фиксированной скоростью. Аналоговые звуковые системы работают с неизменной скоростью передачи информации: заметьте, что скорость вращения пластинки или магнитофонной ленты при записи или воспроизведении не меняется. Аналогово-цифровое преобразование звука также выполняется с фиксированной скоростью. При этом генерируется файл с «сырым», необработанным звуком. «Сырой» звук CD-качества содержит много информации; следовательно, для его хранения требуются файлы большого размера, а для передачи — канал большой пропускной способности. Неизбежно встает вопрос о сжатии этой информации.
Сжатие
Сжатие данных — это процесс, позволяющий кодировать цифровую информацию с помощью меньшего количества бит. Для сжатия цифрового аудио используются форматы MP3, FLAC, Vorbis и другие. Эти форматы позволяют уменьшить размер звуковых файлов и быстрее передавать их. Однако и при передаче, и при воспроизведении требуется распаковка данных.
Сжатие данных может выполняться с помощью различных алгоритмов. Существуют два основных вида алгоритмов сжатия — с потерями или без потерь информации. Сжатие с потерями приводит к необратимому ухудшению качества звука. При сжатии без потерь качество звука не снижается, что позволяет при необходимости полностью восстановить исходный звук. В форматах сжатия произвольной информации (ZIP, RAR, ARJ и других) используются алгоритмы сжатия без потерь, в противном случае при сжатии и последующей распаковке данных терялись бы некоторые буквы и слова.
Также важно учитывать скорость работы алгоритмов: более сложный алгоритм может обеспечить более высокую степень сжатия, но если время сжатия и распаковки слишком велико, такой алгоритм может оказаться непригодным для передачи звука в реальном времени.
Какой формат лучше? Когда удобно использовать сжатие информации? В каждом отдельном случае баланс между качеством звука и экономией занимаемого места на диске и времени передачи определяется индивидуально. Очевидно, что профессионалы отдают предпочтение сохранению качества. В других случаях, например, при потоковой передаче или телефонной связи, предпочтительнее использовать сжатие информации.
Способы сжатия
В одном из основных методов сжатия используется поиск повторяющихся значений и закономерностей. Как можно сжать следующие последовательности бит?
1) 111111111111111111111111111111111…
2) 101101110111101111101111110111111…
3) 11010110001011010000101001110010…
Чтобы понять, как работает алгоритм сжатия, представьте, что нам нужно передать другому человеку такой набор инструкций, чтобы он смог воспроизвести исходное сообщение.
Передать первую последовательность нетрудно, достаточно дать команду «всегда записывать 1».
Команда для второй последовательности несколько сложнее: «Записывать каждый раз на 1 больше, разделяя группы единиц нулями».
Третья последовательность — самая сложная. Ее нерегулярность не позволяет сформировать набор инструкций, которые помогли бы существенно сэкономить время по сравнению с последовательной передачей исходных значений.
Распознавание закономерностей используется преимущественно при сжатии текстов и изображений. Однако информация, содержащаяся в звуковых файлах, имеет по большей части хаотичный характер, поэтому вышеописанные методы не позволяют достичь хорошей степени сжатия. Следовательно, при сжатии аудио с потерей данных используются другие приемы, например методы психоакустики. Один из таких приемов заключается в определении и устранении информации, «незначимой для восприятия» (это определение можно трактовать абсолютно по-разному). Иными словами, не производится кодирование звуков, которые неразличимы слушателем.
Другой прием — так называемое формирование шума (noise shaping), при котором шумы смещаются в спектр частот, менее заметных для слушателя, и воспринимаемый сигнал кажется более чистым. Разумеется, всегда можно уменьшить частоту дискретизации и число бит, используемых при кодировании.
MIDI
MIDI (англ. Musical Instrument Digital Interface — «Цифровой интерфейс музыкальных инструментов») — это набор команд, разработанный в 1982 году для связи компьютеров и электронных музыкальных инструментов.
Инструкции в формате MIDI хранятся в файлах, которые можно воспроизвести в любой момент. Так как эти файлы содержат только последовательность инструкций, они имеют намного меньший размер, чем обычные аудиофайлы. MIDI-файл можно назвать цифровой партитурой. Он состоит из последовательно записанных событий и команд. Эти события описывают множество параметров звука: его высоту, интенсивность, вибрато, звуковую панораму.
MIDI-инструкции могут выглядеть так: «Воспроизвести на пианино ноту до с определенной интенсивностью, в момент времени 1 прекратить воспроизведение и воспроизвести ноту ре в два раза меньшей интенсивности» и так далее. Благодаря такой простоте формат MIDI чрезвычайно удобен для создания музыкальных композиций. Пианист может сесть за MIDI-клавиатуру, сыграть мелодию, и она запишется в файл, который затем можно будет отредактировать.
Пример цифровой партитуры. Временные интервалы откладываются вдоль горизонтальной оси. Прямоугольники означают промежутки времени, в течение которых исполняется нота, лежащая на линии или промежутке между линиями обычной партитуры.
* * *
ДРЕВНИЕ ФОРМАТЫ MIDI
С развитием механики струнные инструменты дополнились колками для настройки струн, духовые — клапанами и многочисленными трубками. С появлением подобных элементов начали выдвигаться предположения об автоматизации инструментов. Попытки автоматизировать музыкальные инструменты предпринимались еще в античности.
К первым устройствам хранения аудиоинформации можно отнести цилиндры с намотанной на них бумагой, которые использовались для записи мелодии в автоматических пианино и органах. В бумаге проделывались отверстия и продольные разрезы, а цилиндр служил аналогом партитуры: временному интервалу между двумя звуками соответствовало расстояние между отверстиями, а нота определялась положением отверстия на линии, параллельной оси вращения цилиндра. Отверстие (1) означает наличие звука, отсутствие отверстия (0) означает отсутствие звука. Перфорированный лист бумаги — первое устройство для хранения информации и ее последующего автоматического воспроизведения.
Перфорированная лента механического пианино.
* * *
Оркестр
Для исполнения партитуры формата MIDI необходим оркестр — система, которая получает команды, сохраненные в MIDI-файле, обращается к базе звуков и воспроизводит нужные (или же получает нужные звуки путем преобразований уже имеющихся).
Источниками этих звуков являются, естественно, настоящие музыкальные инструменты. Так, в базе звуков, соответствующих пианино, хранятся все возможные ноты, сыгранные на этом инструменте. Аналогичным образом сохраняются звуки для всех остальных инструментов. В некоторых случаях записываются не все ноты, а, например, каждая третья. Остальные воссоздаются с помощью алгоритмов на основе уже сохраненных нот. Однако гораздо чаще записывается несколько вариантов одного и того же звука, имеющих различную интенсивность, различные методы исполнения, например, взятых с нажатой педалью и так далее.
Еще одним источником звуков является синтез: с его помощью искусственные звуки создаются с нуля или путем преобразований других звуков. Как правило, MIDI-синтезаторы имеют равномерно темперированный строй (о нем рассказывается в главе 1), хотя они обладают достаточной гибкостью для использования любого другого строя.
Квантование
Любой звук, сыгранный на MIDI-клавиатуре и записанный в реальном времени, фиксируется на цифровой партитуре, которую затем можно изменять, улучшать и так далее. Этот процесс называется квантованием и заключается в разбиении сигнала на конечное число интервалов. Он весьма схож с квантованием электрических сигналов при аналогово-цифровом преобразовании звука: все MIDI-инструкции приводятся к ближайшему «логичному» значению, соответствующему звуку, который предположительно хотел исполнить музыкант. Однако в основе этих автоматических преобразований лежат критерии точности, применение которых может с легкостью изменить исходное исполнение композиции.