Обработка звуковой информации

Курсовая работа

Для серьезной работы со звуковой информацией, как правило, требуется вызвать внешний аудиоредактор, то есть как раз программу для работы со звуком. В отличие от MIDI-секвенсеров, здесь качество программы определяется не только удобством и функциональностью интерфейса, не только наличием дополнительных утилит, но и собственно алгоритмами обработки. При одних и тех же условиях и параметрах на одном и том же звуковом материале разные программы могут дать совершенно непохожие результаты. Вообще говоря, звуковая информация — вещь «неуловимая»: порой незначительное изменение одного из многих параметров обработки может дать совершенно новый на слух результат. Так что, получив хорошие звуковые результаты, не поленитесь лишний раз записать получившийся файл на диск.

Перспективы развития и использования цифрового аудио видятся очень широкими. Казалось бы, все, что можно было сделать в этой области, уже сделано. Однако это не так. Остается масса еще совсем незатронутых проблем. Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

В области синтеза звука также есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли — существует масса нюансов звучания, которые почти невозможно воссоздать искусственно. Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.

17 стр., 8479 слов

Запись и обработка звука на базе студии звукозаписи

... темы данного исследования. Цель: изучить процесс и условия записи обработки звука на базе студии звукозаписи. студийный звукозапись ... грампластинки, создающие эффект объемного звучания. Иглы проигрывателя также стали ... На фото: Фонограф Эдисона На фото: Т.А. Эдисон и фонограф Основные недостатки восковых валиков - недолговечность и невозможность массового тиражирования. Каждая запись существовала ...

Как и графика, компьютерный звук бывает двух основных типов:

— Цифровой звук — аналог фотографии, точная цифровая копия введенных извне звуков. Это может быть сделанная с микрофона запись вашего голоса, копия звуковых дорожек с компакт-диска и т. д. Как и фотография, такой звук занимает много места… впрочем, аппетиты фотографии по сравнению со звуком просто ничтожны! Одна минута цифрового звука, записанного с максимальным качеством, занимает около 10 Мбайт.

  • Синтезированный звук — точнее, музыка в формате MIDI.

Суть MIDI-технологии можно изложить так: компьютер не просто проигрывает нужную вам мелодию, а синтезирует ее с помощью звуковой карты. MlDI-мелодии — это всего лишь системы команд, управляющие звуковой картой, коды нот, которые она должна «изобразить». Эта технология идеальна для компьютерных композиторов, поскольку позволяет с легкостью изменять любые параметры созданной на компьютере мелодии — заменять инструменты, добавлять или удалять их, изменять темп и даже стиль композиции. И файлы с MIDI-музыкой — крохотные, всего в несколько десятков килобайт. Но и недостатки у MIDI есть — голос в MIDI-файле не запишешь, да и музыка хорошо звучит лишь на очень качественной звуковой карте.

Можно выделить два основных типа музыкальных программ, с которыми придется работать:

  • Программы для записи и обработки цифровой музыки (Sound Forge, WaveLab, CoolEdit, SAW Plus);
  • Секвенсоры — редакторы синтезированной (MIDI) музыки (MidiStudio, MIDI Orchestrator Plus, Cakewaik Pro, Cubase).

    1.

Общие сведения об обработке звуковой информации

1.1 Профессиональная обработка звука

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4 стр., 1793 слов

Дискретизация сигнала

... дискретизации и квантования сигналов при их преобразовании в цифровые сигналы. 1. Дискретизация и квантование 1.1 Дискретизация Дискретизация - преобразование непрерывной ... непрерывной информации: Примером непрерывного сообщения служит человеческая речь, передаваемая модулированной звуковой волной; параметром сигнала ... используется при обработке сигналов, в том числе при сжатии звука и изображений. ...

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Echo (эхо).

Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того, чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха).

Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.

Reverberation (повторение, отражение).

Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно «оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом уже обработанный сигнал каждый цикл снова подается на вход смешиваясь с оригинальным сигналом.

Chorus (хор).

В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде.

Цифровой звук — это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот — приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Звуковая волна — это некая сложная функция, зависимость амплитуды звуковой волны от времени. Эту функцию описывают путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям — амплитудной и временной. Таким образом, оцифровка сигнала включает в себя два процесса — процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации — это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени.

12 стр., 5516 слов

Аналоговая и цифровая звукозапись: специфика и перспективы

... на высококачественные преобразователи. 3. АЦП и ЦАП Аналогово-цифровой и цифро-аналоговый преобразователи. Первый преобразует аналоговый сигнал в цифровое значение амплитуды, второй выполняет обратное преобразование. В англоязычной литературе ... звук, следует протянуть намагниченную ленту вдоль магнитной головки, причем скорость этого процесса должна быть равной скорости записи. В случае же с винилом ...

Квантование — процесс замены реальных значений сигнала приближенными с определенной точностью. Таким образом, оцифровка — это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению).

Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Однако, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

А также, частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения. Так, например, джиттер (jitter) — шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. При квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя — всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

8 стр., 3604 слов

Измерительные сигналы

... др.) Перечислите признаки, по которым классифицируются измерительные сигналы По характеру измерения информативного и временного параметров измерительные сигналы делятся на аналоговые, дискретные и цифровые. ... процессы, протекающие во времени однородно, частные реализации которых с постоянной амплитудой колеблются вокруг средней функции, называются стационарными. :Количественно свойства стационарных ...

1.2 Цифровая и аналоговая запись

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП).

Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала.

Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker).

Этот динамик присоединен к порту на материнской плате, у которого есть два положения — 1 и 0. Если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом, он «плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox — это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый — то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты — подключаемой, либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере — ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно).

Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

15 стр., 7248 слов

Технология использования банковских карт

... др., использовались данные интернета. 1. Банковская карта и основы ее использования 1.1. Банковская карта и ее функциональные характеристики. По мере развития банковского дела, совершенствования технологий безналичных расчетов и оказания электронных банковских услуг появились ...

1.3 Импульсная и частотная модуляция. Хранение оцифрованного звука

Для хранения цифрового звука существует много различных способов. Во-первых, блок оцифрованной аудио информации можно записать в файл «как есть», то есть последовательностью чисел (значений амплитуды).

В этом случае существуют два способа хранения информации.

Первый — PCM (Pulse Code Modulation — импульсно-кодовая модуляция) — способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления).

Именно в таком виде записаны данные на всех аудио CD.

Второй способ — ADPCM (Adaptive Delta PCM — адаптивная относительная импульсно-кодовая модуляция) — запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными «как есть». Тут тоже имеются два пути.

Кодирование данных без потерь (lossless coding) — это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры — это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.

Имеется и второй путь кодирования — кодирование данных с потерями (lossy coding).

Цель такого кодирования — любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов «упрощающих» оригинальный сигнал (выкидывая из него «ненужные» слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I, II, III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз).

Надо особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так называемой психоакустической модели, которая как раз и занимается «упрощением» оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняет анализ кодируемого сигнала, в процессе которого определяются участки сигнала, в определенных частотных областях которых имеются неслышные человеческому уху нюансы (замаскированные или неслышимые частоты), после чего происходит их удаление из оригинального сигнала. Таким образом, степень сжатия оригинального сигнала зависит от степени его «упрощения»; сильное сжатие достигается путем «агрессивного упрощения» (когда кодер «считает» ненужными множественные нюансы), такое сжатие, естественно, приводит к сильной деградации качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания. Говоря о способах хранения звука в цифровом виде нельзя не вспомнить и о носителях данных. Всем привычный аудио компакт-диск, появившийся в начале 80-х годов, широкое распространение получил именно в последние годы (что связано с сильным удешевлением носителя и приводов).

6 стр., 2951 слов

Устройства для долговременного хранения данных на ПК

... требования к применению устройств хранения данных. В этой связи рассмотрение вопроса, касающегося средств долговременного хранения информации, представляется весьма актуальным. Данная тема будет раскрыта с помощью ... 13 мс ; 3) время задержки - это время от момента позиционирования блока головок на нужный цилиндр до позиционирования конкретной головки на конкретный сектор, другими словами, это ...

А до этого носителями цифровых данных являлись кассеты с магнитной лентой, но не обычные, а специально предназначенные для так называемых DAT-магнитофонов. Эти магнитофоны использовались, в основном, в студиях звукозаписи. Преимущество таких магнитофонов было в том, что, не смотря на использование привычных носителей, данные на них хранились в цифровом виде и практически никаких потерь при чтении/записи на них не было (что очень важно при студийной обработке и хранении звука).

Сегодня появилось большое количество различных носителей данных, кроме привычных всем компакт дисков. Носители совершенствуются и с каждым годом становятся более доступными и компактными. Это открывает большие возможности в области создания мобильных аудио проигрывателей.

1.4 Аппаратное обеспечение обработки звуковой информации

Немаловажная часть разговора о звуке связана с аппаратурой. Существует много различных устройств для обработки и ввода/вывода звука. Касательно обычного персонального компьютера следует подробнее остановиться на звуковых картах. Звуковые карты принято делить на звуковые, музыкальные и звукомузыкальные. По конструкции же все звуковые платы можно разделить на две группы: основные (устанавливаемые на материнской плате компьютера и обеспечивающие ввод и вывод аудио данных) и дочерние (имеют принципиальное конструктивное отличие от основных плат — они чаще всего подключаются к специальному разъему, расположенному на основной плате).

Дочерние платы служат чаще всего для обеспечения или расширения возможностей MIDI-синтезатора.

Звукомузыкальные и звуковые платы выполняются в виде устройств, вставляемых в слот материнской платы (либо уже встроены в нее изначально).

Визуально они имеют обычно два аналоговых входа — линейный и микрофонный, и несколько аналоговых выходов: линейные выходы и выход для наушников. В последнее время карты стали оснащаться также и цифровым входом и выходом, обеспечивающим передачу аудио между цифровыми устройствами. Аналоговые входы и выходы обычно имеют разъемы, аналогичные разъемам головных наушников (1/8”).

Вообще, входов у звуковой платы немного больше, чем два: аналоговые CD, MIDI и другие входы. Они, в отличие от микрофонного и линейного входов, расположены не на задней панели звуковой платы, а на самой плате; могут иметься и другие входы, например, для подключения голосового модема. Цифровые входы и выходы обычно выполнены в виде интерфейса S/PDIF (интерфейс цифровой передачи сигналов) с соответствующим разъемом (S/PDIF — сокращение от Sony/Panasonic Digital Interface — цифровой интерфейс Sony/Panasonic).

49 стр., 24291 слов

Разработка генератора сигналов на цифровых микросхемах

... входным сигналом. Действительно, при изменении входного сигнала на одну градацию в показании происходит замена только в одном разряде и быстро -действие определяется задержкой в ... конструкции, удобство эксплуатации. Аналитическая часть, Общие вопросы проектирования электронных цифровых приборов . 1.1 Классификация цифровых приборов . Правильно составленная классификация облегчает изучение тех или ...

S/PDIF — это «бытовой» вариант более сложного профессионального стандарта AES/EBU (Audio Engineering Society / European Broadcast Union).

Сигнал S/PDIF используется для цифровой передачи (кодирования) 16-разрядных стерео данных с любой частотой дискретизации. Помимо перечисленного, на звукомузыкальных платах имеется MIDI-интерфейс с разъемами для подключения MIDI-устройств и джойстиков, а также для подсоединения дочерней музыкальной карты (хотя в последнее время возможность подключения последней становится редкостью).

Некоторые модели звуковых карт для удобства пользователя оснащаются фронтальной панелью, устанавливаемой на лицевой стороне системного блока компьютера, на которой размещаются разъемы, соединенные с различными входами и выходами звуковой карты.

Определим несколько основных блоков, из которых состоят звуковые и звукомузыкальные платы.

1. Блок цифровой обработки сигналов (кодек).

В этом блоке осуществляются аналого-цифровые и цифро-аналоговые преобразования (АЦП и ЦАП).

От этого блока зависят такие характеристики карты, как максимальная частота дискретизации при записи и воспроизведении сигнала, максимальный уровень квантования и максимальное количество обрабатываемых каналов (моно или стерео).

В немалой степени от качества и сложности составляющих этого блока зависят и шумовые характеристики.

2. Блок синтезатора. Присутствует в музыкальных картах. Выполняется на основе либо FM-, либо WT-синтеза, либо на обоих сразу. Может работать как под управлением собственного процессора, так и под управлением специального драйвера.

3. Интерфейсный блок. Обеспечивает передачу данных по различным интерфейсам (например, S/PDIF).

У чисто звуковой карты этот блок чаще отсутствует.

4. Микшерный блок. В звуковых платах микшерный блок обеспечивает регулировку:

  • уровней сигналов с линейных входов;
  • уровней с MIDI входа и входа цифрового звука;
  • уровня общего сигнала;
  • панорамирования;
  • тембра.

Что такое MIDI-синтезатор? Название этого устройства пошло от его основного предназначения — синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation — частотная модуляция) и WT (Wave Table — таблично-волновой).

В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является по сути суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

Надо отметить, что поскольку MIDI-данные — это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура — это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (. MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

95 стр., 47316 слов

Дипломная работа разработка программы лояльности

... методов решения основных задач системы управления бонусной программой лояльности и описанием предлагаемого в дипломной работе математического инструментария анализа клиентской базы владельцев бонусных ... активного пользования бонусами. В третьей главе дипломной работы с целью оценки экономического эффекта от внедрения бонусной программы проведено моделирование и прогнозирование объема продаж ...

1.5 Запись образцов звучания и модуляционные эффекты

Сэмплирование — это запись образцов звучания (сэмплов) того или иного реального музыкального инструмента. Сэмплирование является основой волнового синтеза (WT-синтеза) музыкальных звуков. Если при частотном синтезе (FM-синтезе) новые звучания получают за счет разнообразной обработки простейших стандартных колебаний, то основой WT-синтеза являются заранее записанные звуки традиционных музыкальных инструментов или звуки, сопровождающие различные процессы в природе и технике. С сэмплами можно делать все, что угодно. Можно оставить их такими, как есть, и WT-синтезатор будет звучать голосами, почти неотличимыми от голосов инструментов-первоисточников. Можно подвергнуть сэмплы модуляции, фильтрации, воздействию эффектов и получить самые фантастические, неземные звуки.

В принципе, сэмпл — это ни что иное, как сохраненная в памяти синтезатора последовательность цифровых отсчетов, получившихся в результате аналого-цифрового преобразования звука музыкального инструмента. Если бы не существовала проблема экономии памяти, то звучание каждой ноты можно было бы записать в исполнении каждого музыкального инструмента. А игра на таком синтезаторе представляла бы собой воспроизведение этих записей в необходимые моменты времени. Сэмплы хранятся в памяти не в том виде, в каком они получаются сразу же после прохождения АЦП. Запись подвергается хирургическому воздействию, делится на характерные части (фазы): начало, протяженный участок, завершение звука. В зависимости от применяемой фирменной технологии эти части могут делиться на еще более мелкие фрагменты. В памяти хранится не вся запись, а лишь минимально необходимая для ее восстановления информация о каждом из фрагментов. Изменение протяженности звучания производится за счет управления числом повторений отдельных фрагментов.

В целях еще большей экономии памяти был разработан способ синтеза, позволяющий хранить сэмплы не для каждой ноты, а лишь для некоторых. В этом случае изменения высоты звучания достигается путем изменения скорости воспроизведения сэмпла.

Для создания и воспроизведения сэмплов служит синтезатор. В наши дни синтезатор конструктивно реализован в одном-двух корпусах микросхем, которые представляет собой специализированный процессор для осуществления всех необходимых преобразовании. Из закодированных и сжатых с помощью специальных алгоритмов фрагментов он собирает сэмпл, задает высоту его звучания, изменяет в соответствии с замыслом музыканта форму огибающей колебания, имитируя либо почти неощутимое касание, либо удар по клавише или струне. Кроме того, процессор добавляет различные эффекты, изменяет тембр с помощью фильтров и модуляторов.

В звуковых картах находят применение несколько синтезаторов различных фирм.

Наряду с сэмплами, записанными в ПЗУ звуковой карты, в настоящее время стали доступными наборы сэмплов (банки), созданные как в лабораториях фирм, специализирующихся на синтезаторах, так и любителями компьютерной музыки. Эти банки можно найти на многочисленных лазерных дисках и в Internet.

Модуляционные эффекты:

Дилэй (Delay) в переводе означает «задержка». Необходимость в этом эффекте возникла с появлением стереофонии. Сама природа слухового аппарата человека предполагает в большинстве ситуаций поступление в мозг двух звуковых сигналов, отличающихся временем прихода. Если источник звука находится «перед глазами», на перпендикуляре, проведенном к линии, проходящей через уши, то прямой звук от источника достигает обоих ушей в одно и то же время. Во всех остальных случаях расстояния от источника до ушей различны, поэтому либо одно, либо другое ухо воспринимает звук первым.

Время задержки (разницы во времени приема сигналов ушами) будет максимальным в том случае, когда источник расположен напротив одного из ушей. Так как расстояние между ушами около 20 см, то максимальная задержка может составлять около 8 мс. Этим величинам соответствует волна звукового колебания с частотой около 1,1 кГц. Для более высокочастотных звуковых колебаний длина волны становится меньше, чем расстояние между ушами, и разница во времени приема сигналов ушами становится неощутимой. Предельная частота колебаний, задержка которых воспринимается человеком, зависит от направления на источник. Она растет по мере того, как источник смещается от точки, расположенной напротив одного из ушей, к точке, расположенной перед человеком.

Дилэй применяется, прежде всего, в том случае, когда запись голоса или акустического музыкального инструмента, выполненную с помощью единственного микрофона, встраивают в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписей. Дилэй может применяться и для получения эффекта однократного повторения каких-либо звуков. Величина задержки между прямым сигналом и его задержанной копией в этом случае выбирается большей, чем естественная задержка в 8 мс. Для коротких и резких звуков время задержки, при котором основной сигнал и его копия различимы меньше, чем для протяженных звуков. Для произведений, исполняемых в медленном темпе, задержка может быть больше, чем для быстрых композиций,

При определенных соотношениях громкостей прямого и задержанного сигнала может иметь место психоакустический эффект изменения кажущегося расположения источника звука на стереопанораме.

Этот эффект реализуется с помощью устройств, способных осуществлять задержку акустического или электрического сигналов. Таким устройством сейчас чаще всего служит цифровая линия задержки, представляющая собой цепочку из элементарных ячеек — триггеров задержки. Для наших целей достаточно знать, что принцип действия триггера задержки сводится к следующему: двоичный сигнал, поступивший в некоторый тактовый момент времени на его вход, появится на его выходе не мгновенно, а только в очередной тактовый момент. Общее время задержки в линии тем больше, чем больше триггеров задержки включено в цепочку, и тем меньше, чем меньше тактовый интервал (чем больше тактовая частота).

В качестве цифровых линий задержки можно использовать запоминающие устройства.

Разумеется, для применения цифровой линии задержки сигнал должен быть сначала преобразован в цифровую форму. А после прохождения его копии через линию задержки происходит обратное, цифро-аналоговое преобразование. Исходный сигнал и его задержанная копия могут быть раздельно направлены в различные стереоканалы, но могут быть и смешаны в различных пропорциях. Суммарный сигнал может быть направлен либо в один из стереоканалов, либо в оба.

В звуковых редакторах дилэй реализуется программным (математическим) путем за счет изменения относительной нумерации отсчетов исходного сигнала и его копии.

В основу звуковых эффектов флэнжер (Flanger) и фэйзер (Phaser) также положена задержка сигнала.

Эффект повторного звучания может быть вызван и распространением звука от источника к приемнику различными путями (например, звук может приходить, во-первых, напрямую и, во-вторых, отразившись от препятствия, находящегося чуть в стороне от прямого пути).

И в том, и в другом случаях время задержки остается постоянным. В реальной жизни этому соответствует маловероятная ситуация, когда источник звука, приемник звука и отражающие предметы неподвижны относительно друг друга. При этом частота звука не изменяется, каким бы путем и в какое бы ухо он не приходил.

Если же какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это есть ни что иное, как проявление эффекта Доплера.

И флэнжер, и фэйзер имитируют проявления взаимного перемещения трех элементов: источника, приемника и отражателя звука. По сути дела, и тот, и другой эффекты представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная, флэнжер отличается от фейзера тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот, сигнала значительно большее, чем для второго. Образно говоря, флэнжер наблюдался бы в том случае, когда певец мчался бы к зрителю, сидящему в зале, со скоростью автомобиля. А вот для того, чтобы ощутить фэйзер в его, так сказать, первозданном виде, движущегося источника звука не требуется, зрителю достаточно часто-часто вертеть головой из стороны в сторону.

Упомянутые количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются различными техническими средствами.

Значения времени задержек, характерных для флэнжера, существенно превышают период звукового колебания, поэтому для реализации эффекта используют многоразрядные и многоотводные цифровые линии задержки. С каждого из отводов снимается свой сигнал, который в свою очередь подвергается частотной модуляции.

Для фэйзера, наоборот, характерно очень маленькое время задержки. Оно столь мало, что оказывается сравнимо с периодом звукового колебания. При столь малых относительных сдвигах принято говорить уже не о задержке копий сигнала во времени, а о разности их фаз. Если эта разность фаз не остается постоянной, а изменяется по периодическому закону, то мы имеем дело с эффектом фейзера. Так что можно считать фейзер предельным случаем флэнжера.

Чтобы получить флэнжер, вместо одной акустической системы использовали несколько систем, размещенных на различных расстояниях от слушателей. В необходимые моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалось впечатление приближения или удаления источника звука. Задержку звука выполняли и с помощью магнитофонов со сквозным трактом запись/ воспроизведение. Одна головка записывает, другая — воспроизводит звук с задержкой на время, необходимое для перемещения ленты от головки к головке. Для частотной модуляции особых мер можно было и не придумывать. Каждому аналоговому магнитофону присущ естественный недостаток, называемый детонацией, которая проявляется в виде «плавания» звука. Стоило чуть-чуть специально усилить этот эффект, изменяя напряжение, питающее двигатель, и получалась частотная модуляция.

Для реализации фэйзера методами аналоговой техники использовали цепочки фазовращателей, управляемых электрическим путем. А иногда можно было наблюдать и такую картину: в акустической системе, подключенной к ЭМИ или электрогитаре, вдруг начинало вращаться что-то вроде вентилятора. Звук пересекался с подвижными лопастями и отражался от них, получалась фазовая модуляция.

Реверберация [Reverb] относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает дилэй. Однако при реверберации число задержанных копий сигнала может быть значительно больше, чем для дилэя. Теоретически число копий может быть бесконечным. Кроме того, при реверберации, чем больше время запаздывания копии сигнала, тем меньше ее амплитуда (громкость).

Эффект зависит от того, каковы временные промежутки между копиями сигналов и какова скорость уменьшения уровней их громкости. Если промежутки между копиями малы, то получается собственно эффект реверберации. Возникает ощущение объемного гулкого помещения. Звуки музыкальных инструментов становятся сочными, объемными, с богатым тембровым составом. Голоса певцов приобретают напевность, недостатки, присущие им, становятся малозаметными.

Если промежутки между копиями велики (более 100 мс), то правильнее говорить не об эффекте реверберации, а об эффекте «эхо». Интервалы между соответствующими звуками при этом становятся различимыми. Звуки перестают сливаться, кажутся отражениями от удаленных преград.

Основным элементом, реализующим эффект реверберации, является устройство, создающее эхо-сигнал.

Эхо-камера представляет собой комнату с сильно отражающими стенами, в которую помещен источник звукового сигнала (громкоговоритель) и приемник (микрофон).

Преимущество эхо-камеры состоит в том, что затухание звука происходит в ней естественным путем (что очень трудно обеспечить другими способами).

В то время как звук продолжает реверберировать в трех измерениях, исходная волна разбивается на множество отраженных, которые достигают микрофона за уменьшающиеся промежутки времени.

Наряду с эхо-камерами для имитации реверберации использовали стальные пластины, точнее, довольно большие по размеру листы. Колебания в них вводили и снимали с помощью устройств, по конструкции и принципу действия похожих на электромагнитные головные телефоны. Для получения удовлетворительной равномерности амплитудно-частотной характеристики толщина листа должна быть выдержана с точностью, которую не обеспечивают обычные технологии проката стали. Реверберация здесь была не трехмерной, а плоской. Сигнал имел характерный металлический оттенок.

В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы. С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, в ней возбуждались механические колебания, которые с задержкой достигали второго конца пружины, связанного с датчиком. Эффект повторения звука обусловлен многократным отражением волн механических колебаний от концов пружины.

На смену этим несовершенным устройствам пришли ревербераторы магнитофонные. Принцип формирования в них эхо-сигнала состоит в том, что исходный сигнал записывается на ленту записывающей магнитной головкой, а через время, необходимое для перемещения ленты к воспроизводящей головке, считывается ею. Через цепь обратной связи уменьшенный по амплитуде задержанный сигнал вновь подается на запись, что и создает эффект многократного отражения звука с постепенным затуханием. Качество звука определяется параметрами магнитофона. Недостаток магнитофонного ревербератора заключается в том, что при приемлемых скоростях протяжки ленты удается получить только эффект эха. Для получения собственно реверберации требуется либо еще сильнее сблизить магнитные головки (чего не позволяет сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем, содержащих в одном корпусе сотни и тысячи цифровых триггеров (о которых мы уже говорили) появилась возможность создавать высококачественные цифровые ревербераторы. В таких устройствах сигнал может быть задержан на любое время, необходимое как для получения реверберации, так и для получения эха.

В звуковых картах реверберация, в конечном счете, основана именно на цифровой задержке сигналов.

Наблюдая этапы развития средств реверберации, можно предположить, что когда-нибудь появятся и математические модели пружинных и магнитофонных ревербераторов. Ведь не исключено, что есть люди, испытывающие ностальгические чувства по отношению к звукам музыки, окрашенным дребезгом пружин или шипением магнитной ленты.

2. Программы для обработки звуковой информации

2.1 Редакторы цифрового аудио и программы для написания музыки

Тема программного обеспечения очень широка, поэтому здесь мы только вкратце обсудим основные представители программ для обработки звука. Наиболее важный класс программ — редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами (как встроенными, так и подключаемыми извне — об этом позже), очистка от шумов, имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторые из таких программ: Cool Edit Pro (Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude Producer (Magix), Wavelab (Steinberg).

Основные возможности редактора Cool Edit Pro 2.0 — пример рабочего окна программы в многодорожечном режиме: редактирование и сведение аудио на 128 дорожках, 45 встроенных DSP-эффектов, включая инструменты для мастеринга, анализа и реставрации аудио, 32-битная обработка, поддержка аудио с параметрами 24 бит / 192 КГц, мощный инструментарии для работы с петлями (loops), поддержка DirectX, а также управление SMPTE/MTC, поддержка работы с видео и MIDI и прочее.

Основные возможности редактора Sound Forge 6.0a — пример рабочего окна программы: мощные возможности не деструктивного редактирования, многозадачная фоновая обработка заданий, поддержка файлов с параметрами до 32 бит / 192 КГц, менеджер предустановок, поддержка файлов более 4 Гб, работа с видео, большой набор эффектов обработки, восстановление после зависаний, предпрослушивание примененных эффектов, спектральный анализатор и прочее.

Не менее важная в функциональном смысле группа программ — секвенсоры (программы для написания музыки).

Чаще всего, такие программы используют MIDI-синтезатор (аппаратный внешний или встроенный почти в любую звуковую карту, либо программный, организуемый специальным программным обеспечением).

Такие программы предоставляют пользователю либо привычный нотный стан (как, например, программа Finale от CODA), либо более распространенный способ редактирования аудио на компьютере, так называемый, piano-roll (это более понятное представление музыки для людей, не знакомых с нотами; в таком представлении вертикально имеется ось с изображением клавиш пианино, а горизонтально откладывается время, таким образом, ставя на пересечении штрихи разной длинны, добиваются звучания определенной ноты с определенной продолжительностью).

Встречаются и программы, позволяющие просматривать и редактировать аудио в обоих представлениях. Развитые секвенсоры помимо редактирования аудио во многом могут дублировать возможности редакторов цифрового аудио — осуществлять запись на CD, совмещать MIDI-дорожки с цифровыми сигналами и осуществлять мастеринг. Яркие представители такого класса программ: Cubase (Steinberg), Logic Audio (Emagic), Cakewalk (Twelve Tone Systems) и уже упомянутый Finale.

Основные возможности редактора Cubase 5.1 — пример рабочего окна программы в режиме просмотра MIDI дорожек: редактирование музыки в реальном времени используя графическое представление информации, высокое разрешение редактора (15360 пульсов на четверть), практически не лимитированное количество дорожек, 72 аудио канала, поддержка VST32, 4 эквалайзера на канал и другие поканальные эффекты, встроенные инструменты обработки с использованием аналогового моделирования (виртуальные инструменты, эффект процессоры, инструменты микширования и записи) и множество других возможностей.

Основные возможности редактора Logic Audio 5 — пример рабочего окна программы: работа со звука при точности в 32 бита, высокое временное разрешение событий, самоадаптируемый микшер аудио и MIDI, оптимизируемый интерфейс пользователя, синхронизация с видео, виртуально неограниченное число MIDI-дорожек, обработка звука в реальном времени, полная синхронизация с MTC, MMC, SMPTE, встроенные модули обработки и автоинструменты, поддержка большого количество аппаратного оборудования, а также множество других возможностей.

В наборе программ пользователя, занимающегося обработкой звука, имеется множество разных инструментов, так было раньше и так будет впредь — универсальных комбайнов для работы со звуком не бывает. Однако, не смотря на все разнообразие ПО, в программах часто используются схожие механизмы для обработки звука (например, процессоры эффектов и прочие).

На каком-то этапе разработки аудио ПО, производители поняли, что удобнее сделать в своих программах возможность подключения внешних инструментов, чем каждый раз создавать заново инструменты для каждой отдельной программы. Так что многие программы, относящиеся к той или иной группе ПО, позволяют подключать так называемые «плагины» — внешние подключаемые модули, расширяющие возможности обработки звука. Это стало возможным в результате появления нескольких стандартов на интерфейс между программой и подключаемым модулем. На сегодняшний день существуют два основных стандарта на интерфейс: DX и VST. Существование стандартов позволяет подключать один и тот же плаг-ин к совершенно разным программам, не заботясь о возникновении конфликтов и неполадок. Говоря о самих плаг-инах, надо сказать, что это просто огромное семейство программ. Обычно, один плаг-ин является механизмом, реализующим какой-то конкретный эффект, например, реверберацию или низкочастотный фильтр.

Из интересных плагинов можно вспомнить, например iZotope Vinyl, — он позволяет придать звучанию эффект виниловой пластинки — пример рабочего окна плагина в среде Cool Edit Pro), Antares AutoTune позволяет в полуавтоматическом режиме корректировать звучание вокала, а Orange Vocoder являет собой замечательный вокодер (механизм для придания звучанию различных инструментов схожести со звучанием голоса человека).

2.2 Программы-анализаторы аудио реставраторы аудио и трекеры

Обработка звука и написание музыки — это не только творческий процесс. Иногда нужен скрупулезный анализ данных, а также осуществление поиска огрехов их звучания. Кроме того, аудио материал, с который приходится иметь дело, не всегда желаемого качества. В этой связи нельзя не вспомнить о целом ряде программ-анализаторов аудио, специально предназначенных для осуществления измерительных анализов аудио данных. Такие программы помогают представить аудио данные удобнее, чем обычные редакторы, а также внимательно изучить их с помощью различных инструментов, таких как FFT-анализаторы (построители динамических и статических амплитудно-частотных характеристик), построители сонограмм, и прочих. Одна из наиболее известных и развитых программ подобного плана — программа SpectraLAB (Sound Technology Inc.), чуть более простые, но мощные — Analyzer2000 и Spectrogram.

Программа SpectraLAB — наиболее мощный продукт подобного рода, существующий на сегодня — пример рабочего окна программы, на экране: спектральная картина в трез представлениях и фазовая картина).

Возможности программы: 3 режима работы (пост режим, режим реального времени, режим записи), основной инструментарий — осциллограф, спектрометр (двухмерный, трехмерный, а также построитель сонограмм) и фазометр, возможность сравнения амплитудно-частотных характеристик нескольких сигналов, широкие возможности масштабирования, измерительные инструменты: нелинейных искажений, отношения сигнал/шум, искажений и прочие.

Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудио-кассет, и провести другую корректировку аудио. Программы подобного рода: Dart, Clean (от Steinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

Основные возможности реставратора Clean 3.0 — рабочее окно программы: устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.

Трекеры — это отдельная категория звуковых программ, предназначенных именно для создания музыки. Структура и концепция построения трекерных файлов очень похожа на принцип хранения MIDI-информации. В трекерных модулях (файлы, созданные в трекерах, принято называть модулями), также, как и в MIDI-файлах, содержится партитура в соответствии с которой должны проигрываться инструменты. Кроме того, в них содержится информация о том, какие эффекты и в какой момент времени должны быть применены при проигрывании того или иного инструмента. Однако, принципиальное отличие трекерных модулей от MIDI-файлов заключается в том, что проигрываемые в этих модулях инструменты (или, точнее сказать, сэмплы) хранятся в самих модулях (то есть внутри файлов), а не в синтезаторе (как это происходит в случае с MIDI).

Такой способ хранения музыки имеет массу преимуществ: размер файлов невелик по сравнению с непрерывной оцифрованной музыкой (поскольку записываются только использованные инструменты и партитура в виде команд), нет зависимости звучания от компьютера, на котором происходит воспроизведение (в MIDI, как мы говорили, есть зависимость звучания от используемого синтезатора), имеется большая свобода творчества, поскольку автор музыки не ограничен наборов инструментов (как в MIDI), а может использовать в качестве инструмента любой оцифрованный звук. Основные программы-трекеры Scream Tracker, Fast Tracker, Impulse Tracker, OctaMED SoundStudio, MAD Tracker, ModPlug Tracker.