Создание собственного голоса AI

From Valve Developer Community
Jump to: navigation, search
English (en)русский (ru)
... Icon-Important.png

Эта статья описывает способы создания и наложения фильтра голоса глобального ИИ как у GLaDOS в Portal.

Фон

Профессиональная певица и актриса озвучки Эллен МакЛейн (В английской версии) озвучивала ИИ ГЛаДОС (GLaDOS) в игре Portal. Привычный игроку голос достигается в несколько этапов. Следуя комментариям режиссёра, Эллен слушала синтезированные text-to-speech образцы голоса, дабы дать ей понять, как преподать её реплики. Затем она читала свои строки в монотонной, роботизированной манере. Затем записи подвергались цифровой обработке, через "ограничение тембра, модуляцию тембра и поднятие форманта". Этот процесс имеет название коррекция тембра, обычно упоминаемый как "autotune". В то время как коррекция тембра широко используется для создания отличительного музыкального звука и правильного пения вне тембра, можно использовать эту обработку, чтобы сделать голос более компьютерным, без лишнего мелодичного звучания.

Некоторые коммерческие утилиты редактирования предоставляют коррекцию тембра, что позволяет добиться того же результата, что и в оригинальной Portal.

Требуемый инструментарий

Для создания хорошо звучащего голоса ИИ вам потребуется микрофон и соответствующее ПО для редактирования аудио. Рекомендуется использовать высококачественный микрофон для записи музыки и вокала - выжать приемлимое качество из микрофона игровой гарнитуры не получится. В вашем редакторе должен быть полный набор функций коррекции тембра с возможностью ручной настройки параметров. Некоторые пакеты ПО с этой функцией:

  • Antares Auto-Tune Evo (Функция есть в демо-версии)
  • Melodyne Essential (Формально Melodyne Uno. Функция есть в демо-версии)
  • Пакеты MAGIX Music Maker (Функция в этом пакете представлена как "Эластичное аудио" ("Elastic audio"). В демо-версии эта функция отсутствует)

Основы редактирования

Blank image.pngTodo: Завершить перевод этой статьи.

Для начала запишите ваши реплики в отдельные файлы. Так что, если триггер должен активировать реплику из, скажем, 3 предложений, то запишите их как одно и сохраните в своём файле.

Первый шаг - применение чернового прохода автонастройки. This will generally shift each syllable to the nearest semitone (preferably in the chromatic scale in this situation), and may reduce vocal vibrato (constant subtle fluctuation in pitch). From here, you may want to manually shift individual syllables or words up or down in pitch; this will create a more artificial sound and can also be used to emphasize certain parts of the line. It helps to listen through the original GLaDOS dialogue repeatedly to get a feel for when to change the pitch.

Finally, by increasing the Formant slightly, you can give the AI voice a slightly more "squeaky" sound which will enhance the artificial feel.

Пошаговая инструкция

Blank image.pngTodo: Создать пошаговую инструкцию с одной из программ, или перевести с английского, когда появится в оригинальной статье.

Ссылки