Заменяет голос в аудио на выбранную модель и помогает создать свою голосовую модель по записи. Цена: замена голоса - 20 ₽ за аудио, создание модели - 70 ₽, 90 ₽ или 120 ₽ в зависимости от качества.
Замена голоса - это инструмент для замены голоса в песне или речи и для обучения собственной голосовой модели по аудиозаписи. По набору настроек он похож на решения на базе RVC: такие системы берут исходный голос, сохраняют интонацию и ритм фразы, а тембр подменяют на голос выбранной модели.
Разработчики подобных систем обычно делают упор на две вещи: чтобы голос был похож на выбранную модель и чтобы при этом не терялась подача исходника - паузы, манера произношения, высота и эмоциональные акценты. В открытых материалах по RVC говорится, что такие инструменты умеют обучать модели на сравнительно небольших наборах аудио, а для определения высоты голоса часто используют алгоритм RMVPE, который считается удачным балансом между качеством и скоростью.
Для создания своей модели здесь нужен отдельный чистый аудиофайл без музыки, шума и сильного эха. Это логично: чем чище запись, тем меньше в готовом голосе будет хрипов, металлического оттенка и случайных артефактов. Для замены голоса, наоборот, загружается уже готовое аудио, после чего можно выбрать обученную модель и при желании подкрутить результат вручную.
Сначала система отделяет особенности речи или вокала от самого тембра. Потом она накладывает на эту основу голос выбранной модели. За счёт этого фраза остаётся похожей по ритму и интонации на оригинал, но звучит уже другим голосом.
При обучении модели нейросеть слушает вашу запись и запоминает характер тембра: насколько голос плотный, звонкий, мягкий, высокий или низкий. После этого эту модель можно применять к новым аудиофайлам - например, к песне, дикторской записи или разговорному фрагменту.
В режиме замены голоса доступны такие параметры:
В режиме создания модели видны другие настройки:
Лучший результат обычно получается на чистом исходнике. Когда в записи много шума, сильный реверб, музыка забивает вокал или голос записан в комнате с эхом, качество падает - согласные могут смазываться, а тембр становится неестественным.
На сложном пении с экстремально высокими нотами, рычанием, шёпотом или плотным автотюном результат бывает менее ровным. Ещё один частый момент - хорошо обученная модель всё равно не делает чудо из плохой записи: слабый микрофон, перегруз и фоновый гул потом слышны и в преобразованном аудио.
Есть и правовое ограничение: для обучения чужого голоса нужно согласие правообладателя. Это прямо отражено в форме инструмента.
По интерфейсу этот инструмент рассчитан не только на тех, кто хочет нажать одну кнопку, но и на людей, которым нужна ручная подстройка результата. Здесь есть пресеты для типовых сценариев и отдельные ползунки для высоты, громкости вокала и инструментала, реверба и технических параметров преобразования.
От более простых голосовых конвертеров он отличается тем, что умеет не просто менять тембр на готовый шаблон, а обучать собственные модели по загруженной записи. Это полезно, когда нужен именно свой голос, а не абстрактный мужской или женский вариант.