Перейти к основному содержимому Главная страница каталога дополнений для NVDA от русскоязычного сообщества NVDA.RU.

Официальный русскоязычный каталог дополнений NVDA

Крупнейший каталог дополнений для программы экранного доступа NVDA, доступный в Интернете

Каталог дополнений от «🇷🇺 Русскоязычного сообщества NVDA.RU.»

Драйвер ForwardTacotron TTS

Краткое описание

Дополнение ForwardTacotron - это драйвер добавляющий поддержку модели синтеза речи ForwardTacotron для NVDA.
Используется сервер flask.

Назад к оглавлению

Основная информация

Название Версия Совместимость с API NVDA Последняя протестированная версия NVDA Минимальная версия NVDA Дата загрузки в каталог Размер Лицензия
ForwardTacotron 0.1a1 2023.1 2023.1 2019.3 23-09-2023 22:44:20 209 Кб. GPL v2
Назад к оглавлению

Информация о локализации на русский язык

Назад к оглавлению

Скачать

ForwardTacotron-V.0.1a1.nvda-addon

Назад к оглавлению

Разделы

Назад к оглавлению

Справка

Уважаемые пользователи сайта. Еще не все дополнения имеют локализованную справку, кроме того, не у всех дополнений есть справка.
Для того Чтобы узнать это, нажмите на следующую кнопку.

Подробнее

Драйвер ForwardTacotron TTS

ForwardTacotron и HiFi-GAN поддержка NVDA Screen reader

**Примечание: данное дополнение, а также документация находятся в стадии разработки. Ваш вклад приветствуется!

введение

Напомним, что ForwardTacotron - это модель синтеза речи в pytorch, которая использует предиктор длительности для выравнивания текста и генерируемых mel-спектрограмм. Модель обладает такими преимуществами, как робастность, скорость, возможность работы с питчем и энергией, а также эффективность.

Итак, данный плагин является попыткой реализовать поддержку ForwardTacotron в открытом скринридере NVDA через клиент/сервер, поскольку библиотеки, используемые в качестве torch, невозможно включить в NVDA напрямую.

Работа в этом направлении продолжается, и поэтому предстоит еще многое сделать.

Тем временем вы можете послушать, что уже сделано.

audio samples

Язык Голос Образец
English LJSpeech (с вокодером griffinLim)
English LJSpeech (с вокодером HiFi-GAN)
Spanish Ald Dataset (с HiFi-GAN вокодером)
Spanish Odal (с вокодером HiFi-GAN, универсальная модель)

сделать:

Назад к оглавлению

История версий

Список версий
Назад к оглавлению