SoundWave (Преобразование текста в аудиофайл)
Автор:- Исходный код дополнения: Посетить Web-сайт soundWave
Краткое описание
Дополнение Sound Wave для NVDA, позволяющее преобразовывать текст в аудиофайлы с использованием различных речевых движков.
Предназначено для быстрого экспорта голосового аудио для подкастов, видеороликов, демонстраций, тестирования доступности и сохранения озвученной информации.
Особенности дополнения:
Поддержка нескольких синтезаторов речи: SAPI5 (голоса Microsoft), Sonata (офлайн-нейросеть), IBM ECI (офлайн), DECtalk (офлайн), а также захват вывода синтезатора Orpheus.
Выбор источника текста: из буфера обмена или ручной ввод.
Гибкая настройка параметров синтеза (голос, скорость) с возможностью предварительного тестирования.
Сохранение результата в форматах WAV (всегда) и MP3 (при наличии ffmpeg в системе).
Удобный диалог прогресса с подробной информацией и возможностью отмены рендеринга.
Итоговая сводка с информацией о затраченном времени, длительности аудио и скорости обработки.
Сохранение настроек между сеансами NVDA.
Дополнение идеально подходит для создания голосовых дорожек без необходимости синхронной работы синтезатора в реальном времени.
Для быстрого доступа используйте стандартную комбинацию NVDA+Ctrl+=.
Примечание: Разработчик, не завершил в коде подключение для перевода интерфейса, поэтому интерфейс всё ещё на английском.
Весь функционал подробнее описан в справочном руководстве.
Основная информация
| Название | Версия | Совместимость с API NVDA | Последняя протестированная версия NVDA | Минимальная версия NVDA | Дата загрузки в каталог | Размер | Лицензия |
|---|---|---|---|---|---|---|---|
| soundWave | 0.1.2 | 2025.1 | 2025.3 | 2025.1 | 03-03-2026 23:06:27 | 45 Кб. | GPL v2 |
Информация о локализации на русский язык
🔝 Назад к оглавлениюСкачать
⬇ Перейти к истории версий 🔝 Назад к оглавлениюРазделы
🔝 Назад к оглавлениюСправка
Подробнее
SoundWave (Преобразование текста в аудиофайл)
soundWave — это дополнение для NVDA, которое позволяет преобразовывать текст в аудиофайл с использованием различных речевых движков (синтезаторов), включая офлайн / работающие быстрее реального времени, где это возможно. Оно предназначено для быстрого экспорта голосового аудио для демонстраций, подкастов, видеоработ, тестирования доступности и обычного «сохранения того, что сказала бы NVDA».
Быстрый старт
- Нажмите NVDA+Ctrl+=, чтобы открыть soundWave. (Это жест по умолчанию.)
- Выберите синтезатор для озвучивания (например, SAPI5, Sonata, IBM ECI, Orpheus capture, DECtalk).
- Выберите источник ввода:
- Буфер обмена
- Вставить / ввести текст
- Настройте параметры синтезатора (голос / язык / скорость). Используйте кнопку Тест для предварительного прослушивания.
- Выберите имя выходного файла и формат (WAV или MP3, если установлен ffmpeg).
- Наблюдайте за общим диалогом процесса рендеринга, затем просмотрите сводку «Рендеринг завершён».
Общий диалог рендеринга
Для всех синтезаторов используется один и тот же диалог процесса рендеринга. Он включает:
- Индикатор выполнения и прошедшее время.
- Показать подробности / Скрыть подробности — подробности обновляются примерно раз в секунду.
- Кнопку Отмена (а также клавишу Esc) для остановки рендеринга.
- Итоговый диалог со сводкой, содержащей:
- Название синтезатора
- Путь сохранения
- RPC (используемый внутренний механизм/путь вызова)
- Затраченное время, длительность аудио и, когда доступно, коэффициент скорости относительно реального времени
О «RPC»: это краткая метка для внутреннего механизма рендеринга (например: SAPI5 , IBMECI , DECtalk , Sonata). Это не связано с Windows RPC; это просто внутренний идентификатор.
Диалоги настроек синтезаторов
У каждого синтезатора есть своё окно настроек. Все диалоги следуют одному шаблону:
- Автоматически озвучивать при изменении настроек (включено по умолчанию) — воспроизводит изменения выбранным синтезатором.
- Кнопка Тест — воспроизводит короткую тестовую фразу с выбранными настройками.
- Настройки сохраняются в конфигурации NVDA (сохраняются между перезапусками).
Поддерживаемые синтезаторы (текущий состав для тестирования)
| Синтезатор | Описание | Примечания / требования |
|---|---|---|
| SAPI5 | Рендеринг с использованием голосов Microsoft SAPI5. Можно выбрать голос и скорость. | Использует установленные в системе голоса SAPI5. |
| Sonata | Офлайн-рендеринг через нейронные голоса Sonata (gRPC). | Требуется установка синтезатора/дополнения Sonata и доступные конфигурации голосов. |
| IBM ECI (IBM TTS) | Офлайн-рендеринг с использованием интерфейса DLL IBM ECI. Можно выбрать голос и скорость. | Требуется указать корректный путь к ECI.DLL (задаётся в диалоге опций IBM ECI). Некоторые установки IBM ECI поставляются в составе других дополнений. |
| Orpheus (захват) | Захватывает вывод Orpheus, временно переключая NVDA на безопасный резервный синтезатор. | Важно: Для захвата Orpheus требуется, чтобы перед началом синтезатор Orpheus был текущим в NVDA. Во время захвата используется резервный синтезатор (обычно eSpeak NG). |
| DECtalk | Офлайн-рендеринг через DLL DECtalk («Открыть в памяти»). Можно выбрать голос и скорость. | Требуется, чтобы дополнение / библиотека DECtalk были установлены и доступны для soundWave. |
Выходные форматы
- WAV поддерживается всегда.
- MP3 поддерживается, если установлен ffmpeg и он доступен в системной переменной PATH.
Примечание о MP3: Если экспорт в MP3 не удаётся, установите ffmpeg и убедитесь, что команда
ffmpeg работает в командной строке (т.е. ffmpeg находится в PATH), затем повторите попытку.
На что тестировщикам следует обратить внимание
- Озвучивает ли диалог настроек каждого синтезатора изменения при переключении голоса/скорости (когда включена опция «Автоматически озвучивать»)?
- Воспроизводит ли кнопка Тест аудио с использованием выбранного синтезатора и настроек?
- Завершается ли рендеринг и создаётся ли корректный WAV/MP3 файл?
- Показывает ли итоговая сводка адекватные значения «Затраченное время / Длительность аудио / Скорость»?
- Останавливает ли кнопка Отмена (и клавиша Esc) процесс рендеринга надёжно?
Устранение неполадок
- IBM ECI сообщает, что не может найти DLL: Откройте настройки IBM ECI и укажите правильный путь к
ECI.DLL. - Захват Orpheus не запускается: Сначала переключите текущий синтезатор NVDA на Orpheus, затем снова запустите soundWave.
- Экспорт в MP3 не удаётся: Установите ffmpeg и убедитесь, что он находится в PATH.
- Рендеринг выглядит зависшим: Попробуйте нажать Отмена. Если удастся воспроизвести зависание, отправьте журнал NVDA с указанием, какой синтезатор и какие настройки использовались.
Обратная связь
Если вы тестируете soundWave, пожалуйста, включайте в любой отчёт:
- Какой синтезатор вы использовали (SAPI5 / Sonata / IBM ECI / Orpheus capture / DECtalk)
- Настройки голоса и скорости/темпа
- Тип ввода (буфер обмена / текстовый файл / введённый текст)
- Сработала ли кнопка Тест
- Соответствующую часть журнала NVDA, если произошла ошибка
Спасибо за тестирование!
История версий
История версий
| Версия файла | Тестируемая версия NVDA | Минимальная версия NVDA | Размер файла (КБ) | Ссылка на загрузку |
|---|---|---|---|---|
| 0.1.2 | 2025.3 | 2025.1 | 45 | SoundWave-V.0.1.2.nvda-addon |