WorldVoice (Многофункциональный драйвер WorldVoice - Mod1)
- Автор: Tseng Woody
- Исходный код дополнения: Посетить Web-сайт WorldVoice
Краткое описание
Дополнение WorldVoice это драйвер для многоязычных синтезаторов речи с автоматическим переключение языков в соответствии с языком текста.
Драйвер позволяет настроить переключение языков между следующими синтезаторами речи: AiSound, Windows OneCore, RHVoice, Microsoft Speech API версии 5, Vocalizer expressive2, Vocalizer expressive 1, eSpeak, IBM-TTS (он же Eloquence).
Этот драйвер Mod 1 (Модификация 1) с поддержкой:
SAPI5, OneCore, RHVoice, eSpeak, Vocalizer Expressive2, Vocalizer Expressive1.
Основная информация
Название | Версия | Совместимость с API NVDA | Последняя протестированная версия NVDA | Минимальная версия NVDA | Дата загрузки в каталог | Размер | Лицензия |
---|---|---|---|---|---|---|---|
WorldVoice | 4.0-mod1 | 2024.1 | 2024.1 | 2023.3 | 14-05-2024 21:30:57 | 5095 Кб. | GPL v2 |
Информация о локализации на русский язык
🔝 Назад к оглавлениюСкачать
WorldVoice-V.4.0-mod1.nvda-addon
⬇ Перейти к истории версий 🔝 Назад к оглавлениюРазделы
🔝 Назад к оглавлениюСправка
Подробнее
Мультидрайвер WorldVoice
- автор: Tseng Woody
- tsengwoody.tw@gmail.com
- Страница дополнения на GitHub
WorldVoice не включает в себя коммерческие библиотеки TTS (core dll). Для их использования необходимо приобрести лицензию у оригинального разработчика/компании, а WorldVoice является лишь драйвером для них. Мы также не можем гарантировать совместимость с последними версиями, продаваемыми разработчиком/компанией, поэтому, пожалуйста, тщательно подумайте перед покупкой, если вы собираетесь использовать эти коммерческие TTS с WorldVoice. WorldVoice фокусируется только на открытых/бесплатных TTS-движках и не ставит во главу угла поддержание совместимости с этими коммерческими TTS-движками.
WorldVoice
В эпоху высокой взаимосвязанности и глобализации изучение языков приобретает все большее значение. В материалах для изучения языка родной язык часто используется для объяснения иностранной лексики и предложений, а несколько языков часто смешиваются. В повседневном общении мы также часто смешиваем несколько языков и шрифтов. В книгах, газетах и онлайн-статьях для передачи информации часто используется несколько языков, иногда даже в одном предложении, с использованием китайского и английского или китайского и японского.
Состав текста, контекстное значение и межъязыковая частота различных цифровых материалов, таких как учебные пособия по иностранным языкам, математике и литературные произведения, могут отличаться, и соответствующий метод чтения речи также должен быть соответствующим образом скорректирован, чтобы лучше соответствовать потребностям различных типов документов.
WorldVoice - это многоязычное дополнение NVDA для чтения речи, которое поддерживает пять речевых движков (Espeak, OneCore, RHVoice, SAPI5, Piper) и предоставляет множество вариантов настройки. Пользователи могут настраивать параметры для различных контекстов, максимально удовлетворяя потребности разных групп пользователей.
К основным особенностям программы относятся:
- Автоматическое переключение между несколькими языками
- Индивидуальные настройки параметров речи (скорость, высота тона, громкость)
- Выбор нескольких речевых движков
- Переключение между режимами чтения цифр (цифры и числовые значения)
- Настраиваемое поведение при чтении речи (длительность паузы для цифр, элементов, китайский пробел, сказать все, игнорирование запятой между цифрами)
установка
В дополнение к общим шагам установки аддона NVDA, если вы хотите использовать голоса aisound, вам необходимо установить основные пакеты. Если вы хотите использовать голос RHVoice, загрузите соответствующий аддон голосового пакета с официального сайта. Официальная страница загрузки.
Настройки главной речевой роли
В настройках NVDA: Речь(NVDA+Ctrl+V) Настройте основные роли речи и общее поведение.
- скорость, высота тона и громкость основной роли речи.
- чтение цифр: Имеет две опции, «Язык цифр» и «Режим цифр». Язык чисел устанавливает предпочтительный язык, используемый для числового текста, а режим чисел устанавливает чтение текста чисел как числовых значений или отдельных цифр.
- Длительность паузы для чисел, элементов, китайских пробелов и параметров say all. Меньшие значения приводят к более коротким паузам, а 0 означает отсутствие паузы.
- Игнорировать запятую между числами: Если выбрано это значение, NVDA будет игнорировать запятые в числах, что позволит правильно читать числовые значения с неправильно расставленными запятыми.
- Включить правила настройки WorldVoice для определения языка текста: Если этот параметр выбран, NVDA будет использовать правила из настроек голоса для определения языка текста и переключать голос соответствующим образом. Обратите внимание, что эта опция может иметь проблемы с совместимостью с опцией NVDA «Автоматическое переключение языка (при поддержке)», поэтому не рекомендуется выбирать обе опции одновременно.
Настройки голоса WorldVoice (Меню NVDA -> WorldVoice -> Настройки голоса)
Роль речи: Вы можете настроить роли речи для различных регионов, включая индивидуальные настройки скорости, высоты тона, громкости и согласованности между основной ролью речи и региональными ролями речи.
- При выборе региона отображается список доступных речевых ролей для этого региона. При выборе роли речи устанавливается связь между выбранным регионом и ролью речи.
- После выбора речевой роли в списке модификаторов голоса отобразятся доступные настройки высоты тона для этой речевой роли. Выбор модификатора свяжет его с выбранной речевой ролью.
- После выбора роли речи на ползунках скорости, высоты тона и громкости ниже отображаются настройки для этой роли речи.
- Настройки скорости, высоты тона и громкости специфичны для каждой роли речи и не привязаны к регионам.
- Поддерживать согласованность основного движка и движка локали: Эта опция синхронизирует основную речевую роль в голосовых настройках NVDA с региональной речевой ролью в WorldVoice. При изменении настроек основного голоса региональный голосовой движок также будет одинаковым.
- Поддерживать согласованность основного голоса и голоса локали: Этот параметр гарантирует, что основная речевая роль в голосовых настройках NVDA будет соответствовать региональной речевой роли в WorldVoice. Любые изменения основной или региональной роли речи будут синхронизированы между ними. Поддерживать соответствие основного параметра и параметра локали
Переключение языка:
- Определять язык с помощью кодировки Unicode: Если флажок установлен, программа будет определять язык на основе символов, которые она читает.
- Игнорировать цифры при определении языка, игнорировать знаки препинания при определении языка: Если флажок установлен, цифры и знаки препинания будут считаться частью языка основной речевой роли.
- Улучшение голосовых команд: Это позволяет программе автоматически определять язык и определять, когда добавлять паузы для голосовых команд - до или после обработки символов NVDA. Выбор «после обработки символов» может предотвратить конфликты с другими дополнениями голосового модуля (например, Instant Translate).
Речевой движок: Вы можете выбрать голосовой движок, который вы хотите включить.
Перевод
Примечание переводчика:
С WorldVoice версии 4.0 реализована поддержка синтезаторов речи eSpeak и IBM-TTS (они же синтезаторы речи Eloquence). С WorldVoice версии 3.3 реализована поддержка синтезаторов речи RHVoice и OneCore. С WorldVoice версии 3.0 реализована поддержка синтезаторов речи AiSound, SAPI5, VocalizerExpressive 2 и 1.
Этот драйвер без интегрированных ядер, а также с интегрированнными ядрами с пометкой (Mod1, Mod2, Mod3) можно найти в русскоязычном каталоге дополнений: https://nvda-addons.ru
Журнал обновлений WorldVoice
Обновление WorldVoice v4.0.
- Интеграция движка espeak в движки, поддерживающие WorldVoice.
- Добавлена настройка увеличения скорости речи в NVDA - диалог настройки речи.
- Добавлена настройка значения варианта речи в NVDA - диалог настройки речи.
- Диалог настройки речи NVDA будет динамически отображать пользовательский интерфейс настройки темпа речи, если движок/голос поддерживается.
- Пользователи могут настроить повышение скорости для отдельных голосов в диалоге настройки речи WorldVoice.
v3.8
- Обновление документации
- Удалены некоторые пункты меню
V3.7
- Исправлена проблема невозможности использования функции NVDA+b.
- Исправлена проблема прерывания голоса при нажатии любой клавиши на клавиатуре в спящем режиме (не применяется, если в настройках роли голоса указан любой голос SAPI5) (обходное решение).
- Синхронизация программы OneCore с практикой OneCore в NVDA.
V3.6
- Добавлена функция чтения всех пауз, которая может делать паузы между фрагментами в режиме Читать всё
- Исправлена ошибка, из-за которой настройки не могли быть сохранены в определенных ситуациях.
- Добавлен украинский перевод, спасибо VovaMobile.
V3.5
- Исправлена ошибка, избегающая громкости AiSound.
- Исправлена проблема, из-за которой VE не читала следующий текст при встрече с 4-битными символами utf8.
- Исправлена проблема, из-за которой текст не читался вслух, когда VE обнаруживает ошибку кодирования unicode utf8.
- Добавлена категория движка в настройках голоса, вы можете выбрать голосовой движок для включения, по умолчанию VE, OneCore, aisound, SAPI5, RH.
- Совместим с NVDA версии 2023.1.
v3.4
- Добавлена пауза между номерами, чтобы улучшить восприятие цифрового контента при прослушивании и чтении
- Добавлена функция паузы между элементами для улучшения прослушивания, чтения и оценки информации об объекте
- Исправлено, что когда режим пяти чисел является числовым значением, соседние цифры будут объединены в одно числовое значение для регистрации для чтения
- Исправлена проблема с настройкой скорости речи OneCore
- Исправлена ошибка, из-за которой движение курсора зависало после того, как мы включили "Интерпретацию слов, которая задерживает считывание символов при перемещении курсора".
- Исправлена ошибка, из-за которой "Интерпретация слов OneCore и RHVoice, которая задерживает считывание символов при перемещении курсора", была недопустимой.
v3.3
- Поддержка движка OneCore
- Используйте основной голос для чтения вслух, когда регион и роль голоса соответствуют отсутствию выбора
- Исправлена ошибка, из-за которой символ применялся к китайскому параметру пустой паузы при переводе на китайский для регистрации
- Настройки голоса используйте диалоговое окно настройки категории, которое разделено на голосовые роли, переключение языка и другие.
- Добавлен переключатель ускорения OneCore в разделе другое категории в настройках голоса
- Поддержка RHVoice engine
v3.2
- Исправлена проблема настройки голоса, когда WorldVoice не выбран в голосовом синтезаторе, теперь отображается текст подсказки.
- Исправлена проблема с регулировкой громкости звука.
- Исправлено условие перезапуска для обнаружения временных точек языка в настройках голоса
- Исправлено длительное нажатие клавиши, из-за которого речь не прерывалась
- Исправлены различные семантические проблемы (flake8)
- Совместимость с NVDA версии 2022.1
v3.1
- прерывание беззвучных объявлений во время просмотра веб-страниц
- переключить, чтобы приостановить/продолжить голосовое оповещение
- Нажатие кнопки увеличения или уменьшения громкости не прерывает чтение
- Поддерживать согласованность между основным голосовым движком и региональными голосовыми движками
- Исправлено то, как ВЭ делает паузы
v3.0
- Поддержка голосового движка SAPI5
- Поддержка голосового движка Aisound
- Новая длительность паузы при переключении между ролями голоса в настройках голоса
- Новая опция нормализации юникода в настройках голоса
- Сортировка голосовых персонажей по голосовому движку и имени персонажа
v2.2
- Новая опция изменения голоса в настройках голоса, необходимо установить регион, голос и опции изменения голоса по порядку
- Исправлена проблема, из-за которой время определения языка не могло быть изменено после выбора "перед обработкой символов".
- Добавлен арабский перевод
v2.1
- Совместимость с NVDA версий 2019.3~2021.1
- Настройки конфигурации NVDA могут быть применены
- Удалены лишние жесты ввода.
- Процент преобразования внутреннего значения скорости изменен на нелинейный расчет
- Настройка меню настроек для изменения "Определять язык текста после обработки символов" на "Определять временную точку языка".
- Определение языковой точки во времени: символ автоматически определяет языковую точку во времени до или после обработки символа NVDA. При выборе пункта 'После обработки символов' можно предотвратить конфликты с другими дополнениями, использующими речевой модуль (например, Instant Translate).
- Поддерживайте согласованность между параметрами основного голоса и параметрами регионального голоса: согласуйте параметры голоса (основной голос) в настройках голоса NVDA с параметрами регионального аналога (региональный голос) (скорость, высота тона, громкость) в настройках голоса WorldVoice и регулируйте параметры обоих голосов одновременно при настройке параметров основного или регионального голоса.
- Поддерживайте согласованность между основной и региональной ролью голоса: согласуйте роль голоса (основной голос) в настройке голоса NVDA с ролью регионального аналога (региональный голос) в настройке голоса WorldVoice и настройте обе роли голоса одновременно, когда настраивается основная или региональная роль голоса.
v2.0
- Совместимость с NVDA 2021.1
v1.7
- Исправлена нечитаемость десятичной точки (десятичная точка между всеми тремя числами)
- Совместимость с предыдущей финальной версией NVDA 2021.1
v1.6
- Исправлена десятичная точка, не читаемая вслух в числовом режиме
- Обновлена рабочая директория основного пакета VE, чтобы позволить будущие обновления без повторного импорта.
- Разделили переключатель "Использовать WorldVoice для установки правил для целевого языка" и переключатель "Автоматически переключать язык", чтобы избежать несовместимости между ними в некоторых случаях.
- Исправлена проблема при включении автоматического определения языка в юникоде, когда язык по умолчанию не совпадал с языковым регионом NVDA, но был на том же языке.
- Исправлена команда смены языка WorldVoice, которая отфильтровывалась, когда автопереключение языка снято.
v1.5
- Чтение чисел разделено на 2 варианта настройки "Язык чисел" и "Режим чисел", которые для удобства выбора разделены на 2 измерения
- Опция игнорирования межразрядных запятых для корректного чтения числовых отчетов
- Функция автоматического определения языка использует различные файлы интерпретации только в том случае, если отмечен доверенный язык
- Настройка значения в голосовой настройке вступит в силу, только если вы нажмете подтверждение и отмену, чтобы вернуться к значению до настройки
- Фиксация значения в настройках голоса, когда голос совпадает с голосом по умолчанию, а затем перезапуск NVDA возвращает предустановленное значение
- Объединение автоматического переключения языка с окном настройки голоса
- Добавить отмену выбора для региона и голосового отображения для отмены отображения.
- Поддержка всплывающих окон с быстрыми клавишами для голосовых настроек и настроек Unicode
v1.4
- Исправлено отсутствие голоса при просмотре отчета
- Процент преобразования внутреннего значения тона изменен на нелинейный, так что значение по умолчанию равно 50
- Исправлена ошибка обнаружения заднего текста в принудительном режиме правил юникода
- Исправлен неверный тип начального значения, приводивший к невозможности отображения диалогового окна настройки голоса
- Начальный голос изменен, чтобы отдать предпочтение голосу языка по умолчанию
v1.3
- Добавьте функцию настройки юникода
- Исправлена проблема, при которой одиночные цифры не переключались автоматически
- Исправлен цифровой режим, не работающий в некоторых сценах.
- Удален драйвер 1 из версии 1.2
- Скорректирована структура программы и поддерживается больше TTS
v1.2
- Доступен драйвер 2, в целом более плавный, чем драйвер 1, без случайных нестыковок скорости и небольших всплесков.
- Особенности драйвера 2 включают цифровой режим, китайский пробел, игнорирование информации о языке в файлах и другие опции по сравнению с драйвером 1.
- Драйвер 2 обеспечивает индивидуальную регулировку скорости, высоты тона и громкости, но соответствующие значения отличаются от драйвера 1, т.е. скорость 50 драйвера 1 и скорость 50 драйвера 2 не будут иметь одинаковую скорость речи
- Исправлена проблема, из-за которой время и десятичные точки неправильно считывались в числовом режиме при выборе каждого значения речи
- Исправлена проблема, при которой информация об области не читалась вслух, если не был определен символ
- Исправлена проблема, при которой числовой режим не использовал выбранный голос правильно при выборе каждого числового голоса
- Скорректирован порядок обработки языковой информации в числовом режиме и игнорирования файлов, чтобы лучше соответствовать ожидаемой логике чтения.
v1.1
- Новая опция для числового режима, которая позволяет читать вслух числа на установленном языке и разделять их на цифровые и числительные.
- Новая опция игнорирования языковой информации в документах. Это сделано для того, чтобы избежать возможности неправильного чтения вслух, когда флажок языка автоматически переключается, а в исходном документе содержится неправильная языковая информация (например, китайский текст помечен как английский язык) или когда номера слов помечены как английский язык и автоматически читаются вслух на английском языке.
- Оптимизация китайских пустых пространств, чтобы китайские объекты и китайские атрибуты могли быть поставлены на паузу
- Добавьте перевод интерфейса для других китайских языков
- Пропустить загрузку функции изменения голоса из файла конфигурации, поскольку функция изменения голоса, лежащая в основе текущего драйвера VE, не работает должным образом, и при изменении голоса легко удалить весь файл конфигурации из-за сбоя загрузки настроек
- Объединено с обновлениями драйвера VE 3.1.2
- Другие незначительные улучшения
История версий
Истории версий нет.
🔝 Назад к оглавлению