Перейти к основному содержимому Главная страница каталога дополнений для NVDA от русскоязычного сообщества NVDA.RU.

Официальный русскоязычный каталог дополнений NVDA

Крупнейший каталог дополнений для программы экранного доступа NVDA, доступный в Интернете

Каталог дополнений от «🇷🇺 Русскоязычного сообщества NVDA.RU.»

NativeSpeechGeneration (Нативная генерация речи)

Автор:

Краткое описание

Используйте мощь передового искусственного интеллекта Google Gemini для генерации высококачественной речи непосредственно в NVDA. Это дополнение предоставляет удобный диалог для преобразования текста в естественно звучащее аудио.
Ключевые возможности:
Высококачественные голоса: Выбирайте между Gemini Pro для премиального, реалистичного звучания и Gemini Flash для стандартного качества и быстрой генерации.
Режимы для одного и нескольких говорящих: Легко создавайте аудио для одного говорящего или создавайте динамические диалоги с двумя различными голосами. Просто форматируйте текст как ИмяГоворящего: для назначения голосов.
Расширенное управление голосом: Тонко настраивайте вывод, регулируя параметр температура для более креативных или стабильных результатов, а также задавая пользовательские инструкции по стилю.
Доступный интерфейс: Все элементы управления полностью доступны, включая свёртываемую панель для расширенных настроек, что делает интерфейс чистым и удобным для навигации.
Бесшовный рабочий процесс: Дополнение обеспечивает мгновенное воспроизведение аудио после генерации и позволяет сохранять полученный файл .wav для последующего использования.
Чтобы начать, получите Gemini API-ключ в Google AI Studio и введите его на панели настроек дополнения, которая находится в меню Сервис NVDA.
Сочетание клавиш можно изменить в жестах ввода, в категории «Нативная генерация речи».

⬇ Перейти к подробной справке 🔝 Назад к оглавлению

Основная информация

Название Версия Совместимость с API NVDA Последняя протестированная версия NVDA Минимальная версия NVDA Дата загрузки в каталог Размер Лицензия
NativeSpeechGeneration 1.5.1 2025.1 2025.3.2 2024.1 12-01-2026 17:56:01 435 Кб. GPL v2
🔝 Назад к оглавлению

Информация о локализации на русский язык

🔝 Назад к оглавлению

Скачать

NativeSpeechGeneration-V.1.5.1.nvda-addon

⬇ Перейти к истории версий 🔝 Назад к оглавлению

Разделы

🔝 Назад к оглавлению

Справка

Подробнее

Native Speech Generation для NVDA

Автор: Muhammad Gagah muha.aku@gmail.com

Native Speech Generation — это дополнение для NVDA, которое интегрирует Google Gemini AI для генерации высококачественной, естественно звучащей речи непосредственно в NVDA. Оно предоставляет чистый, полностью доступный интерфейс для преобразования текста в аудио, поддерживая как одноголосое повествование, так и динамические диалоги с несколькими голосами.

Это дополнение предназначено для плавного рабочего процесса, взаимодействия с приоритетом доступности и гибкого управления голосом, подходящего для озвучки, диалогов и создания аудиоконтента.


Возможности

Генерация высококачественной речи

Режимы для одного и нескольких голосов

Расширенное управление голосом

Доступный и чистый интерфейс

Бесшовный рабочий процесс

Умная загрузка и кэширование голосов

Общение с ИИ (живой разговор)


Требования


Установка

  1. Загрузите последнюю версию пакета дополнения со страницы релизов: https://github.com/MuhammadGagah/native-speech-generation/releases
  2. Установите его как любое стандартное дополнение NVDA.
  3. Перезапустите NVDA при запросе.

Настройка API-ключа (Обязательно)

  1. Создайте API-ключ в Google AI Studio: https://aistudio.google.com/apikey
  2. Откройте NVDA и перейдите: Меню NVDA → Сервис → Native Speech Generation
  3. Нажмите «Настройки API-ключа».
  4. Это откроет настройки NVDA непосредственно в категории Native Speech Generation.
  5. Вставьте ваш Gemini API-ключ в поле GEMINI API Key.
  6. Нажмите OK для сохранения.

Как использовать

Откройте диалоговое окно, используя:

Основные элементы интерфейса


Генерация речи

Режим одного говорящего

  1. Выберите Один говорящий.
  2. Выберите голос в выпадающем списке Выбрать голос.
  3. Введите ваш текст.
  4. При желании добавьте инструкции по стилю.
  5. Нажмите Сгенерировать речь.
  6. Аудио будет автоматически воспроизведено после генерации.

Режим нескольких говорящих

  1. Выберите Несколько говорящих (2).

  2. Для каждого говорящего:

    • Введите уникальное Имя говорящего.
    • Выберите отличный Голос.
  3. Отформатируйте текст так, чтобы каждая строка начиналась с имени говорящего, за которым следует двоеточие.

Пример:

Алиса: Привет, Боб, как дела?
Боб: Отлично, Алиса! Погода сегодня замечательная.
  1. Нажмите Сгенерировать речь. Голоса будут автоматически назначены на основе имён говорящих.

Общение с ИИ (живой режим)

Попробуйте естественный двусторонний голосовой разговор с Gemini.

  1. Настройте желаемые Голос и Инструкции по стилю в главном диалоговом окне. (Примечание: в настоящее время «Общение с ИИ» поддерживает только режим одного говорящего)
  2. Нажмите Общение с ИИ.
  3. В новом окне:
    • Начать разговор: Запускает сессию. Говорите в микрофон.
    • Остановить разговор: Завершает сессию.
    • Привязка к Google Поиску: Установите этот флажок, чтобы позволить Gemini искать ответы в интернете (например, текущие новости, погоду).
      • Примечание: Этот флажок скрыт, пока разговор активен. Остановите разговор, чтобы изменить его.
    • Переключение микрофона: Выключить/включить микрофон.
    • Громкость: Отрегулируйте громкость воспроизведения ИИ.

Расширенные настройки


Обзор кнопок


Жесты ввода

Настраиваются через: Меню NVDA → Параметры → Жесты ввода → Native Speech Generation

Жест по умолчанию:


Руководство по разработке и участию

Если вы хотите разрабатывать или изменять это дополнение, следуйте шагам ниже.

Настройка окружения

pip install scons
pip install markdown

Дополнительные зависимости

Установите Gemini SDK и pyaudio непосредственно в путь к библиотеке дополнения:

python.exe -m pip install google-genai pyaudio --target "D:/myAdd-on/Native-Speech-Generation/addon/globalPlugins/NativeSpeechGeneration/lib"

Скорректируйте путь в соответствии с вашим локальным каталогом исходного кода дополнения.

Затем скопируйте следующее из вашей установки Python в:

addon/globalPlugins/NativeSpeechGeneration/lib

Участие в разработке

Предложения, баг-репорты и вклад в код очень приветствуются.

Контакты

🔝 Назад к оглавлению

История версий

История версий
Версия файлаТестируемая версия NVDAМинимальная версия NVDAРазмер файла (КБ)Ссылка на загрузку
1.5.12025.3.22024.1435NativeSpeechGeneration-V.1.5.1.nvda-addon
1.52025.3.22024.1432NativeSpeechGeneration-V.1.5.nvda-addon
1.32025.3.22024.166NativeSpeechGeneration-V.1.3.nvda-addon
1.22025.22023.154NativeSpeechGeneration-V.1.2.nvda-addon
1.02025.12023.18184NativeSpeechGeneration-V.1.0.nvda-addon
🔝 Назад к оглавлению