Перейти к основному содержимому Главная страница каталога дополнений для NVDA от русскоязычного сообщества NVDA.RU.

Официальный русскоязычный каталог дополнений NVDA

Крупнейший каталог дополнений для программы экранного доступа NVDA, доступный в Интернете

Каталог дополнений от «🇷🇺 Русскоязычного сообщества NVDA.RU.»

Supertonic-3 (Нейронный синтезатор речи Supertonic3)

Автор:

Краткое описание

Нейронный синтезатор речи Супертоник-3.
Supertonic — это система синтеза речи (Text-to-Speech, TTS), разработанная корейской компанией Supertone Inc.
Поддерживаемые языки:
Английский, Корейский, Японский, Арабский, Болгарский, Чешский, Датский, Немецкий, Греческий, Испанский, Эстонский, Финский, Французский, Хинди, Хорватский, Венгерский, Индонезийский, Итальянский, Литовский, Латышский, Нидерландский, Польский, Португальский, Румынский, Русский, Словацкий, Словенский, Шведский, Турецкий, Украинский, Вьетнамский.
Поддерживаемые голоса: пять женских от F1 до F5 и пять мужских от M1 до M5.
Также в текущую модель добавлено два пользовательских голоса под названиями Angry_man и Ironic_man найденные на 4pda.ru.
Голосовые модели требуют высокие вычислительные ресурсы.
Драйвер работает только на 64-разрядной NVDA.

⬇ Перейти к подробной справке 🔝 Назад к оглавлению

Основная информация

Название Версия Совместимость с API NVDA Последняя протестированная версия NVDA Минимальная версия NVDA Дата загрузки в каталог Размер Лицензия
supertonic3 2026.05.31 2026.1 2026.1 2026.1 01-06-2026 22:15:50 387153 Кб. GPL v2
🔝 Назад к оглавлению

Информация о локализации на русский язык

🔝 Назад к оглавлению

Скачать

SuperTonic3-V.2026.05.31.nvda-addon

⬇ Перейти к истории версий 🔝 Назад к оглавлению

Разделы

🔝 Назад к оглавлению

Справка

Подробнее

Supertonic-3 (Нейронный синтезатор речи Supertonic3)

Если вам понравилось это дополнение и вы хотите выразить благодарность Кварку, то сделать это можно переводом любой суммы на следующий кошелёк YooMoney: https://yoomoney.ru/to/410012293543375

Версия 2026.05.31

Недавно ещё появился Supertonic-3 с поддержкой русского. Качество речи и скорость генерации заметно хуже, чем, к примеру, у Vosk TTS, поэтому ждем Supertonic-4.

https://t.me/nvda_group/69792

На 4pda обнаружил сейчас пару кастомных голосов для Supertonic-3. Соответствующие json-файлы надо закинуть в папку с дополнением по пути synthDrivers/supertonic3/model/voice_styles и перезагрузить синтезатор - новые голоса будут доступны под именами angry_man и ironic_man.

https://t.me/nvda_group/69795

Примечание: Эти два пользовательских голоса уже добавлены по обозначеному пути.

Немного об этой нейронной модели

Supertonic 3: революция в синтезе речи — 31 язык прямо на вашем устройстве. Компания Supertone Inc. выпустила третью версию своего TTS-движка — Supertonic 3. Это не просто обновление: модель получила поддержку 31 языка, включая русский, украинский и японский, научилась имитировать живые эмоции и при этом осталась достаточно лёгкой, чтобы работать даже на смартфоне без интернета. Что такое Supertonic и зачем это нужно Supertonic — это система синтеза речи (Text-to-Speech, TTS), разработанная корейской компанией Supertone Inc. В отличие от большинства современных TTS-решений, которые отправляют ваш текст на удалённые серверы и возвращают готовый аудиофайл, Supertonic работает полностью локально: всё вычисление происходит прямо на вашем устройстве, без единого обращения к интернету. Модель использует ONNX Runtime — универсальный движок для инференса нейросетей, который позволяет запускать одну и ту же модель на самых разных платформах: Windows, macOS, Linux, Android, iOS, в браузере и даже на одноплатных компьютерах вроде Raspberry Pi. Первая версия показала рекордную скорость генерации речи, вторая добавила многоязычность. Третья версия — это уже полноценный качественный скачок. Что нового в Supertonic 3 31 язык вместо пяти Главное обновление — резкое расширение языкового охвата. Supertonic 2 поддерживал лишь пять языков (английский, корейский, испанский, португальский и французский). Supertonic 3 расширяет открытый релиз с 5 до 31 языка. Теперь среди поддерживаемых языков: Русский, Украинский, Японский, Арабский, Немецкий, Итальянский, Польский, Хинди, Нидерландский, Турецкий, Шведский, Вьетнамский, Греческий, Финский, Чешский, Венгерский, Румынский, Хорватский, Эстонский, Литовский, Латышский, Словацкий, Словенский, Болгарский, Датский, Индонезийский, Португальский, Испанский, Французский, Корейский, Английский.

Это делает Supertonic 3 одним из наиболее широко охватывающих открытых TTS-движков в своём весовом классе. Эмоции и живая речь Модель умеет имитировать эмоции и другие особенности живой речи вроде вздохов или кашля. Технически это реализовано через специальные теги в тексте. Supertonic 3 поддерживает простые теги, такие как , и . Это позволяет создавать более естественно звучащую речь без необходимости записывать отдельные аудиосэмплы эмоций. Стабильность чтения и качество голоса По сравнению с Supertonic 2, третья версия сокращает количество ошибок повтора и пропуска слов, улучшает сходство с голосом диктора для языков, поддерживавшихся ранее, и расширяет языковое покрытие с 5 до 31 языка. Архитектура: как это работает Система использует трёхкомпонентную схему генерации речи высокого качества: Speech Autoencoder — преобразует звуковые волны в непрерывные латентные аудиопредставления. Text-to-Latent Module — с помощью flow-matching переводит текст напрямую в аудиопризнаки. Duration Predictor — управляет естественным темпом и ритмом речи. Supertonic TTS использует механизм кросс-внимания для автоматического выравнивания текста и речи в процессе генерации, сохраняя простой, но мощный рабочий процесс. Производительность: быстрее, чем реальное время Скорость — одна из главных особенностей Supertonic. Supertonic TTS генерирует речь со скоростью до 167 раз быстрее реального времени на потребительском железе, например на M4 Pro. Это означает, что одна секунда аудио создаётся менее чем за 0,01 секунды. Supertonic 3 быстро работает на CPU, даже по сравнению с более крупными системами, тестировавшимися на GPU класса A100, и потребляет значительно меньше памяти. Модель не требует видеокарты, что существенно упрощает локальное развёртывание, в браузере и на граничных устройствах. Вся статья в первоисточнике

🔝 Назад к оглавлению

История версий

История версий
Версия файлаТестируемая версия NVDAМинимальная версия NVDAРазмер файла (КБ)Ссылка на загрузку
2026.05.312026.12026.1387153SuperTonic3-V.2026.05.31.nvda-addon
🔝 Назад к оглавлению