XyOCR (Распознавание текста Xinyi)
- Автор: huaiyinfeilong
- Исходный код дополнения: Посетить Web-сайт xyOCR
Краткое описание
Дополнение XyOCR это объединение различных офлайн- и онлайн-сервисов распознавания текста.
Это дополнение в настоящее время предоставляет автономный механизм распознавания текста PaddleOCR_json и онлайн-версию Baidu general и точную версию механизма распознавания.
После установки дополнения компонент PaddleOCR_json будет установлен автоматически.
В будущем будет постепенно подключаться все больше других автономных и онлайн-систем распознавания текста.
Сочетание клавиш:
Распознавание навигационных объектов: NVDA+ALT+O.
Распознавание из буфера обмена: NVDA+ALT+SHIFT+O.
Переключение механизма распознавания OCR: NVDA+ALT+9.
Описание изображения: NVDA+ALT+P.
Описание изображения из буфера обмена: NVDA+ALT+SHIFT+P.
Вы можете изменить сочетания клавиш для каждой команды в категории «Xinyi OC» в настройках «Жесты ввода».
Для работы дополнения необходимо подключение к интернету.
Основная информация
Название | Версия | Совместимость с API NVDA | Последняя протестированная версия NVDA | Минимальная версия NVDA | Дата загрузки в каталог | Размер | Лицензия |
---|---|---|---|---|---|---|---|
xyOCR | 3.1.0 | 2024.1 | 2024.1 | 2024.1 | 30-09-2024 19:08:27 | 92835 Кб. | GPL v2 |
Информация о локализации на русский язык
🔝 Назад к оглавлениюСкачать
⬇ Перейти к истории версий 🔝 Назад к оглавлениюРазделы
🔝 Назад к оглавлениюСправка
Подробнее
XyOCR (Распознавание текста Xinyi)
Дополнение XyOCR для NVDA, которое обеспечивает распознавание текста в автономном режиме и онлайн. Автономное распознавание разработано на основе компонента PaddleOCR_json.
Это дополнение в настоящее время предоставляет автономный механизм распознавания текста PaddleOCR_json и онлайн-версию Baidu general и точную версию механизма распознавания. После установки дополнения компонент PaddleOCR_json будет установлен автоматически. В будущем будет постепенно подключаться все больше других автономных и онлайн-систем распознавания текста.
Преимущества дополнения
- Скорость распознавания высокая, а время автономного распознавания составляет около 100 мс. Фактическая ситуация зависит от конфигурации производительности компьютера.
- Высокая точность распознавания в автономном режиме, сравнимая с онлайн-распознаванием.
- Координаты текста результата распознавания являются точными, и реакция на щелчок текста результата является точной.
Сочетания клавиш
- Распознавание навигационных объектов: NVDA+ALT+O
- Распознавание из буфера обмена: NVDA+ALT+SHIFT+O
- Переключение механизма распознавания OCR: NVDA+ALT+9
- Описание изображения: NVDA+ALT+P
- Описание изображения из буфера обмена: NVDA+ALT+SHIFT+P
Настройки сочетаний клавиш: Вы можете установить сочетания клавиш для каждой команды в категории "Xinyi OCR" в настройках "жесты ввода".
Обратная связь
Любые комментарии и предложения приветствуются по адресу:
- Адрес проекта: https://github.com/huaiyinfeilong/xyocr
- E-mail: huaiyinfeilong@163.com
- QQ: 354522977
- WeChat: huaiyinfeilong
Перевод
- Валентин Куприянов: Русский язык
- Начал перевод с версии 2.0.1.
- Примечание: К переводу который появился в версии 3.1.0 не имею отношения - это от другого переводчика.
Журнал обновлений
Версия 3.1.0
- Добавлена функция описания изображений, поддерживающая iFlytek Image Understanding API.
- Удален общий секретный ключ для распознавания Baidu.
- Обновлены поля конфигурации, требующие повторного ввода ключа распознавания Baidu вручную.
- Добавлена поддержка локализации на русский язык.
- Исправлена ошибка, из-за которой распознавание текста автоматически обновлялось независимо от того, был выбран параметр "Периодически обновлять результаты распознавания" или нет.
Версия 3.0.3
- Удалена функция описания изображений.
Версия 3.0.2
- Адаптация к версии NVDA 2024.1.
Версия 3.0.1
- Новая функция обнаружения черного экрана при описании изображения: Если операция описания изображения выполняется при включенной функции затемнение экрана, будет выдано соответствующее сообщение.
Версия 3.0
- Добавлена функция распознавания содержимого изображений, которая позволяет идентифицировать и описывать просматриваемые изображения и изображения в буфере обмена.
Версия 2.0.2
*Устранение проблемы, при которой онлайн OCR может быть недоступен на машинах, где недоступен офлайн OCR.
Версия 2.0.1
- Исправление нестабильности в среде сетевых прокси.
Версия 2.0
- Добавлен механизм распознавания Baidu online OCR, поддерживается общее распознавание и точное распознавание версий, можно использовать общий ключ и собственный закрытый ключ. Если вы используете собственный закрытый ключ, вам необходимо настроить его в настройках.
- Добавлена функция обнаружения затемнения экрана, если распознавание OCR выполняется при включенном затемнении экрана, будет выдана подсказка.
- Убрано обнаружение 64-битной системы при установке, но после установки не 64-битной системы можно использовать только онлайн распознавание OCR, а офлайн распознавание использовать нельзя.
Версия 1.3
- Устранение проблемы, из-за которой невозможно установить версию ниже NVDA 2023.1.
Версия 1.2
- Добавлено определение среды во время установки, и будет выдаваться сообщение о том, что установка не может быть завершена для не 64-битной системной среды.
- Исправлена проблема, из-за которой PaddleOCR_json.exe не завершался автоматически при аварийном завершении работы NVDA, а продолжал работать.
- Исправлена проблема, из-за которой распознавание OCR занимало слишком много памяти при увеличении количества распознаваний.
- Исправлена проблема приостановки анимации NVDA во время распознавания OCR.
Версия 1.1
- Добавлена функция распознавания буфера обмена, горячая клавиша: NVDA+SHIFT+ALT+O