TesseractOCR (Автономное распознавание текста Tesseract)
- Автор: Rui Fontes
, Ângelo Abrantes and Abel Passos do Nascimento Jr. - Исходный код дополнения: Посетить Web-сайт tesseractOCR
Краткое описание
Дополнение TesseractOCR выполняет распознавание текста на выбранном файле изображения, PDF, JPG, TIF, и т.д., или в документе через сканер и показывает результаты в TXT файле.
Windows+Control+r - Выполняет распознавание текста на выбранном файле изображения
Windows+Control+Shift+r - Сканирование и распознавание документа в сканере.
Распознавание выполняется автономно и не требует подключения к интернету.
Основная информация
Название | Версия | Совместимость с API NVDA | Последняя протестированная версия NVDA | Минимальная версия NVDA | Дата загрузки в каталог | Размер | Лицензия |
---|---|---|---|---|---|---|---|
tesseractOCR | 2023.11.13 | 2024.1 | 2024.1 | 2019.3 | 27-12-2023 23:57:02 | <78837 Кб. | GPL v2 |
Информация о локализации на русский язык
Скачать
TesseractOCR-V.2023.11.13.nvda-addon
Разделы
Справка
Уважаемые пользователи сайта. Еще не все дополнения имеют локализованную справку, кроме того, не у всех дополнений есть справка.
Для того Чтобы узнать это, нажмите на следующую кнопку.
Подробнее
Распознавание текста Tesseract
TesseractOCR: Дополнение для распознавания текста.
- Авторы: Rui Fontes, Ângelo Abrantes и Abel Passos do Nascimento Jr.
- Обновлено 12/11/2023
- Скачать стабильную версию
- Совместимость: NVDA версии 2019.3 и новее
- Страница дополнения на GitHub
Информация
Это дополнение использует бесплатный OCR-движок Tesseract с открытым исходным кодом для оптического распознавания символов на файле изображения, PDF, JPG, TIF или другом, без необходимости его открытия. Оно также использует wia-cmd-scanner для доступа к сканерам с поддержкой WIA и выполнения распознавания текста с бумажных документов.
В меню NVDA, Параметры, Настройки, добавлен раздел TesseractOCR, в котором можно настроить следующее:
- языки, используемые при распознавании;
- тип распознаваемых документов;
- запрашивать или не запрашивать пароль к PDF. Если эта опция отмечена, а PDF-файл не имеет пароля, то в диалоге с запросом пароля достаточно нажать Enter;
- Выберите используемый сканер;
- установить разрешение сканера в диапазоне от 150 до 400 DPI (точек на дюйм).
За исключением английского и португальского языков, которые уже включены в дополнение, остальные языки будут загружены и установлены при выборе языка, которого еще нет в дополнении.
Обратите внимание, что по мере увеличения числа выбранных языков распознавания процесс распознавания текста будет занимать больше времени. Поэтому мы рекомендуем вам использовать только те языки, которые вам нужны.
Следует также учитывать, что качество распознавания может отличаться в зависимости от порядка следования языков. Поэтому, если результат распознавания окажется неудовлетворительным, можно попробовать использовать другой порядок языков.
Клавиатурные команды
По умолчанию используются следующие команды:
- Windows+Control+r - распознать выбранный документ;
- Windows+Control+w - сканирование и распознавание документа через сканер;
- Windows+Control+c - отмена процесса сканирования. Обратите внимание: отмена должна быть произведена до появления диалогового окна с вопросом о необходимости сканирования дополнительных страниц!
Затем просто подождите, пока появится текстовый файл с распознанным текстом.
Если вы хотите сохранить распознанный текст, не забудьте сохранить его в какой-нибудь папке, так как при запуске следующего процесса РАСПОЗНАВАНИЕ текста результаты будут удалены!
Эти команды можно изменить в диалоге "Жесты ввода" в разделе "Распознавание текста Tesseract".
Известные проблемы
- При выборе опции "Различные" в выпадающем списке "Тип документов" распознанный текст, вероятно, будет содержать много пустых строк Это известная проблема с Tesseract, и, не затрачивая много времени на обработку, я пока не нашел никакого решения. Но я все еще не сдался!
Поддерживаемые языки
В этой версии поддерживаются следующие языки:
- Африканский
- Албанский
- Амхарский
- Арабский
- Армянский
- Ассамский
- Азербайджанский (латинский)
- Баскский
- Белорусский
- Бенгальский
- Боснийский
- Бретонский
- Болгарский
- Бернский
- Каталонский/валенсийский
- Себуано
- Чероки
- Китайский упрощенный
- Китайский традиционный
- Корсиканский
- Хорватский
- Чешский
- Датский
- Немецкий
- Дивехи
- Голландский (фламандский)
- Дзонгкха
- Английский
- Эсперанто
- Эстонский
- Фарерский
- Филиппинский
- Финский
- Французский
- Галисийский
- Грузинский
- Греческий
- Гуджарати
- Гаитянский
- Иврит
- Хинди
- Венгерский
- Исландский
- Индонезийский
- Инуктитут
- Ирландский
- Итальянский
- Яванский
- Японский
- Каннада
- Казахский
- Кхмерский (центральный)
- Киргизский
- Корейский
- Курдский курманджи
- Лаосский
- Латинский
- Латышский
- Литовский
- Люксембургский
- Македонский
- Малайский
- Малаялам
- Мальтийский
- Маори
- Маратхи
- Модуль определения математики / уравнений
- Монгольский
- Непальский
- Норвежский
- Окситанский
- Ория
- Панджаби
- Пушту
- Персидский
- Польский
- Португальский
- Кечуа
- Румынский/молдавский
- Русский
- Санскрит
- Шотландский гэльский
- Сербский (латинский)
- Словацкий)
- Словенский)
- Синдхи
- Сингальский
- Испанский
- Сунданский
- Суахили
- Шведский
- Сирийский
- Таджикский
- Тамильский
- Татарский
- Телугу
- Тайский
- Тибетский
- Тигринья
- Тонга
- Турецкий
- Уйгурский
- Украинский
- Урду
- Узбекский (латынь)
- Вьетнамский
- Валлийский
- Западно-фризский
- Идиш
- Йоруба
Поддерживаемые типы изображений
Это дополнение поддерживает следующие типы файлов:
- JPG
- TIF
- PNG
- BMP
- PNM
- PBM
- PGM
- JP2
- GIF
- JFIF
- JPEG
- TIFF
- SPIX
- WEBP
Перевод
- Русский язык: Валентин Куприянов.
История версий
Предыдущих версий нет.Вернуться на главную сайта: NVDA-ADDONS.RU или NVDA.RU