API для распознавания текста. Хороший и бесплатный

naïve

11.02.21

✎

09:26

Надо в автоматическом режиме распознать текст в определенных областях документа.
Есть бесплатные API для этого? Кто пользовался и чем

1 ДенисЧ

11.02.21

✎

09:30

У меня девочки-операторы этим занимаются.
Обычно хорошо делают. Правда, не бесплатно, за зарплату...

2 Emery

11.02.21

✎

11:00

Обычно для распознавания текста используется универсальная опенсорсная библиотека компьютерного зрения OpenCV ( https://ru.wikipedia.org/wiki/OpenCV ). Имеется достаточно примеров в сети, в т.ч., на Питоне. Однако конкретную программу или скрипт придется писать самому, так как задача распознавания текста, в целом, достаточно нетривиальная.

Я пробовал распознавать встроенные субтитры для ютубовских видеороликов, серии «Easy French». Алгоритм использую собственный. Общая идея. Вручную, точнее мышкой на видео, задаю область с текстом. С помощью OpenCV обрабатываю каждый кадр. Выделяю текстовую область, делаю ее черно-белой, затем с помощью хэш-кода, выделяю уникальные изображения (см. мою тему «Как группировать бинарные матрицы по степени их похожести?» в https://dxdy.ru/topic142232.html ). Их можно уже распознавать вручную либо с помощью алгоритмов, для целей машинного обучения. В любом случае, оператор работает только с уникальными данными. Далее, при достаточно накопленной базе, процесс распознавания текста становиться полностью или почти полностью автоматизированным.

Однако в OpenCV есть и готовые алгоритмы для распознавания. Но их трудно понять без должной подготовки, именно поэтому я эту библиотеку использовал в основном для обработки «живого» видео. А если задействовать FFmpeg, то и без OpenCV можно обойтись. Хотя библиотека, безусловно, мощная и используется повсеместно, в т.ч. в системах ИИ.

3 Garykom

гуру

11.02.21

✎

11:04

(0) бесплатных считай нет готовых, или платно или сиди сам готовь из полуфабрикатов

4 Юрий Лазаренко

11.02.21

✎

11:26

CuneiForm

5 acht

11.02.21

✎

11:28

(4) Точно. Оно даже по-моему в документооборот уже впилено, можно всю обвязку оттуда взять.

6 Mikeware

11.02.21

✎

11:29

может, кто подкинет идею - как продетектировать наличие печати?
(пока пытаюсь найти круг в области). вообще, интересная тенма с распознованием - отвлекает от СКД

7 acht

11.02.21

✎

11:37

(6) Преобразование Хафа?
http://ics.khstu.ru/media/2011/N27_17.pdf

8 Garykom

гуру

11.02.21

✎

11:44

(6) На цветном скане легко, на чб/сером сложней

9 spiller26

11.02.21

✎

12:15

Занимаетесь ерундой, всё равно потом нужно будет оператору просматривать, что там распознавалось.
Сколько я не встречал api и программ всё равно будут "грабли". 2 фактора, 1 - машинный, 2 человеческий. Своё ИИ делать и обучать.

10 Mikeware

11.02.21

✎

12:22

(7) спасибо!

11 Волшебник

11.02.21

✎

12:23

Хороший, бесплатный и быстрый? Выберите любые два!

12 Вафель

11.02.21