Имя: Пароль:
1C
1С v8
Требуется движок распознавания первичных документов (офлайн)
0 Garykom
 
гуру
02.02.24
15:34
Требуется движок распознавания первичных документов (офлайн)

На входе сканы в pdf.
Могут быть много разных документов (УПД, ТОРГ, С-Ф, Акты и т.д.) в одном файлике.

Обязательно работа в офлайне на linux (но можно и windows) сервере.
Никаких онлайн сервисов внешних.

Должен хорошо распознавать структуру документа, его начало и конец а так же таблицы.
Отдавать результат в xml или json.

Из языков распознавания русский и английский.

Какие варианты есть?
3 Волшебник
 
02.02.24
15:38
(0) Простите, а кто Вам генерирует такой идиотский входной поток?
4 Garykom
 
гуру
02.02.24
15:43
(3) Не могу знать
Мое мнение что надо со всеми контрагентами договориться об ЭДО
Или хотя бы дублировать бумажные электронными файликами определенных форматов (да хоть из своих учетных систем в XLS сохранять и присылать)
Но вот заказчик хочет на проекте
5 Волшебник
 
02.02.24
15:43
(4) Ну так вам нужен не движок, а РП, который пресечёт такие хотелки или подберёт людей для решения этой задачи. Вы начали не с того конца.
6 Волшебник
 
02.02.24
15:45
Никакой движок не взлетит.
7 mikecool
 
02.02.24
15:46
ранее был от конторы Эфсол, как сейчас - жива она еще или нет? проги, в основном, украинские были
8 mikecool
 
02.02.24
15:47
+7 на базе finereader работал
9 Волшебник
 
02.02.24
15:48
(8) ABBYY ушла из России. Ну и хуй с ней
10 mikecool
 
02.02.24
15:50
(9) а движок то мог остаться )
11 PR
 
02.02.24
15:51
12 PR
 
02.02.24
15:52
(4) Ты же понимаешь, что в ЭДО точно так же могут прислать pdf? :))
13 Garykom
 
гуру
02.02.24
15:53
(12) Могут :)
Но подразумевал по форматам ФНС или CML 2.08 от 1С
14 Garykom
 
гуру
02.02.24
15:55
(7)  Fasta?
Это вроде сервис а надо на своем сервере поднять
15 PR
 
02.02.24
15:55
16 Garykom
 
гуру
02.02.24
15:56
(15) Я несколько раз написал "офлайн" и "не сервис" ))
17 PR
 
02.02.24
16:02
(16) Это частично релевантная выборка
Как в Яндексе, видел?
Когда пишут, что типа это может быть то, что тебе нужно, но без слов "оффлайн" и "халява"
18 Волшебник
 
02.02.24
16:02
(16) Вы свои требования предъявляйте тому, кому деньги платите.
19 PR
 
02.02.24
16:02
(18) 👍
20 mikecool
 
02.02.24
16:03
(14) не помню, я его щупал лет 12 назад, и это была оффлайн поделка точно
21 vde69
 
02.02.24
16:14
в составе документооборота была компонента, судя по описанию на 100% подходящая (сам не юзал)
22 mikecool
 
02.02.24
16:23
+20 наверное оно https://efsol.ru/solutions/docflow-system.html
только ценник тогда был негуманный,как сейчас - хз
23 Garykom
 
гуру
02.02.24
16:24
(22) ABBYY FlexiCapture внутри как понял
24 nextssbt
 
02.02.24
17:01
25 nextssbt
 
02.02.24
17:03
26 Garykom
 
гуру
02.02.24
17:12
(24) opencv и tesseract ocr?
тессеракт попробовал, последний с последними дата как то хреново кириллицу берет, даже на идеальных картинках
надо вероятно на предыдущий легаси настраивать
27 ДедМорроз
 
03.02.24
11:11
Просто,если первичка печатная,то можно вместо печати попросить ее в файле прислать.
А вот если частично от руки заполнена,то тут FineReader уже не справится.
28 Garykom
 
гуру
03.02.24
21:26
(27) Первичка печатная
От руки только подписи, их распознавать не надо

"Попросить ее в файле прислать" не получится, представь крупную контору с кучей контрагентов.
Рядовой сотрудник или даже начальник отдела никак не сможет решить это.

Почтой/курьерами есть большой поток входящих бумажных писем/документов.
Они все сканятся в потоковом режиме и заносятся в ДО.
Далее обработка операторами с вводом/созданием новых доков в ERP или привязкой к существующим (когда вернулся подписанный обоими сторонами исходящий).

Быстрей распознать чем пытаться связаться с отправителем и еще когда он пришлет электронный вариант.

Вариант перехода на ЭДО не для всех контрагентов подходит, это уже устоявшиеся отношения обычно а не разовые.
29 bolder
 
03.02.24
21:39
(0) У вас есть конкурент - официальный сервис от 1С.Цены не кусаются.
30 Garykom
 
гуру
03.02.24
21:46
(29) Попробуй представить как согласовать с безопасниками слив всех входящих документов в некий сторонний сервис?
Это не аудиторы или ФНС, куда кстати не все сливается а по запросу