Имя: Пароль:
1C
1С v8
Распознавание текста
, ,
0 Alex2411
 
24.08.17
18:44
добрый вечер, есть идея заносить накладные автоматом, хотим сканировать и распознавать текст для занесения документа поступления, с этим кто сталкивался?
1 Aleksey
 
24.08.17
18:44
Баловство все это
2 Tateossian
 
24.08.17
18:45
(0) Сталкивались. Предложили поставщикам работать по ЭДО.
3 Aleksey
 
24.08.17
18:46
ты хоть раз пробовал текст распознавать? никакая распознавала не даст тебе 100% распознование (и речь не только о тексте, но еще и о структуре документа).
Далее как будете сопоставлять позиции, каждый раз заводить новые?
4 Garykom
 
гуру
24.08.17
18:55
(0) Звонишь поставщику и говоришь: "Пожалуйста скиньте накладные в формате DBF или хотя бы XLS".
И все...
5 lodger
 
24.08.17
18:55
из платных решений: https://www.abbyy.com/ru-ru/solutions/findocs/
вроде даже не дорого. вроде даже брат-сват с Господином Нуралиевым.
тестить не тестил, но рекламу поют интересную.

из бесплатных - без денег все замерло в прошлом веке.

универсальность 100%. подходит ко всему печатному тексту.
но ЭДО дешевле и утилизирует меньше вычислительных мощностей.
6 Garykom
 
гуру
24.08.17
18:55
(4)+ Ну еще адрес электронной почты продиктовать если они не знают ))
7 Alex2411
 
24.08.17
19:04
"Предложили поставщикам работать по ЭДО" - это  как самолет построить, не кто не хочет платить... я про поставщиков
8 Alex2411
 
24.08.17
19:05
может есть какие то веб сервисы по распознованию?
9 Garykom
 
гуру
24.08.17
19:18
(8) Сначала позвони поставщикам, все наши присылают.

Даже если специальной обработки у них еще для выгрузки, то банально печатную форму сохранить как Excel и прислать по почте любой менагер может...
10 Garykom
 
гуру
24.08.17
19:18
(9)*специально обработки нет
11 Fragster
 
гуру
24.08.17
20:12
Эдо, загрузка из экселя, распознавание и парсинг текстапо трудоемклсти примерно 1:2:400 соотносятся. Последгяя цифра неточная
12 Fragster
 
гуру
24.08.17
20:12
Предллжите перемножить на свою зарплату
13 Fragster
 
гуру
24.08.17
20:13
Я не бухой, это я с телефона пишу
14 0xFFFFFF
 
24.08.17
20:21
(0) садомазо
15 Aleksey
 
24.08.17
21:47
(7) В типовых есть бизнес-сеть. Она бесплатно и без СМС
16 ittaxi
 
24.08.17
21:55
(0) было решение но для счет фактур это внедряли в ECCO нам так говорили, контору не помню но у нас не пошло. там разрешение скана должно быть только 300 dpi
17 Garykom
 
гуру
24.08.17
22:59
(16) Неважно какое разрешение скана, хоть идеальное в 1200 dpi.

Вся проблема в разделении на ячейки (с данными внутри) и группировка ячеек в отдельные "строки".

А затем встает проблема понять из каких ячеек в строках брать данные, особенно веселая если в разных строках разное число ячеек по высоте и по ширине и ячейки смещены относительно разных страниц.

То что они разные для разных документов разных поставщиков это 100% ))

Короче овчинка выделки не стоит, самое оптимальное это формат типа классического DBF или новомодных XML c JSON.

После обработки напильником (вручную оператором) вполне можно загружать из XLS, но это хуже чем из DBF.
18 mikecool
 
24.08.17
23:03
у эфсола есть разработка на базе файнридера(вроде)
может быть дорого
19 вовочка
 
25.08.17
07:24
можно печатать со штрихкодом
потом его считывать
20 Alex2411
 
25.08.17
07:25
Всем спасибо за комментарии.
21 Адинэснег
 
25.08.17
07:40
выгрузить-загрузить
https://image.prntscr.com/image/Ms-46ALVRCGH4oc_NEwxCQ.png
22 RayCon
 
26.08.17
23:00
(0) На рынке 1С есть подобные программы. Вот, например:
http://scan-archive.ru/

Но, как указано в (2), лучше использовать ЭДО.
23 Garykom
 
гуру
26.08.17
23:17
(22) >лучше использовать ЭДО

угу и поставщики будут присылать кривые сканы накладных ))
24 RayCon
 
26.08.17
23:23
(23) Ты что-то не в тую. :(
Какие-такие сканы, если есть электронный документ с цифровой подписью? Или ваши поставщики вместо электронных документом шлют сканы вложением в письмо, подписанное ЭЦП?
25 Garykom
 
гуру
27.08.17
00:05
(24) Файл jpg - это тоже "электронный документ" и его так же можно подписать и прислать с цифровой подписью.

Вы действительно не в курсе современного электронного документооборота?
Это в реальности вот такой идиотизм, когда документу ворда/экселя сначала печатают, затем подписывают, ставят печать и отправляют по СЭД (ну или электронке)
26 Garykom
 
гуру
27.08.17
00:05
(25) *подписывают бумажный, ставят живую печать - а затем сканируют и отправляют!
27 RayCon
 
28.08.17
05:28
(26)
>Вы действительно не в курсе современного электронного документооборота?

(26) Я действительно не в курсе такого идиотизма:

>когда документу ворда/экселя сначала печатают, затем подписывают,
>ставят печать и отправляют по СЭД

Но вполне в курсе такого информирующего действия:

>(ну или электронке)
28 1Сукпун
 
28.08.17
06:11
(0) посмотри  вот  здесь http://efsol.ru/solutions/sys-docflow.html
правда  по  личному  опыту   ,  это  не слишком  упрощает  ввод  первички
29 RayCon
 
28.08.17
12:20
(28) +1
30 Garykom
 
гуру
28.08.17
12:24
(28) Все эти "системы потокового ввода" работают только для одинаковых стандартных форм, типа разных тестов с галочками и тому подобное.

Для распознавания и автозаполнения документов в разных форматах от разных контрагентов они не работают.
31 RayCon
 
28.08.17
16:51
(30) +1
Но, наверное, всё-таки более корректно было бы сказать так:
Для распознавания и автозаполнения документов в разных форматах от разных контрагентов они работают, если выполнить настройку для каждого формата каждого документа каждого контрагента. Да и то только до тех пор, пока форматы документов, их виды и перечень контрагентов не меняются. А покуда жизнь изменчива всегда, то трудозатраты на перманентную поддержку могут свести к нулю и даже в минус все выгоды от потокового сканирования.
32 spiller26
 
28.08.17
16:59
(0) ИИ ещё не дошел до такого.
Сканировать бесполезно, всё равно обрабатывать человеком придётся.
Договориться с поставщиком о своём формате выгрузки, но не все пойдут на это, да и форматов куча (XLS, XLSX, ODS и т.д.)
33 dezss
 
28.08.17
17:12
(0) Только если все накладные строго одинаковые. Когда работал в банке, была подобная практика и сканер, который сам пачку доков сканит, но формат ПП строго формализован и там даже размеры ячеек формализованы(если не ошибаюсь). К тому же, банк за ввод ПП денюшку с клиента брал, а тут это пустая трата времени и денег. Тут все в точности как сказали в (31).
34 Garykom
 
гуру
28.08.17
17:13
(31) это слишком длинно говорить и многим непонятно/заумно
35 Лефмихалыч
 
28.08.17
17:49
(0) Надысь исследовал сабж, выкладываю ссылки на решения, которые нарыл гуголом. Среди решений много REST-сервисов для этого дела, но это потому, что я по ряду причин отдавал им предпочтение.

https://cloud.google.com/vision/

http://ocrsdk.com/plans-and-pricing/

https://ocr.space/

http://cognitive.ru/ - им звонить надо, ибо на сайте нет инфы. Они решение продают, но сейчас с упоением какими-то беспилотниками занимаются и OCR сам по себе у них не в фаворе.

http://www.newocr.com/

Еще Вместе с 1С:Документооборот поставляется уже собранная для винды сборка CuneiForms. Можно поднатужиться и собрать что-то руками на основе этого (если купить ДО).

И есть еще Евфрат-документооборот, которые в рамках отдельного проекта могут реализовать сервер распознавания. Им тоже звонить надо.
36 Лефмихалыч
 
28.08.17
17:53
(30) кстати - да. Мои исследования успешно завершились неудачей ровно на этом же выводе.
37 Лефмихалыч
 
28.08.17
17:58
+(36) ну, и качество распознавания у них у всех какое-то такое:
https://i.imgur.com/XegMkbD.png

сплошная фсдсрация и страхоёхние...