Имя: Пароль:
1C
1С v8
Распознавание символов на картинке в 1С.
0 mzelensky
 
17.11.11
09:45
Доброго времени суток!

Заказчик выдал "хотелку", по реализации которой я не имею никакого понятия. Задача:

Имеется некий pdf файл (кстати тоже сформированный из 1С), в этом файле может быть не ограниченное количество листов. На каждом листе (в определенной области) имеется штрих-код (штрих-код наш, используется чисто для внутреннего документооборота). Нужно чтобы 1С-ка автоматически распознавала этот штрих-код и в зависимости от той информации, которая в него заложена, производила определенные действия.

КАК РАСПОЗНАТЬ И ОБРАБОТАТЬ ШТРИХ-КОД из PDF-ФАЙЛА?
1 Grusswelle
 
17.11.11
09:47
Неужели внешних компонент таких нету?

ЗЫ: Сканером, с экрана! :-))
2 Wobland
 
17.11.11
09:47
откуда файл пришёл?
3 aleks-id
 
17.11.11
09:47
найти OCR которая работает через СОМ
4 mzelensky
 
17.11.11
09:59
(1) ну что-то нашел...но может тут у кого личный опыт есть...чтобы дурные шишки не набивать!
5 mzelensky
 
17.11.11
10:00
(2) Это наш файл (например контракт)...например ситуация: мы его сделали, отправили клиенту, тот произвел свои действия и отправил в ответ - нужно распознать и присунуть в определенную папочку!
6 aleks-id
 
17.11.11
10:02
(5) во бред! пдф сделан по идее чтобы нельзя было править. что там правит клиент?
7 Tatitutu
 
17.11.11
10:02
(5) самое простое и дешево в название файла в конце указать штрихкод
и при поступлении обработать эту информацию.
8 Tatitutu
 
17.11.11
10:03
(6) Кто тебе это сказал ? Забудь как миф
9 mzelensky
 
17.11.11
10:04
(7) да, это логично и просто, но не гарантируется сохранение правильного имени файла.
10 mzelensky
 
17.11.11
10:05
(6) ты всем клиентам говоришь - "это бред, так делать я не буду и вам это не надо!". Если просят, значит надо!
11 aleks-id
 
17.11.11
10:07
(8) я же написал - по идее. сам прекрасно знаю что редактируется. но какой смысл тогда отправлять в ПДФ???
12 aleks-id
 
17.11.11
10:08
(10) ты б задачу то обрисовал полностью - глядишь, и решение бы нашлось. почему бы не отправлять им контракт в ворде?
13 mzelensky
 
17.11.11
10:09
вроде есть одна обработка:

http://forum.infostart.ru/forum24/topic22062/

но что-то больше я не вижу.
14 mzelensky
 
17.11.11
10:10
(12) давай без поиска АЛЬТЕРНАТИВ. Задачу я поставил - как можно распознать штрих-код в pdg?!
15 Зеленый Кот
 
17.11.11
10:11
захватить скриншот экрана и распознать
16 Кириллка
 
17.11.11
10:12
(11)партнеру отдается pdf'ка, в которой доступны для редактирования какие-то поля. Он эти поля заполняет и возвращает файл. Я, как создатель этого файла, не парю голову, что он кроме своих полей, исправил что-то еще.
17 sergey yevsenya
 
17.11.11
10:14
Реализовывали такое, если интересно стукнись в аську
18 Леха Дум
 
17.11.11
10:16
А что мешает подготовить такой же файл в excel? Вечно геморрой надо придумывать.
19 mzelensky
 
17.11.11
10:18
(15) нужно без визуального открытия этого файла! Т.е. чтобы все действия производились в фоновом режиме без дополнительных действий со стороны пользователя.
20 Леха Дум
 
17.11.11
10:23
+(18) или попробовать хранить информацию штрихкода в метаданных документа
21 mzelensky
 
17.11.11
10:36
(17) Еще один...я тебе говорю - НУЖНО ИЗ PDF, без лишних вопросов "ЗАчЕМ"!
22 aleks-id
 
17.11.11
10:43
http://www.pdfonline.com/products/allpdf-converter/
конвертишь в ворд, потом ворд парсишь
23 aleks-id
 
17.11.11
10:44
а еще проще конвертишь в хтмл http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/
24 mzelensky
 
17.11.11
10:46
(23) это уже интересней...немного через одно место конечно....но по крайней мере рабочий механизм.
25 mzelensky
 
17.11.11
10:47
(23) единственное ток, что она платная :(
26 aleks-id
 
17.11.11
10:55
(25) ты напиши им, узнай почем. OCR вроде как тоже не бесплатные есличо, а модуль конвертации пдф в хтмл там отдельно продается.
27 rutony
 
17.11.11
10:58
(26) В MS Office есть пакет OCR
Есть еще и бесплатные в том числе. Давненько писал ботов юзал, щас даже не вспомню названия...
28 mzelensky
 
17.11.11
11:03
(27) да мне бы примерчик простенький :(
29 VVi3ard
 
17.11.11
11:04
Тебе в (3) правильно сказали ищи (или пиши, или заказывай фрилансеру) com компонент который будет распознавать код с картинки.

Еще как вариант:
Я встречал консольную утилиту которой на вход передается картинка со штрихкодами, на выходе она генерит список штрихкодов с этой картинки.
Ну и соответственно не сложно найти консольную утилиту PDF-JPG к сожалению готовым решением поделится не могу т.к. потом задача снялась
30 Xapac
 
17.11.11
11:17
а пдф файл большой? а то мож листов 300 это ж на пол дня распознавания
31 VVi3ard
 
17.11.11
11:18
Вот кстати вспомнил проект на котором я брал исходники: http://code.google.com/p/zxing/
32 VVi3ard
 
17.11.11
11:18
300 листов на Core2Duo это 5-6 минут работы.
33 Sergeyspb13
 
17.11.11
11:22
а сразу записывать в PDF номер штрих кода или прочего текста почему не хочешь? а потом уже другими средствами смотреть

этим создавать pdf http://www.biopdf.com есть COM
ну и найти читалку PDF, которая может прочесть допустим Keywords или Subject из этого PDFa
34 mzelensky
 
17.11.11
11:26
(30) может быть большой. Но по задаче распознать нужно лишь 1 штрих-код (скажем с первого листа).
35 mzelensky
 
17.11.11
11:28
(33) я уже об этом думал. И действительно, так проще - тем более код (числовой) я пишу под штрих-кодом. Т.е. задача сводится к - распознать текст в определенной области и обработать его.
36 mzelensky
 
17.11.11
11:29
(33) я через biopdf их и создаю :)
37 Xapac
 
17.11.11
11:30
(13) что то у меня не работает(((
38 Sergeyspb13
 
17.11.11
11:31
(36) запиши не на листе, а в свойствах файла ...
http://www.biopdf.com/guide/settings.php - например в Keywords
http://www.biopdf.com/guide/examples/com_vbscript/

а другой прогой читай
39 aleks-id
 
17.11.11
11:32
40 mzelensky
 
17.11.11
11:32
(37) я еще не пробовал. А что не работает?
41 СноваЗдорова
 
17.11.11
11:34
Надо юзать метаданные файла, имхо.
42 mzelensky
 
17.11.11
11:36
(38) Вариант хороший, но ситуация:

Клиент получает наш контракт (с нашим штрих-кодом). Распечатывает его, ставит свои росписи, печати, сканирует опять и отправляет нам в ответ. Нам нужно автоматом определить этот контракт...в этом случа такая ситуация не прокатит, т.к. файл pdf будет новым!
43 artems
 
17.11.11
11:37
http://infostart.ru/public/15864/ это не подойет?
44 mzelensky
 
17.11.11
11:37
(42) т.е. привязываться к свойствам файла не получится - нужно привязываться к СОДЕРЖИМОМУ файла
45 Sergeyspb13
 
17.11.11
11:38
(42) тогда only OCR и причем еще не факт что клиент отсканит в правильном порядке контракт и страницы будут не перевернуты =)
46 Xapac
 
17.11.11
11:38
(40)1с запускает какой-то установщик) потом ругается, что виндовс ничего не смог установить. (видать офис у меня слишком старой)
47 mzelensky
 
17.11.11
11:38
(43) тот же автор, что и в (13). Я посмотрю
48 VVi3ard
 
17.11.11
11:39
Блин вот ведь нехорошие люди берут исходники ZXing оборачивают их в ActiveX и продают за деньги.
49 mzelensky
 
17.11.11
11:39
(45) порядок значения не имеет - штрих-код повторяется на всех страницах и мне достаточно распознать хотя бы один! А вот с перевернутым это да...лажа будет.
50 Sergeyspb13
 
17.11.11
11:40
лучше сразу говорите клиентам, чтоб когда отправляли вам этот файл переименовывали его в номер этого штрих-кода
51 VVi3ard
 
17.11.11
11:40
(47) Почему бы самому не скачать исходники под С# скомпилить в COM компоненту и выложить для всех?
52 VVi3ard
 
17.11.11
11:40
(50) Истинный подход 1С-ника.
53 mzelensky
 
17.11.11
11:41
(51) Действительно, почему бы и нет?!?!? Не хочешь заняться добрым делом????
54 pumbaEO
 
17.11.11
11:42
Была другая немного задача. Акты выполненных работ.
imagemagick конвертил из pdf в картинку, обрезал для уменьшения распознавания.
zbar - есть утилитка определял на картинке штрих-код. Парсил результат.
Штрихкод был как uuid документа.
55 Sergeyspb13
 
17.11.11
11:43
(54) они распечатают а потом сканят снова, не подходит


(53) ну накрайняк если это ответ по эл.почте то в письме могут указывать код
56 mikecool
 
17.11.11
11:43
сохранять соответствие файл - лист - штрихкод в РС, потом брать оттуда
57 pumbaEO
 
17.11.11
11:44
Еще есть от abby платная программа для определения штрихкодов. Года два назад стоила 500 баксов.
58 Леха Дум
 
17.11.11
11:44
злобные клиенты на другом конце могут отсканировать несколько контрактов и засунуть их в один файл пдф
59 pumbaEO
 
17.11.11
11:45
Еще раз печатали акт выполненных работ.
Отдавали клиенту. Ставил печать, возвращали обратно. Сканируем пакетно, специальные сканеры. Создаются файлики картинки.
zbar определили штирхкод на картинке и приложили картинку его к документу.
60 Xapac
 
17.11.11
11:47
(0)а я не понял а человек что-ли не может посмотреть и увидеть? или в организации только компьютеры работают. я бы понял здачу если их много, и сложно бла бла. а тут одну циферку в письме разглядеть...
61 aleks-id
 
17.11.11
11:47
проверил (39) - нормально конвертит. отдельно распознает картинки
62 DenLaDen
 
17.11.11
11:50
(5) Ты же говорил, что в файле несколько листов и на каждом листе штрихкод. Штрихкод же может быть разный? Получается что тебе придется выдирать листы из файла и рассовывать по папочкам?
63 mzelensky
 
17.11.11
11:51
(60) их действительно может быть много. На распределение уходит много времени.
64 mzelensky
 
17.11.11
11:53
(62) на весь контракт штрих-код ОДИН. Один файл = один контракт =  один штрих код.
65 mzelensky
 
17.11.11
11:53
(61) ну значит чуть позже его и попробую.
66 DenLaDen
 
17.11.11
11:54
(64) тогда пишите штрихкод в атрибуты файла, клиент их менять не станет
67 Rie
 
17.11.11
11:59
(64) PDF изнутри - это просто текстовый файл (возможно, упакованный).
Рядом с картинкой (или не рядом, а в некотором определённом месте) можно поместить просто циферки - а потом их оттуда того-с. Можно даже сделать их невидимыми.
68 Sergeyspb13
 
17.11.11
12:00
интересно если клиент не подпишет или забудет печать поставить и скинет.. система тогда его примет и скажет все ок... и в день Ч кто будет крайний )))) споросит начальник, почему твоя система не проверила печати и подписи ))))
69 mzelensky
 
17.11.11
12:02
(66) ты ветку читал??? вернись к (42) и поймешь почему такой вариант не подходит.
70 mzelensky
 
17.11.11
12:03
(68) это уже другой вопрос и другая ситуация...
71 aka AMIGO
 
17.11.11
12:05
фотошоп, файнридер, паинт, медиаплеер, ... и всё это в 1с- № 8..
ну когда-ж, наконец, 1с создаст свою операционку, с кнопкой "сделадь всё!"??!!??..
или уж попросить сваять оську наших с вами гуру?.. им не привыкать к запросам страждущих :)

ЗЫ. ФайнРидер типа 9 применить еще не предлагали?
у меня это очень популярный инструмент, если срочно надо вырезать картинку, сделать текст.. хоть из чего..
72 aka AMIGO
 
17.11.11
12:06
+71 это если не так часто надо вырезать..
73 mzelensky
 
17.11.11
12:10
(71) последнее время интеграция 1С со всякими сторонними продуктами набирает все больший оборот...раньше я и не представлял ,что можно скрещивать 1С-ку с Корелом , ФайнРидером или какими-то GPS-устройствами/прогами...но народ доказал ,что нет предела совершенству!
74 VVi3ard
 
17.11.11
12:10
(53)  Хочу и даже займусь, возможно даже на выходных, просто мне в данный момент это не нужна, есть другая работа которую нужно делать.

Я так понял что перед тобой задача стоит которую нужно решить было бы логично ее решить.
75 VVi3ard
 
17.11.11
12:13
(53) Работать с C# сейчас учат на первом курсе института, инструкция по созданию компонент есть на ИТС потратить 1-2 дня и сделать в чем проблема?
76 mzelensky
 
17.11.11
12:14
(74) я просто давно уже не сидел за СИ, да и не люблю я его (в свое время был поклонником Делфи и вообще борландов).
77 Jaffar
 
17.11.11
13:45
на мой дилетантский взгляд, прежде чем бежать автоматизировать любую хотелку заказчика - нужно четко понять, для чего это нужно, и какие подводные камни могут всплыть (начиная от того, что клиент при сканировании обрежет ваш штрих-код - нафих он ему для подписания? - до того, что вставит свой штрих-код вместе или вместо вашего).
Я бы стремился убедить заказчика решать эти вопросы не автоматом, а мозгами - тогда не будет ситуации, что клиент вернет обратно файл без подписи и печати.
78 Jaffar
 
17.11.11
13:57
у меня на прошлой работе тоже одно время дошли до автоматизации учета договоров (правда, там 2 цели преследовали - не только получить их в электронном виде, но и осуществить контроль при платежах по договорам - на 1-м этапе рассматривали только договора с поставщиками, потом планировали перейти к договорам с покупателями), но основные действия в системе зациклили на архивариуса, через которую проходили все договора.
Закон Брукера: Даже маленькая практика стоит большой теории.