|
Распознавание символов на картинке в 1С. | ☑ | ||
---|---|---|---|---|
0
mzelensky
17.11.11
✎
09:45
|
Доброго времени суток!
Заказчик выдал "хотелку", по реализации которой я не имею никакого понятия. Задача: Имеется некий pdf файл (кстати тоже сформированный из 1С), в этом файле может быть не ограниченное количество листов. На каждом листе (в определенной области) имеется штрих-код (штрих-код наш, используется чисто для внутреннего документооборота). Нужно чтобы 1С-ка автоматически распознавала этот штрих-код и в зависимости от той информации, которая в него заложена, производила определенные действия. КАК РАСПОЗНАТЬ И ОБРАБОТАТЬ ШТРИХ-КОД из PDF-ФАЙЛА? |
|||
1
Grusswelle
17.11.11
✎
09:47
|
Неужели внешних компонент таких нету?
ЗЫ: Сканером, с экрана! :-)) |
|||
2
Wobland
17.11.11
✎
09:47
|
откуда файл пришёл?
|
|||
3
aleks-id
17.11.11
✎
09:47
|
найти OCR которая работает через СОМ
|
|||
4
mzelensky
17.11.11
✎
09:59
|
(1) ну что-то нашел...но может тут у кого личный опыт есть...чтобы дурные шишки не набивать!
|
|||
5
mzelensky
17.11.11
✎
10:00
|
(2) Это наш файл (например контракт)...например ситуация: мы его сделали, отправили клиенту, тот произвел свои действия и отправил в ответ - нужно распознать и присунуть в определенную папочку!
|
|||
6
aleks-id
17.11.11
✎
10:02
|
(5) во бред! пдф сделан по идее чтобы нельзя было править. что там правит клиент?
|
|||
7
Tatitutu
17.11.11
✎
10:02
|
(5) самое простое и дешево в название файла в конце указать штрихкод
и при поступлении обработать эту информацию. |
|||
8
Tatitutu
17.11.11
✎
10:03
|
(6) Кто тебе это сказал ? Забудь как миф
|
|||
9
mzelensky
17.11.11
✎
10:04
|
(7) да, это логично и просто, но не гарантируется сохранение правильного имени файла.
|
|||
10
mzelensky
17.11.11
✎
10:05
|
(6) ты всем клиентам говоришь - "это бред, так делать я не буду и вам это не надо!". Если просят, значит надо!
|
|||
11
aleks-id
17.11.11
✎
10:07
|
(8) я же написал - по идее. сам прекрасно знаю что редактируется. но какой смысл тогда отправлять в ПДФ???
|
|||
12
aleks-id
17.11.11
✎
10:08
|
(10) ты б задачу то обрисовал полностью - глядишь, и решение бы нашлось. почему бы не отправлять им контракт в ворде?
|
|||
13
mzelensky
17.11.11
✎
10:09
|
вроде есть одна обработка:
http://forum.infostart.ru/forum24/topic22062/ но что-то больше я не вижу. |
|||
14
mzelensky
17.11.11
✎
10:10
|
(12) давай без поиска АЛЬТЕРНАТИВ. Задачу я поставил - как можно распознать штрих-код в pdg?!
|
|||
15
Зеленый Кот
17.11.11
✎
10:11
|
захватить скриншот экрана и распознать
|
|||
16
Кириллка
17.11.11
✎
10:12
|
(11)партнеру отдается pdf'ка, в которой доступны для редактирования какие-то поля. Он эти поля заполняет и возвращает файл. Я, как создатель этого файла, не парю голову, что он кроме своих полей, исправил что-то еще.
|
|||
17
sergey yevsenya
17.11.11
✎
10:14
|
Реализовывали такое, если интересно стукнись в аську
|
|||
18
Леха Дум
17.11.11
✎
10:16
|
А что мешает подготовить такой же файл в excel? Вечно геморрой надо придумывать.
|
|||
19
mzelensky
17.11.11
✎
10:18
|
(15) нужно без визуального открытия этого файла! Т.е. чтобы все действия производились в фоновом режиме без дополнительных действий со стороны пользователя.
|
|||
20
Леха Дум
17.11.11
✎
10:23
|
+(18) или попробовать хранить информацию штрихкода в метаданных документа
|
|||
21
mzelensky
17.11.11
✎
10:36
|
(17) Еще один...я тебе говорю - НУЖНО ИЗ PDF, без лишних вопросов "ЗАчЕМ"!
|
|||
22
aleks-id
17.11.11
✎
10:43
|
http://www.pdfonline.com/products/allpdf-converter/
конвертишь в ворд, потом ворд парсишь |
|||
23
aleks-id
17.11.11
✎
10:44
|
а еще проще конвертишь в хтмл http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/
|
|||
24
mzelensky
17.11.11
✎
10:46
|
(23) это уже интересней...немного через одно место конечно....но по крайней мере рабочий механизм.
|
|||
25
mzelensky
17.11.11
✎
10:47
|
(23) единственное ток, что она платная :(
|
|||
26
aleks-id
17.11.11
✎
10:55
|
(25) ты напиши им, узнай почем. OCR вроде как тоже не бесплатные есличо, а модуль конвертации пдф в хтмл там отдельно продается.
|
|||
27
rutony
17.11.11
✎
10:58
|
(26) В MS Office есть пакет OCR
Есть еще и бесплатные в том числе. Давненько писал ботов юзал, щас даже не вспомню названия... |
|||
28
mzelensky
17.11.11
✎
11:03
|
(27) да мне бы примерчик простенький :(
|
|||
29
VVi3ard
17.11.11
✎
11:04
|
Тебе в (3) правильно сказали ищи (или пиши, или заказывай фрилансеру) com компонент который будет распознавать код с картинки.
Еще как вариант: Я встречал консольную утилиту которой на вход передается картинка со штрихкодами, на выходе она генерит список штрихкодов с этой картинки. Ну и соответственно не сложно найти консольную утилиту PDF-JPG к сожалению готовым решением поделится не могу т.к. потом задача снялась |
|||
30
Xapac
17.11.11
✎
11:17
|
а пдф файл большой? а то мож листов 300 это ж на пол дня распознавания
|
|||
31
VVi3ard
17.11.11
✎
11:18
|
Вот кстати вспомнил проект на котором я брал исходники: http://code.google.com/p/zxing/
|
|||
32
VVi3ard
17.11.11
✎
11:18
|
300 листов на Core2Duo это 5-6 минут работы.
|
|||
33
Sergeyspb13
17.11.11
✎
11:22
|
а сразу записывать в PDF номер штрих кода или прочего текста почему не хочешь? а потом уже другими средствами смотреть
этим создавать pdf http://www.biopdf.com есть COM ну и найти читалку PDF, которая может прочесть допустим Keywords или Subject из этого PDFa |
|||
34
mzelensky
17.11.11
✎
11:26
|
(30) может быть большой. Но по задаче распознать нужно лишь 1 штрих-код (скажем с первого листа).
|
|||
35
mzelensky
17.11.11
✎
11:28
|
(33) я уже об этом думал. И действительно, так проще - тем более код (числовой) я пишу под штрих-кодом. Т.е. задача сводится к - распознать текст в определенной области и обработать его.
|
|||
36
mzelensky
17.11.11
✎
11:29
|
(33) я через biopdf их и создаю :)
|
|||
37
Xapac
17.11.11
✎
11:30
|
(13) что то у меня не работает(((
|
|||
38
Sergeyspb13
17.11.11
✎
11:31
|
(36) запиши не на листе, а в свойствах файла ...
http://www.biopdf.com/guide/settings.php - например в Keywords http://www.biopdf.com/guide/examples/com_vbscript/ а другой прогой читай |
|||
39
aleks-id
17.11.11
✎
11:32
|
||||
40
mzelensky
17.11.11
✎
11:32
|
(37) я еще не пробовал. А что не работает?
|
|||
41
СноваЗдорова
17.11.11
✎
11:34
|
Надо юзать метаданные файла, имхо.
|
|||
42
mzelensky
17.11.11
✎
11:36
|
(38) Вариант хороший, но ситуация:
Клиент получает наш контракт (с нашим штрих-кодом). Распечатывает его, ставит свои росписи, печати, сканирует опять и отправляет нам в ответ. Нам нужно автоматом определить этот контракт...в этом случа такая ситуация не прокатит, т.к. файл pdf будет новым! |
|||
43
artems
17.11.11
✎
11:37
|
http://infostart.ru/public/15864/ это не подойет?
|
|||
44
mzelensky
17.11.11
✎
11:37
|
(42) т.е. привязываться к свойствам файла не получится - нужно привязываться к СОДЕРЖИМОМУ файла
|
|||
45
Sergeyspb13
17.11.11
✎
11:38
|
(42) тогда only OCR и причем еще не факт что клиент отсканит в правильном порядке контракт и страницы будут не перевернуты =)
|
|||
46
Xapac
17.11.11
✎
11:38
|
(40)1с запускает какой-то установщик) потом ругается, что виндовс ничего не смог установить. (видать офис у меня слишком старой)
|
|||
47
mzelensky
17.11.11
✎
11:38
|
(43) тот же автор, что и в (13). Я посмотрю
|
|||
48
VVi3ard
17.11.11
✎
11:39
|
Блин вот ведь нехорошие люди берут исходники ZXing оборачивают их в ActiveX и продают за деньги.
|
|||
49
mzelensky
17.11.11
✎
11:39
|
(45) порядок значения не имеет - штрих-код повторяется на всех страницах и мне достаточно распознать хотя бы один! А вот с перевернутым это да...лажа будет.
|
|||
50
Sergeyspb13
17.11.11
✎
11:40
|
лучше сразу говорите клиентам, чтоб когда отправляли вам этот файл переименовывали его в номер этого штрих-кода
|
|||
51
VVi3ard
17.11.11
✎
11:40
|
(47) Почему бы самому не скачать исходники под С# скомпилить в COM компоненту и выложить для всех?
|
|||
52
VVi3ard
17.11.11
✎
11:40
|
(50) Истинный подход 1С-ника.
|
|||
53
mzelensky
17.11.11
✎
11:41
|
(51) Действительно, почему бы и нет?!?!? Не хочешь заняться добрым делом????
|
|||
54
pumbaEO
17.11.11
✎
11:42
|
Была другая немного задача. Акты выполненных работ.
imagemagick конвертил из pdf в картинку, обрезал для уменьшения распознавания. zbar - есть утилитка определял на картинке штрих-код. Парсил результат. Штрихкод был как uuid документа. |
|||
55
Sergeyspb13
17.11.11
✎
11:43
|
(54) они распечатают а потом сканят снова, не подходит
(53) ну накрайняк если это ответ по эл.почте то в письме могут указывать код |
|||
56
mikecool
17.11.11
✎
11:43
|
сохранять соответствие файл - лист - штрихкод в РС, потом брать оттуда
|
|||
57
pumbaEO
17.11.11
✎
11:44
|
Еще есть от abby платная программа для определения штрихкодов. Года два назад стоила 500 баксов.
|
|||
58
Леха Дум
17.11.11
✎
11:44
|
злобные клиенты на другом конце могут отсканировать несколько контрактов и засунуть их в один файл пдф
|
|||
59
pumbaEO
17.11.11
✎
11:45
|
Еще раз печатали акт выполненных работ.
Отдавали клиенту. Ставил печать, возвращали обратно. Сканируем пакетно, специальные сканеры. Создаются файлики картинки. zbar определили штирхкод на картинке и приложили картинку его к документу. |
|||
60
Xapac
17.11.11
✎
11:47
|
(0)а я не понял а человек что-ли не может посмотреть и увидеть? или в организации только компьютеры работают. я бы понял здачу если их много, и сложно бла бла. а тут одну циферку в письме разглядеть...
|
|||
61
aleks-id
17.11.11
✎
11:47
|
проверил (39) - нормально конвертит. отдельно распознает картинки
|
|||
62
DenLaDen
17.11.11
✎
11:50
|
(5) Ты же говорил, что в файле несколько листов и на каждом листе штрихкод. Штрихкод же может быть разный? Получается что тебе придется выдирать листы из файла и рассовывать по папочкам?
|
|||
63
mzelensky
17.11.11
✎
11:51
|
(60) их действительно может быть много. На распределение уходит много времени.
|
|||
64
mzelensky
17.11.11
✎
11:53
|
(62) на весь контракт штрих-код ОДИН. Один файл = один контракт = один штрих код.
|
|||
65
mzelensky
17.11.11
✎
11:53
|
(61) ну значит чуть позже его и попробую.
|
|||
66
DenLaDen
17.11.11
✎
11:54
|
(64) тогда пишите штрихкод в атрибуты файла, клиент их менять не станет
|
|||
67
Rie
17.11.11
✎
11:59
|
(64) PDF изнутри - это просто текстовый файл (возможно, упакованный).
Рядом с картинкой (или не рядом, а в некотором определённом месте) можно поместить просто циферки - а потом их оттуда того-с. Можно даже сделать их невидимыми. |
|||
68
Sergeyspb13
17.11.11
✎
12:00
|
интересно если клиент не подпишет или забудет печать поставить и скинет.. система тогда его примет и скажет все ок... и в день Ч кто будет крайний )))) споросит начальник, почему твоя система не проверила печати и подписи ))))
|
|||
69
mzelensky
17.11.11
✎
12:02
|
(66) ты ветку читал??? вернись к (42) и поймешь почему такой вариант не подходит.
|
|||
70
mzelensky
17.11.11
✎
12:03
|
(68) это уже другой вопрос и другая ситуация...
|
|||
71
aka AMIGO
17.11.11
✎
12:05
|
фотошоп, файнридер, паинт, медиаплеер, ... и всё это в 1с- № 8..
ну когда-ж, наконец, 1с создаст свою операционку, с кнопкой "сделадь всё!"??!!??.. или уж попросить сваять оську наших с вами гуру?.. им не привыкать к запросам страждущих :) ЗЫ. ФайнРидер типа 9 применить еще не предлагали? у меня это очень популярный инструмент, если срочно надо вырезать картинку, сделать текст.. хоть из чего.. |
|||
72
aka AMIGO
17.11.11
✎
12:06
|
+71 это если не так часто надо вырезать..
|
|||
73
mzelensky
17.11.11
✎
12:10
|
(71) последнее время интеграция 1С со всякими сторонними продуктами набирает все больший оборот...раньше я и не представлял ,что можно скрещивать 1С-ку с Корелом , ФайнРидером или какими-то GPS-устройствами/прогами...но народ доказал ,что нет предела совершенству!
|
|||
74
VVi3ard
17.11.11
✎
12:10
|
(53) Хочу и даже займусь, возможно даже на выходных, просто мне в данный момент это не нужна, есть другая работа которую нужно делать.
Я так понял что перед тобой задача стоит которую нужно решить было бы логично ее решить. |
|||
75
VVi3ard
17.11.11
✎
12:13
|
(53) Работать с C# сейчас учат на первом курсе института, инструкция по созданию компонент есть на ИТС потратить 1-2 дня и сделать в чем проблема?
|
|||
76
mzelensky
17.11.11
✎
12:14
|
(74) я просто давно уже не сидел за СИ, да и не люблю я его (в свое время был поклонником Делфи и вообще борландов).
|
|||
77
Jaffar
17.11.11
✎
13:45
|
на мой дилетантский взгляд, прежде чем бежать автоматизировать любую хотелку заказчика - нужно четко понять, для чего это нужно, и какие подводные камни могут всплыть (начиная от того, что клиент при сканировании обрежет ваш штрих-код - нафих он ему для подписания? - до того, что вставит свой штрих-код вместе или вместо вашего).
Я бы стремился убедить заказчика решать эти вопросы не автоматом, а мозгами - тогда не будет ситуации, что клиент вернет обратно файл без подписи и печати. |
|||
78
Jaffar
17.11.11
✎
13:57
|
у меня на прошлой работе тоже одно время дошли до автоматизации учета договоров (правда, там 2 цели преследовали - не только получить их в электронном виде, но и осуществить контроль при платежах по договорам - на 1-м этапе рассматривали только договора с поставщиками, потом планировали перейти к договорам с покупателями), но основные действия в системе зациклили на архивариуса, через которую проходили все договора.
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |