|
Импорт из PDF | ☑ | ||
---|---|---|---|---|
0
Chameleon1980
18.07.16
✎
23:04
|
Приветствую всех.
Скажите знающие и предполагающие как счас обстоит иморт ид ПДФ? чтение чем нить таблиц доков типа Сч.ф etc. спасибо |
|||
1
H A D G E H O G s
18.07.16
✎
23:07
|
Никак.
|
|||
2
Chameleon1980
18.07.16
✎
23:11
|
я что-то так и подумал - сколько читал пдф как источник
|
|||
3
H A D G E H O G s
18.07.16
✎
23:13
|
(2) В ПДФ - изображения? JPG ?
|
|||
4
Chameleon1980
18.07.16
✎
23:39
|
табличку хотелось бы достать типа PDF->XLS
|
|||
5
Chameleon1980
18.07.16
✎
23:40
|
документ приходит в пдфе - загдрузить в док тч хотябы
|
|||
6
Fram
19.07.16
✎
00:14
|
(5) а договориться с поставщиком о нормальном формате или программном интерфейсе?
если есть необходиомость в автоматизации, значит объем торговли большой и зантересованность есть у обоих сторон, нет? |
|||
7
Chameleon1980
19.07.16
✎
00:21
|
дык вот товарищу так и пишу:
" скажи как к тебе эти файлы попадают? если по почте - как они их формируют. если с 1с по почте - у них есть возможность просто в екселе (95%) " просто интересно стало |
|||
8
Beretta
19.07.16
✎
00:21
|
(5) Любой каприз за ваши деньги
https://acrobat.adobe.com/ru/ru/acrobat/how-to/pdf-to-excel-xlsx-converter.html |
|||
9
HawkEye
19.07.16
✎
00:23
|
(0) если в pdf не картинка, что мешает его отпарсить?
|
|||
10
Chameleon1980
19.07.16
✎
00:24
|
(8) берет - онлайн есть у него - автоматизация жеж (лентяям) хочется всем
|
|||
11
Chameleon1980
19.07.16
✎
00:24
|
(9) как таблицу ?
|
|||
12
Chameleon1980
19.07.16
✎
00:27
|
не. согласен. все можно правильно уложить в правильном порядке по правильным правилам :)
|
|||
13
Chameleon1980
19.07.16
✎
00:27
|
не сталкивался просто
|
|||
14
Злопчинский
19.07.16
✎
01:23
|
в свое время искал - не нашел. тот же акробат нормально сосал только простейшие плоские таблицы. а когда строка - одна, но с переносами - (_._) - чем на выставке одной и поверг в уныние адобовских манагеров-продаванов задав им вопрос пообстоятельнее...
как сейчас - хз, может лучше стало... |
|||
15
RomaH
naïve
19.07.16
✎
07:46
|
ИмяИсходногоФайла = ПолучитьИмяВременногоФайла("pdf");
ДД.Записать(ИмяИсходногоФайла); Скрипт = Новый COMОбъект("WScript.Shell"); ИмяТекстовогоФайла = ПолучитьИмяВременногоФайла("txt"); ИмяКаталогаУтилит = """C:\Program Files (x86)\PDFtk Server\bin\"; ТекстКоманды = ИмяКаталогаУтилит + "pdftotext.exe"" -layout -enc UTF-8 " + ИмяИсходногоФайла + " " + ИмяТекстовогоФайла; ТекстКоманды = ИмяКаталогаУтилит + "pdftotext.exe"" -layout -table -enc UTF-8 " + ИмяИсходногоФайла + " " + ИмяТекстовогоФайла; Скрипт.Run(ТекстКоманды, 0, 1); ТекстовыйДокумент = Новый ТекстовыйДокумент; ТекстовыйДокумент.Прочитать(ИмяТекстовогоФайла,КодировкаТекста.UTF8); Текст = ТекстовыйДокумент.ПолучитьТекст(); УдалитьФайлы(ИмяИсходногоФайла); УдалитьФайлы(ИмяТекстовогоФайла); //"Имя :(.+)СП №" поиск имени пациента RegExp = Новый COMОбъект("VBScript.RegExp"); RegExp.IgnoreCase = Истина; RegExp.MultiLine = Истина; // истина — текст многострочный, ложь — одна строка RegExp.Global = Истина; RegExp.pattern = "Имя :(.+)СП №"; РезультатыПоИменам = RegExp.Execute(Текст); RegExp.pattern = "День рождения :(.*)Возраст"; РезультатыПоДР = RegExp.Execute(Текст); RegExp.pattern = "ID образца :.*?(\d+)"; РезультатыПоИдентификатору = RegExp.Execute(Текст); RegExp.pattern = "Дата выполнения : ((\d{4})-(\d{2})-(\d{2}))"; РезультатыПоДатам = RegExp.Execute(Текст); как - то так |
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |