Имя: Пароль:
1C
1С v8
Импорт из PDF
0 Chameleon1980
 
18.07.16
23:04
Приветствую всех.

Скажите знающие и предполагающие

как счас обстоит иморт ид ПДФ?

чтение чем нить таблиц доков типа Сч.ф etc.

спасибо
1 H A D G E H O G s
 
18.07.16
23:07
Никак.
2 Chameleon1980
 
18.07.16
23:11
я что-то так и подумал - сколько читал пдф как источник
3 H A D G E H O G s
 
18.07.16
23:13
(2) В ПДФ - изображения? JPG ?
4 Chameleon1980
 
18.07.16
23:39
табличку хотелось бы достать типа PDF->XLS
5 Chameleon1980
 
18.07.16
23:40
документ приходит в пдфе - загдрузить в док тч хотябы
6 Fram
 
19.07.16
00:14
(5) а договориться с поставщиком о нормальном формате или программном интерфейсе?
если есть необходиомость в автоматизации, значит объем торговли большой и зантересованность есть у обоих сторон, нет?
7 Chameleon1980
 
19.07.16
00:21
дык вот товарищу так и пишу:

"
скажи как к тебе эти файлы попадают?
если по почте - как они их формируют.
если с 1с по почте - у них есть возможность
просто в екселе (95%)
"

просто интересно стало
8 Beretta
 
19.07.16
00:21
(5) Любой каприз за ваши деньги
https://acrobat.adobe.com/ru/ru/acrobat/how-to/pdf-to-excel-xlsx-converter.html
9 HawkEye
 
19.07.16
00:23
(0) если в pdf не картинка, что мешает его отпарсить?
10 Chameleon1980
 
19.07.16
00:24
(8) берет - онлайн есть у него - автоматизация жеж (лентяям) хочется всем
11 Chameleon1980
 
19.07.16
00:24
(9) как таблицу ?
12 Chameleon1980
 
19.07.16
00:27
не. согласен. все можно правильно уложить в правильном порядке по правильным правилам :)
13 Chameleon1980
 
19.07.16
00:27
не сталкивался просто
14 Злопчинский
 
19.07.16
01:23
в свое время искал - не нашел. тот же акробат нормально сосал только простейшие плоские таблицы. а когда строка - одна, но с переносами - (_._) - чем на выставке одной и поверг в уныние адобовских манагеров-продаванов задав им вопрос пообстоятельнее...

как сейчас - хз, может лучше стало...
15 RomaH
 
naïve
19.07.16
07:46
ИмяИсходногоФайла = ПолучитьИмяВременногоФайла("pdf");
    
    ДД.Записать(ИмяИсходногоФайла);
    
    Скрипт = Новый COMОбъект("WScript.Shell");
    
    ИмяТекстовогоФайла = ПолучитьИмяВременногоФайла("txt");
    
    ИмяКаталогаУтилит = """C:\Program Files (x86)\PDFtk Server\bin\";
    
    ТекстКоманды = ИмяКаталогаУтилит + "pdftotext.exe"" -layout -enc UTF-8 " + ИмяИсходногоФайла + " " + ИмяТекстовогоФайла;
    ТекстКоманды = ИмяКаталогаУтилит + "pdftotext.exe"" -layout -table -enc UTF-8 " + ИмяИсходногоФайла + " " + ИмяТекстовогоФайла;
    
    Скрипт.Run(ТекстКоманды, 0, 1);
    
    ТекстовыйДокумент = Новый ТекстовыйДокумент;
    ТекстовыйДокумент.Прочитать(ИмяТекстовогоФайла,КодировкаТекста.UTF8);
    
    Текст = ТекстовыйДокумент.ПолучитьТекст();

    УдалитьФайлы(ИмяИсходногоФайла);
    УдалитьФайлы(ИмяТекстовогоФайла);
    
    //"Имя :(.+)СП №" поиск имени пациента
    RegExp = Новый COMОбъект("VBScript.RegExp");
    RegExp.IgnoreCase = Истина;
    RegExp.MultiLine = Истина; // истина — текст многострочный, ложь — одна строка
    
    RegExp.Global = Истина;
    
    RegExp.pattern = "Имя :(.+)СП №";
    РезультатыПоИменам = RegExp.Execute(Текст);

    RegExp.pattern = "День рождения :(.*)Возраст";
    РезультатыПоДР = RegExp.Execute(Текст);

    RegExp.pattern = "ID образца :.*?(\d+)";
    РезультатыПоИдентификатору = RegExp.Execute(Текст);
    
    RegExp.pattern = "Дата выполнения : ((\d{4})-(\d{2})-(\d{2}))";
    РезультатыПоДатам = RegExp.Execute(Текст);

как - то так