Имя: Пароль:
IT
 
Как преобразовать PDF в PDF с возможностью поиска программно?
0 le_
 
04.08.11
14:15
ABBYY PDF Transformer есть возможность преобразовать PDF в PDF с возможностью поиска, выделения текста и т.п.
Такая же возможность есть в Adobe Acrobat, подозреваю, что в Fine Reader и других подобных программах, умеющих распознавать текст.

Посоветуйте что-нибудь, что можно было бы использовать посредством OLE или командной строки.
Нужно преобразовать сохраненный на диске PDF в PDF с возможностью поиска (Searchable PDF).
1 el-gamberro
 
04.08.11
14:19
А зачем нужен поиск?

В MS SQL реализован полнотекстовый поиск, в том числе и пдф. Подойдет?:)
2 Ёпрст
 
04.08.11
14:20
(0) pdftransformer умеет.
3 Ёпрст
 
04.08.11
14:21
чорт.. сам сабж не прочитал.
4 aka AMIGO
 
04.08.11
14:21
Fine Reader готовит в PDF, но с поиском или нет - не знаю
5 le_
 
04.08.11
14:43
(1) Конфа "1С: Документооборот". В справочнике файлов множество документов в различных форматах, в том числе в PDF. Для работы пользователям нужно, чтобы во всех файлах, с которыми они работают, была возможность выделения текста, копирования его и поиска.
Во первых, нужно перелопатить все то, что там уже есть, а далее, перед добавлением PDF-ки в базу его нужно будет описанным образом изменять. Исключить добавление в базу таких PDF-ок нереально.

Вот и нужна какая-нибудь штуковина с COM-интерфейсом или с поддержкой командной строки...
6 Живой Ископаемый
 
04.08.11
14:46
то есть нужно из ПДФ без текстового слоя, только с графическоим получить путем распознования ПДФ с текстовым слоем?

я вроде находил только проги командной строки которые могли из ПДФ с уже текстовым слоем вытаскивать сам текст в другой формат - txt или doc или rtf
7 GenV
 
04.08.11
14:48
(5) Насколько знаю там сделано извлечение текста для таких случаев. И полнотекстовый поиск по извлеченному тексту.
8 GenV
 
04.08.11
15:53
7+ проверил - извлекает.
9 le_
 
04.08.11
17:14
(7) Мне нужно изменить файл. Чтобы они могли открыть его, найти нужный текст, выделить его мышкой, скопировать и вставить в другой файл (как текст).
10 Господин ПЖ
 
04.08.11
17:16
>Такая же возможность есть в Adobe Acrobat

ну и проблема тогда в чем? открыл в акробате, пересохранил
11 le_
 
04.08.11
17:21
(10) Хотелось бы автоматически это делать. Сохранять файл из базы, открывать его в Acrobat, распознавать, сохранять и засовывать обратно в базу вручную  - не оч. удобно...
Независимо от того, куда вы едете — это в гору и против ветра!