|
ИзвлечениеТекста из docx ? | ☑ | ||
---|---|---|---|---|
0
crazydimka
03.03.14
✎
14:29
|
Возможно кто то знает. Что нужно сделать что бы 1Ска начала читать текст из docx формата ? т.к. получитьТекст() вылетает в исключение. Необходимо расширить iFilter, но iFilter Explorer показывает наличие docx на 64бит, а на 32бит нету. Т.е. 1С почему то берет 32битную версию фильтра, как это изменить ?
|
|||
1
Maxus43
03.03.14
✎
14:33
|
незнаю насчет фильтров, а docx по сути архив с xml-ями внутри, можно распаковать и оттуда взять
|
|||
2
Зойч
03.03.14
✎
14:34
|
установить 32 битную версию
|
|||
3
crazydimka
03.03.14
✎
14:38
|
(2) 32 битную версию офиса ?
|
|||
4
crazydimka
03.03.14
✎
14:38
|
(1) очень интересно, а примерно как это делается ? можно подключить через ЧтениеXML ?
|
|||
5
mikeA
03.03.14
✎
14:42
|
(0) потому что клиет 1С 32битный
(4) проще установить 32 битный фильтр |
|||
6
Maxus43
03.03.14
✎
14:45
|
(4) в качестве задания для интереса можешь попробовать, так например делают когда надо отрыть 1с-кой файлик очень большой, порционно xml-и читают... в твоём случае конечно проще сделать правильно, чем обходить так
|
|||
7
crazydimka
03.03.14
✎
14:47
|
(5) строка для поиска в гугле
32 битный iFilter docx? или как лучше, вроде искал не нашел, или не то искал ? |
|||
8
crazydimka
03.03.14
✎
14:48
|
(6) спасибо, а как помочь фильтру настроить docx на 32 бита не знаешь ?
|
|||
9
fisher
03.03.14
✎
14:55
|
Я вообще не в теме.
Но в БСП для полнотекстового поиска вроде происходит извлечение текста из присоединенных файлов (чтобы по ним тоже искалось). Можно там подсмотреть. |
|||
10
crazydimka
03.03.14
✎
15:50
|
(9) почти. там есть чтение XML опен офиса, но закинув формат docx в константы, валится при чтении XML ... не при разборе XML а именно при инициализации файла docx, так что Чтением XML его не возмешь (. Есть еще какие то идеи ?
|
|||
11
crazydimka
03.03.14
✎
16:07
|
ох, придется писать ручками Чтение XML...
|
|||
12
Torquader
03.03.14
✎
18:29
|
А ADO в 32-бита тоже что-ли "не сыграло" ?
|
|||
13
crazydimka
03.03.14
✎
19:10
|
(12) мне кажется медленнее и ненадежно. Или не ?
|
|||
14
Torquader
03.03.14
✎
22:03
|
(13) Быстрее, чем по OLE, читает да - не всё, но читает же.
Потом, не требует установки office. Конечно, можно и OpenOffice поставить, если любители потр.хаться. |
|||
15
ЗлобнийМальчик
03.03.14
✎
22:44
|
(0)я бы эту задачку вынес во внешнюю компоненту.
|
|||
16
Torquader
03.03.14
✎
23:11
|
(15) Вообще-то, как только появятся нормальные внешние источники данных, и к ним можно будет ADO "присобачить", то вообще ничего сложного не будет.
Вопрос, "съест" ли внешний источник через ADO файл или "подавится". |
|||
17
crazydimka
03.04.14
✎
15:39
|
В итоге использую внешнюю компоненту для извлечения.
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |