Имя: Пароль:
1C
1С v8
ИзвлечениеТекста из docx ?
0 crazydimka
 
03.03.14
14:29
Возможно кто то знает. Что нужно сделать что бы 1Ска начала читать текст из docx формата ? т.к. получитьТекст() вылетает в исключение. Необходимо расширить iFilter, но iFilter Explorer показывает наличие docx на 64бит, а на 32бит нету. Т.е. 1С почему то берет 32битную версию  фильтра, как это изменить ?
1 Maxus43
 
03.03.14
14:33
незнаю насчет фильтров, а docx по сути архив с xml-ями внутри, можно распаковать и оттуда взять
2 Зойч
 
03.03.14
14:34
установить 32 битную версию
3 crazydimka
 
03.03.14
14:38
(2) 32 битную версию офиса ?
4 crazydimka
 
03.03.14
14:38
(1) очень интересно, а примерно как это делается ? можно подключить через ЧтениеXML  ?
5 mikeA
 
03.03.14
14:42
(0) потому что клиет 1С 32битный
(4) проще установить 32 битный фильтр
6 Maxus43
 
03.03.14
14:45
(4) в качестве задания для интереса можешь попробовать, так например делают когда надо отрыть 1с-кой файлик очень большой, порционно xml-и читают... в твоём случае конечно проще сделать правильно, чем обходить так
7 crazydimka
 
03.03.14
14:47
(5) строка для поиска в гугле
32 битный iFilter docx? или как лучше, вроде искал не нашел, или не то искал ?
8 crazydimka
 
03.03.14
14:48
(6) спасибо, а как помочь фильтру настроить docx на 32 бита не знаешь ?
9 fisher
 
03.03.14
14:55
Я вообще не в теме.
Но в БСП для полнотекстового поиска вроде происходит извлечение текста из присоединенных файлов (чтобы по ним тоже искалось). Можно там подсмотреть.
10 crazydimka
 
03.03.14
15:50
(9) почти. там есть чтение XML опен офиса, но закинув формат docx в константы, валится при чтении XML ... не при разборе XML а именно при инициализации файла docx, так что Чтением XML его не возмешь (. Есть еще какие то идеи ?
11 crazydimka
 
03.03.14
16:07
ох, придется писать ручками Чтение XML...
12 Torquader
 
03.03.14
18:29
А ADO в 32-бита тоже что-ли "не сыграло" ?
13 crazydimka
 
03.03.14
19:10
(12) мне кажется медленнее и ненадежно. Или не ?
14 Torquader
 
03.03.14
22:03
(13) Быстрее, чем по OLE, читает да - не всё, но читает же.
Потом, не требует установки office.
Конечно, можно и OpenOffice поставить, если любители потр.хаться.
15 ЗлобнийМальчик
 
03.03.14
22:44
(0)я бы эту задачку вынес во внешнюю компоненту.
16 Torquader
 
03.03.14
23:11
(15) Вообще-то, как только появятся нормальные внешние источники данных, и к ним можно будет ADO "присобачить", то вообще ничего сложного не будет.
Вопрос, "съест" ли внешний источник через ADO файл или "подавится".
17 crazydimka
 
03.04.14
15:39
В итоге использую внешнюю компоненту для извлечения.