Имя: Пароль:
1C
1С v8
Преобразование HTML в ПостроительDOM
0 Dendroid92
 
23.04.16
11:57
Отправляю Get-запрос на сайт, получаю ответ в виде файла с HTML разметкой (в файл записывается все как надо с кирилицей) произвожу чтениеHTML, а уже далее считываю в ПостроительDOM. Проблема в том, что в файле есть кирилица и когда в Построителе я начинаю просматривать нужный мне тег, то он в себе хранит какие-то иероглифы, а не русский текст, может кто сталкивался и подскажет что можно сделать для нормального отображения текста?
1 Dendroid92
 
26.04.16
14:31
Неужели никто не сталкивался?
2 Поpyчик-4
 
26.04.16
14:33
(0) В какой кодировке сервер отдаёт ответ? Вот отсюда и пляши.
3 Serginio1
 
26.04.16
14:40
4 Serginio1
 
26.04.16
14:41
5 Dendroid92
 
26.04.16
16:36
(2) я записываю все в файл, кодировку любую в файле могу проставить, но ПостроительDOM все коверкает в непонятную кодировку
6 Dendroid92
 
26.04.16
16:44
(2) через http://www.artlebedev.ru/tools/decoder/advanced/ понял, что строка зашифрована в ISO-8859-1 и перекодируется в UTF-8 нормально. (3) ИМХО слишком громоздко, код тяжело читаем, да и у меня парсинг страниц происходит нормально за исключением этой кодировки, но за ссылку спасибо, интересная
7 Serginio1
 
26.04.16
17:07
(6) CSS селекторы значительно мощнее и удобнее XPath
8 Dendroid92
 
27.04.16
10:38
Всем спасибо, вопрос закрыт, было найдено решение

Функция СменаКодировки(ИсхСтрока)
Стрим = Новый COMОбъект("Adodb.Stream");
Стрим.Type = 2;
Стрим.Mode= 3;
Стрим.charset="ISO-8859-1";
Стрим.Open();
Стрим.WriteText(ИсхСтрока);
Стрим.Position=0;
Стрим.charset="UTF-8";
Рез=Стрим.ReadText(-1);
Стрим.Close();
возврат Рез;
КонецФункции