|
Преобразование HTML в ПостроительDOM
| ☑ |
0
Dendroid92
23.04.16
✎
11:57
|
Отправляю Get-запрос на сайт, получаю ответ в виде файла с HTML разметкой (в файл записывается все как надо с кирилицей) произвожу чтениеHTML, а уже далее считываю в ПостроительDOM. Проблема в том, что в файле есть кирилица и когда в Построителе я начинаю просматривать нужный мне тег, то он в себе хранит какие-то иероглифы, а не русский текст, может кто сталкивался и подскажет что можно сделать для нормального отображения текста?
|
|
1
Dendroid92
26.04.16
✎
14:31
|
Неужели никто не сталкивался?
|
|
2
Поpyчик-4
26.04.16
✎
14:33
|
(0) В какой кодировке сервер отдаёт ответ? Вот отсюда и пляши.
|
|
3
Serginio1
26.04.16
✎
14:40
|
|
|
4
Serginio1
26.04.16
✎
14:41
|
|
|
5
Dendroid92
26.04.16
✎
16:36
|
(2) я записываю все в файл, кодировку любую в файле могу проставить, но ПостроительDOM все коверкает в непонятную кодировку
|
|
6
Dendroid92
26.04.16
✎
16:44
|
(2) через понял, что строка зашифрована в ISO-8859-1 и перекодируется в UTF-8 нормально. (3) ИМХО слишком громоздко, код тяжело читаем, да и у меня парсинг страниц происходит нормально за исключением этой кодировки, но за ссылку спасибо, интересная
|
|
7
Serginio1
26.04.16
✎
17:07
|
(6) CSS селекторы значительно мощнее и удобнее XPath
|
|
8
Dendroid92
27.04.16
✎
10:38
|
Всем спасибо, вопрос закрыт, было найдено решение
Функция СменаКодировки(ИсхСтрока)
Стрим = Новый COMОбъект("Adodb.Stream");
Стрим.Type = 2;
Стрим.Mode= 3;
Стрим.charset="ISO-8859-1";
Стрим.Open();
Стрим.WriteText(ИсхСтрока);
Стрим.Position=0;
Стрим.charset="UTF-8";
Рез=Стрим.ReadText(-1);
Стрим.Close();
возврат Рез;
КонецФункции
|
|