|
Возможна ли замена кодировки текста? | ☑ | ||
---|---|---|---|---|
0
Garry1010
24.04.12
✎
14:20
|
Возможна ли замена кодировки текста? А именно: читаю данные HTML-файла, а там нужные данные (ЭлементHTML.ТекстовоеСодержимое) по-русски, но в кодировке UTF-8 (что очевидно). Мне их нужно хотя бы увидеть, а потом сохранить в базе. Как мне их привести в человеческую форму?
|
|||
1
andrewks
24.04.12
✎
14:23
|
"по-русски, но в кодировке UTF-8 (что очевидно)" кому очевидно? почему очевидно?
и в чём конкретно проблема? |
|||
2
Wobland
24.04.12
✎
14:25
|
(0) человеческая форма - это почерком врача?
|
|||
3
Garry1010
24.04.12
✎
14:30
|
Чего не понятно-то? Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано. Проблема в том, что вьюер исходного кода показывает так: "<th style="">Место</th>" - а в 1С'е это получается так, что свойство ТекстовоеСодержимое содержит не буквы, дающие слово "Место", а 10 знаков (в кодировке UTF-8), изображающие чёрт-те что. Мне их нужно из чёрт-те чего превратить в слово "Место", чтобы оно именно так и выглядело и чтобы после загрузки в некий текстовый реквизит в базе 1С там хранилось то, что 1С видит СРАЗУ как слово "Место"!
|
|||
4
nimoid
24.04.12
✎
14:55
|
>Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано
вроде бы кои-8 и вин-1251 обычно.. но это не суть) КодировкаИсточника у документаХТМЛ попробуй посмотри |
|||
5
Garry1010
24.04.12
✎
15:03
|
(4) А зачем смотреть? Чтобы узнать какая? - Я и так знаю; проблема не в этом.
|
|||
6
nimoid
24.04.12
✎
15:10
|
а, ну да, там рид-онли..
многа кода? кидай посмотреть, может что найдем |
|||
7
Garry1010
24.04.12
✎
15:14
|
(6) А что кидать-то, html-страницу? :)
|
|||
8
nimoid
24.04.12
✎
15:20
|
код твой парсера)
у тебя один (несколько) файл просто или с сайта надо постоянно тянуть? если файл, можно просто конвертнуть в другую кодировку и не заморачиваться |
|||
9
Garry1010
24.04.12
✎
15:43
|
>файл, можно просто конвертнуть в другую кодировку и не заморачиваться
Хммм, это мысль! Да, у меня просто файл - мне так проще. Надеюсь, объекты типа ЭлементHTML не будут сверять реальную кодировку и ту, что в их заголовке. |
|||
10
nimoid
24.04.12
✎
15:52
|
ну ты после конвертации на всякий открой и поправь вот эту строчку
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> на <meta http-equiv="Content-Type" content="text/html; charset=windows-1251"> как-то так.. вообще странная фигня, почему кодировку не понимает.. |
|||
11
Garry1010
27.04.12
✎
10:47
|
Короче, 1С сама в непонятках - пришлось писать свою функцию перекодировки.
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |