Имя: Пароль:
1C
1С v8
Возможна ли замена кодировки текста?
,
0 Garry1010
 
24.04.12
14:20
Возможна ли замена кодировки текста? А именно: читаю данные HTML-файла, а там нужные данные (ЭлементHTML.ТекстовоеСодержимое) по-русски, но в кодировке UTF-8 (что очевидно). Мне их нужно хотя бы увидеть, а потом сохранить в базе. Как мне их привести в человеческую форму?
1 andrewks
 
24.04.12
14:23
"по-русски, но в кодировке UTF-8 (что очевидно)"  кому очевидно? почему очевидно?

и в чём конкретно проблема?
2 Wobland
 
24.04.12
14:25
(0) человеческая форма - это почерком врача?
3 Garry1010
 
24.04.12
14:30
Чего не понятно-то? Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано. Проблема в том, что вьюер исходного кода показывает так: "<th style="">Место</th>" - а в 1С'е это получается так, что свойство ТекстовоеСодержимое содержит не буквы, дающие слово "Место", а 10 знаков (в кодировке UTF-8), изображающие чёрт-те что. Мне их нужно из чёрт-те чего превратить в слово "Место", чтобы оно именно так и выглядело и чтобы после загрузки в некий текстовый реквизит в базе 1С там хранилось то, что 1С видит СРАЗУ как слово "Место"!
4 nimoid
 
24.04.12
14:55
>Потому что обычно html-страницы имеют кодировку UTF-8 - там у них даже в заголовке так прописано

вроде бы кои-8 и вин-1251 обычно.. но это не суть)

КодировкаИсточника у документаХТМЛ попробуй посмотри
5 Garry1010
 
24.04.12
15:03
(4) А зачем смотреть? Чтобы узнать какая? - Я и так знаю; проблема не в этом.
6 nimoid
 
24.04.12
15:10
а, ну да, там рид-онли..
многа кода? кидай посмотреть, может что найдем
7 Garry1010
 
24.04.12
15:14
(6) А что кидать-то, html-страницу? :)
8 nimoid
 
24.04.12
15:20
код твой парсера)
у тебя один (несколько) файл просто или с сайта надо постоянно тянуть?
если файл, можно просто конвертнуть в другую кодировку и не заморачиваться
9 Garry1010
 
24.04.12
15:43
>файл, можно просто конвертнуть в другую кодировку и не заморачиваться
Хммм, это мысль! Да, у меня просто файл - мне так проще. Надеюсь, объекты типа ЭлементHTML не будут сверять реальную кодировку и ту, что в их заголовке.
10 nimoid
 
24.04.12
15:52
ну ты после конвертации на всякий открой и поправь вот эту строчку

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
на
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

как-то так..

вообще странная фигня, почему кодировку не понимает..
11 Garry1010
 
27.04.12
10:47
Короче, 1С сама в непонятках - пришлось писать свою функцию перекодировки.