|
v7: Преобразование текста в кодировке Юникод(UTF-8)
| ☑ |
0
prochor
27.04.13
✎
10:29
|
Имею текстовой файл, подготовленный в этом самом Юникоде.
На его основе должен создать документ.
Цифровые и типа дата реквизиты - проблем нет.
Однако, есть и текстовые реквизиты. И как преобразовать их?
Имеющиеся функции OemToAnsi() и AnsiToOem() не подходят.
Посоветуйте, помогите!
|
|
1
Тьма
27.04.13
✎
10:32
|
|
|
2
palpetrovich
27.04.13
✎
10:55
|
офф: а что, кнопку "закладка" убили? не найду что-то
|
|
3
prochor
27.04.13
✎
11:11
|
(1) возможно, я слишком туп уже, но я запускаю ту обработку, она игнорирует символьные данные.
Беру вырезку с символьным текстом, обработка её просто игнорирует.
Собственно говоря, когда я открываю этот тхт в Ворде, он мне и показывает, что кодировка Юникод utf-8. Вот откуда ноги растут.
Когда я пускаю в отладчике, то все мои нехорошие символы располагаются именно в интервале от 128 до 192, а они как раз и пропускаются
|
|
4
prochor
27.04.13
✎
11:31
|
У меня "—Џ ‚алиев Њ" а в первоисточнике "3118 ЧП Валиев М"
то есть прописные буквы идут нормально, а вот заглавные переходят в краказябры
|
|
5
Rie
27.04.13
✎
11:47
|
(0) Преобразуй в другой программе (да хотя бы в Notepad++). А 1Ске подсовывай уже вменяемый текст.
|
|
6
mikecool
27.04.13
✎
11:57
|
гуглится за пол секунды
|
|
7
Rie
27.04.13
✎
12:00
|
(6) Дык UTF-8 или Unicode?
|
|
8
Torquader
27.04.13
✎
16:55
|
(4) Судя по результату, это "кривой" utf-8, так как все символы должны преобразовываться одинаково.
Конечно, может быть, что в Unicode загнали неправильную раскладку русского языка (например 866) - она прекрасно преобразуется в Unicode или utf-8, но от этого правильной не становится.
|
|
9
prochor
29.04.13
✎
08:42
|
(1) спасибо!
Достаточно было просто отдохнуть.
Моя проблема была в том, что я брал не подлинник, а уже переваренный Блокнотом(Notepad) вариант. (В первоисточнике было 2000 строк, а я для отладки решил вырезать всего 10) Подлинник прекрасно преобразовался. Спасибо еще раз!
(7) Ворд показывал, что кодировка "Юникод utf-8", также в таблице перекодировок была и "Юникод utf-7". так что - это вопросы уже не ко мне.
|
|
Глупец, лишенный способности посмеяться над собой вместе с другими, не сможет долго выносить программирование. Фредерик Брукс-младший