Имя: Пароль:
1C
 
Быстро ХМЛ-и сравнить. Как?
0 bolobol
 
06.06.18
12:06
День добрый!

Как быстро сравнить пару ХМЛ-ей по 80 МБ ?
Известно что в эих ХМЛ-ях одни и те же объекты записаны, может различаться в них порядок строк, записей, наборов записей, но суть одна.

Есть мысль - свернуть по количеству символов и сравнить результат.

Два вопроса: Взлетит? Как это взлетать?
1 piter3
 
06.06.18
12:07
total commander
2 Cool_Profi
 
06.06.18
12:07
3 Buster007
 
06.06.18
12:08
а результатом сравнения что должно быть?
4 Базис
 
naïve
06.06.18
12:10
Не взлетит, только выгрузить в excel, отсортировать и тогда уже сравнивать.
5 RomaH
 
naïve
06.06.18
12:12
(0) быстро не нашел способа
только одинаковая сортировка
т.е. оба надо в какой-нибудь студии отсортировать и сохранить еще раз
потом сравнивать
6 b_ru
 
06.06.18
12:13
>>Есть мысль - свернуть по количеству символов и сравнить результат.

Дата=12.05.2018 и Дата=21.05.2018 свернутся одинаково, но смысл будут иметь разный.

Нужно парсить, строить дерево, каким-то образом сортировать узлы и сравнивать.
7 bolobol
 
06.06.18
12:17
(6) Отлично!, спасибо! Учтём.
8 Базис
 
naïve
06.06.18
12:17
Если быстро на полное совпадение, то контрольную сумму средствами ОС или fc/b filename1 filename2 >> (путь к темпу)log.txt и смотреть размер этого лога.
9 bolobol
 
06.06.18
12:24
(2) Пример кода скачать можно, а ссылка на саму программулину там есть? Не нашёл.
10 bolobol
 
06.06.18
12:25
(8) Быстрое полное совпадение - это "="
Зачем ещё контрольная сумма?
11 Вафель
 
06.06.18
12:25
нужен просто результат равно/не равно или еще и где не равно?
12 Адинэснег
 
06.06.18
12:33
я в notepad++ юзаю плагин Compare
Alt+D
13 RomaH
 
naïve
06.06.18
12:33
(11) нужно где не равно
вот тут, например:

https://www.dropbox.com/s/3hycwc98dp4nhmk/2018-06-06_12h32_35.png?dl=0

каждый раз выкладывают НСИ с новой сортировкой
14 RomaH
 
naïve
06.06.18
12:36
(2) боюсь оно 80 метров не сожрет
15 craxx
 
06.06.18
12:44
(0)MD5-хэш вычислить. Самое быстрое
16 bolobol
 
06.06.18
13:14
(15) Хеш не сможет определить идентичность. Только точное сравнение +/- на погрешности хеша, что вообще не походит.
17 bolobol
 
06.06.18
13:16
По-ходу, не буду лениться, по тега роу, филтер, рекорд пройдусь заменой - в остатке - либо сложится, либо нет.
18 bolobol
 
06.06.18
13:16
(12) (13) Здесь не понял, чем оно в 1С сможет помочь?
Основная теорема систематики: Новые системы плодят новые проблемы.