|
Быстро ХМЛ-и сравнить. Как? | ☑ | ||
---|---|---|---|---|
0
bolobol
06.06.18
✎
12:06
|
День добрый!
Как быстро сравнить пару ХМЛ-ей по 80 МБ ? Известно что в эих ХМЛ-ях одни и те же объекты записаны, может различаться в них порядок строк, записей, наборов записей, но суть одна. Есть мысль - свернуть по количеству символов и сравнить результат. Два вопроса: Взлетит? Как это взлетать? |
|||
1
piter3
06.06.18
✎
12:07
|
total commander
|
|||
2
Cool_Profi
06.06.18
✎
12:07
|
||||
3
Buster007
06.06.18
✎
12:08
|
а результатом сравнения что должно быть?
|
|||
4
Базис
naïve
06.06.18
✎
12:10
|
Не взлетит, только выгрузить в excel, отсортировать и тогда уже сравнивать.
|
|||
5
RomaH
naïve
06.06.18
✎
12:12
|
(0) быстро не нашел способа
только одинаковая сортировка т.е. оба надо в какой-нибудь студии отсортировать и сохранить еще раз потом сравнивать |
|||
6
b_ru
06.06.18
✎
12:13
|
>>Есть мысль - свернуть по количеству символов и сравнить результат.
Дата=12.05.2018 и Дата=21.05.2018 свернутся одинаково, но смысл будут иметь разный. Нужно парсить, строить дерево, каким-то образом сортировать узлы и сравнивать. |
|||
7
bolobol
06.06.18
✎
12:17
|
(6) Отлично!, спасибо! Учтём.
|
|||
8
Базис
naïve
06.06.18
✎
12:17
|
Если быстро на полное совпадение, то контрольную сумму средствами ОС или fc/b filename1 filename2 >> (путь к темпу)log.txt и смотреть размер этого лога.
|
|||
9
bolobol
06.06.18
✎
12:24
|
(2) Пример кода скачать можно, а ссылка на саму программулину там есть? Не нашёл.
|
|||
10
bolobol
06.06.18
✎
12:25
|
(8) Быстрое полное совпадение - это "="
Зачем ещё контрольная сумма? |
|||
11
Вафель
06.06.18
✎
12:25
|
нужен просто результат равно/не равно или еще и где не равно?
|
|||
12
Адинэснег
06.06.18
✎
12:33
|
я в notepad++ юзаю плагин Compare
Alt+D |
|||
13
RomaH
naïve
06.06.18
✎
12:33
|
(11) нужно где не равно
вот тут, например: https://www.dropbox.com/s/3hycwc98dp4nhmk/2018-06-06_12h32_35.png?dl=0 каждый раз выкладывают НСИ с новой сортировкой |
|||
14
RomaH
naïve
06.06.18
✎
12:36
|
(2) боюсь оно 80 метров не сожрет
|
|||
15
craxx
06.06.18
✎
12:44
|
(0)MD5-хэш вычислить. Самое быстрое
|
|||
16
bolobol
06.06.18
✎
13:14
|
(15) Хеш не сможет определить идентичность. Только точное сравнение +/- на погрешности хеша, что вообще не походит.
|
|||
17
bolobol
06.06.18
✎
13:16
|
По-ходу, не буду лениться, по тега роу, филтер, рекорд пройдусь заменой - в остатке - либо сложится, либо нет.
|
|||
18
bolobol
06.06.18
✎
13:16
|
(12) (13) Здесь не понял, чем оно в 1С сможет помочь?
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |