Имя: Пароль:
1C
1C 7.7
v7: Нужна утилита по нечеткому сравнению строк
,
0 Volodja
 
07.03.19
20:40
StrMath.dll
StrMath.als
Кому не жалко поделитесь, пожалуйста
1 Ёпрст
 
07.03.19
20:42
(0) валяется где-то.. но проще like задействовать
2 Volodja
 
07.03.19
20:43
Она (ВК) по фонетике работает. like не пойдет
3 Volodja
 
07.03.19
20:44
была она уменя. Удалил когда-то.  Сейчас понадобилась
4 Volodja
 
07.03.19
20:45
like не определит что Джон и Jhon похожи. А эта определит
5 Volodja
 
07.03.19
20:46
Поделись, если есть. Пожалуйста
6 Aleksey
 
07.03.19
20:51
Оно? https://github.com/5k0rp/StrMatch
(хз что это в яндексе нашел)
7 Ёпрст
 
07.03.19
20:51
8 Ёпрст
 
07.03.19
20:52
als-ки тока нет, можно сгенерить, в опенконфе есть скрипты для этого
9 Ёпрст
 
07.03.19
20:52
да и примеры где-то валялись, на нимфостарте поищи там точно было когда-то
10 Aleksey
 
07.03.19
20:53
11 Ёпрст
 
07.03.19
20:54
12 Volodja
 
07.03.19
21:00
по ссылкам стартмани требует.
За DLL спасибо
13 Volodja
 
07.03.19
21:03
Методы помню. есть обработка у меня под нее.
14 Ёпрст
 
07.03.19
21:47
15 andrewalexk
 
07.03.19
21:59
:)
все не читал
StrMatch.als актуально?
16 trdm
 
07.03.19
22:03
(8) > als-ки тока нет, можно сгенерить, в опенконфе есть скрипты для этого

не, intsOLEGenerator.vbs не работает на ВК. Только на com/ole объектах.
17 Ёпрст
 
07.03.19
22:10
(15) врят ли, в (14) есть от автора
18 Ёпрст
 
07.03.19
22:11
(16) да ? точно.. для всяких ocx генерил, помню
19 Garykom
 
гуру
07.03.19
22:28
Как раз сейчас ваяю ВК (com и NativeAPI как x86 так и x86_64) и веб-сервис (некий комплект для любого применения) для нечеткого сравнения/поиска.

Несколько алгоритмов хочу реализовать:
Расстояние Левенштейна на основе алгоритма Вагнера-Фишера
Фонетические из https://habr.com/ru/post/114947/
И самое главное SimHash - эта штука реально быстра на больших объемах
20 Злопчинский
 
07.03.19
23:30
(19) может имеет смысл посмотреть СтрМач упормянутый, он вроде автором выложен код. Хорошая штука, я на многих проектах юзал, успешно.
21 Garykom
 
гуру
07.03.19
23:42
(20) Отличная штука и давно использую.
Но есть некоторые недостатки в текущее время.

Например требует https://github.com/5k0rp/StrMatch/tree/master/runtime для работы.
Нет версии x64 и нет версии NativeAPI как и версии под linux c android.

Ну и для многих задач его модификация Metaphone (со своей адаптацией для кириллицы) очень плохо подходит.
Оно сделано для сравнения наименований номенклатуры, поэтому например на сравнении ФИО хреново работает, очень высокий % совпадений выдает когда Имя+Отчество те же самые а Фамилия совсем другая только окончание похоже.
22 Garykom
 
гуру
07.03.19
23:42
(21)+ Ну и для бигдата не подходит, слишком медленно.
Когда надо среди сотен тысяч и даже миллионов строк искать/подбирать похожие.
23 Djelf
 
08.03.19
06:55
(21) Версия без рунтаймов и регистрацию в реестре (переделал на движок Орефкова) https://cloud.mail.ru/public/9oTU/jU7SiXf5g
Там код то простенький, к чему угодно прилепить можно.
24 Злопчинский
 
08.03.19
10:35
(21) очень высокий % совпадений выдает когда Имя+Отчество те же самые а Фамилия совсем другая только окончание похоже.
- а как должно быть?
типа если похоже то выдавать непохоже? :-)
.
то что медленное - это да... у меня много времени подготовка кеша занимает
25 Garykom
 
гуру
08.03.19
16:46
(24) Да расстояние Левенштейна в этом случае лучше работает для случая множества опечатков распределенных по всему ФИО.
Еще метод N-грамм хорош.
26 botman4
 
28.03.19
19:10
поискал по сусекам
https://yadi.sk/d/Xe3tsKL6gwkbEA
27 VS-1976
 
29.03.19
08:05
28 vasvl123
 
29.03.19
09:13
29 botman4
 
29.03.19
12:31
тОвар и тАвар - это не поможет найти. Бывают различные опечатки и т.п.
30 Злопчинский
 
29.03.19
22:19
(29) стрмтч уверенно скажет что "тАвар" ближе к "товар", чем "мОмар"