|
v7: Нужна утилита по нечеткому сравнению строк | ☑ | ||
---|---|---|---|---|
0
Volodja
07.03.19
✎
20:40
|
StrMath.dll
StrMath.als Кому не жалко поделитесь, пожалуйста |
|||
1
Ёпрст
07.03.19
✎
20:42
|
(0) валяется где-то.. но проще like задействовать
|
|||
2
Volodja
07.03.19
✎
20:43
|
Она (ВК) по фонетике работает. like не пойдет
|
|||
3
Volodja
07.03.19
✎
20:44
|
была она уменя. Удалил когда-то. Сейчас понадобилась
|
|||
4
Volodja
07.03.19
✎
20:45
|
like не определит что Джон и Jhon похожи. А эта определит
|
|||
5
Volodja
07.03.19
✎
20:46
|
Поделись, если есть. Пожалуйста
|
|||
6
Aleksey
07.03.19
✎
20:51
|
Оно? https://github.com/5k0rp/StrMatch
(хз что это в яндексе нашел) |
|||
7
Ёпрст
07.03.19
✎
20:51
|
||||
8
Ёпрст
07.03.19
✎
20:52
|
als-ки тока нет, можно сгенерить, в опенконфе есть скрипты для этого
|
|||
9
Ёпрст
07.03.19
✎
20:52
|
да и примеры где-то валялись, на нимфостарте поищи там точно было когда-то
|
|||
10
Aleksey
07.03.19
✎
20:53
|
||||
11
Ёпрст
07.03.19
✎
20:54
|
||||
12
Volodja
07.03.19
✎
21:00
|
по ссылкам стартмани требует.
За DLL спасибо |
|||
13
Volodja
07.03.19
✎
21:03
|
Методы помню. есть обработка у меня под нее.
|
|||
14
Ёпрст
07.03.19
✎
21:47
|
||||
15
andrewalexk
07.03.19
✎
21:59
|
:)
все не читал StrMatch.als актуально? |
|||
16
trdm
07.03.19
✎
22:03
|
(8) > als-ки тока нет, можно сгенерить, в опенконфе есть скрипты для этого
не, intsOLEGenerator.vbs не работает на ВК. Только на com/ole объектах. |
|||
17
Ёпрст
07.03.19
✎
22:10
|
(15) врят ли, в (14) есть от автора
|
|||
18
Ёпрст
07.03.19
✎
22:11
|
(16) да ? точно.. для всяких ocx генерил, помню
|
|||
19
Garykom
гуру
07.03.19
✎
22:28
|
Как раз сейчас ваяю ВК (com и NativeAPI как x86 так и x86_64) и веб-сервис (некий комплект для любого применения) для нечеткого сравнения/поиска.
Несколько алгоритмов хочу реализовать: Расстояние Левенштейна на основе алгоритма Вагнера-Фишера Фонетические из https://habr.com/ru/post/114947/ И самое главное SimHash - эта штука реально быстра на больших объемах |
|||
20
Злопчинский
07.03.19
✎
23:30
|
(19) может имеет смысл посмотреть СтрМач упормянутый, он вроде автором выложен код. Хорошая штука, я на многих проектах юзал, успешно.
|
|||
21
Garykom
гуру
07.03.19
✎
23:42
|
(20) Отличная штука и давно использую.
Но есть некоторые недостатки в текущее время. Например требует https://github.com/5k0rp/StrMatch/tree/master/runtime для работы. Нет версии x64 и нет версии NativeAPI как и версии под linux c android. Ну и для многих задач его модификация Metaphone (со своей адаптацией для кириллицы) очень плохо подходит. Оно сделано для сравнения наименований номенклатуры, поэтому например на сравнении ФИО хреново работает, очень высокий % совпадений выдает когда Имя+Отчество те же самые а Фамилия совсем другая только окончание похоже. |
|||
22
Garykom
гуру
07.03.19
✎
23:42
|
(21)+ Ну и для бигдата не подходит, слишком медленно.
Когда надо среди сотен тысяч и даже миллионов строк искать/подбирать похожие. |
|||
23
Djelf
08.03.19
✎
06:55
|
(21) Версия без рунтаймов и регистрацию в реестре (переделал на движок Орефкова) https://cloud.mail.ru/public/9oTU/jU7SiXf5g
Там код то простенький, к чему угодно прилепить можно. |
|||
24
Злопчинский
08.03.19
✎
10:35
|
(21) очень высокий % совпадений выдает когда Имя+Отчество те же самые а Фамилия совсем другая только окончание похоже.
- а как должно быть? типа если похоже то выдавать непохоже? :-) . то что медленное - это да... у меня много времени подготовка кеша занимает |
|||
25
Garykom
гуру
08.03.19
✎
16:46
|
(24) Да расстояние Левенштейна в этом случае лучше работает для случая множества опечатков распределенных по всему ФИО.
Еще метод N-грамм хорош. |
|||
26
botman4
28.03.19
✎
19:10
|
поискал по сусекам
https://yadi.sk/d/Xe3tsKL6gwkbEA |
|||
27
VS-1976
29.03.19
✎
08:05
|
Попробуй Sphinx https://ru.wikipedia.org/wiki/Sphinx_(поисковая_машина)
|
|||
28
vasvl123
29.03.19
✎
09:13
|
||||
29
botman4
29.03.19
✎
12:31
|
тОвар и тАвар - это не поможет найти. Бывают различные опечатки и т.п.
|
|||
30
Злопчинский
29.03.19
✎
22:19
|
(29) стрмтч уверенно скажет что "тАвар" ближе к "товар", чем "мОмар"
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |