|
Есть два набора слов. Как определить об одном и том же это или нет? , catzilla codzilkin, RoRu, Franchiser, tan76, mszsuz, FirstLineSupport, Кирпич, AlexYurg, probably, Ватт, sdf, Garykom, rudnitskij, AlvlSpb, mmg, Олдж, Kabz, Злопчинский, wHammer, PR, Доминошник, Ногаминебить, who respawn, PuhUfa
| ☑ | ||
---|---|---|---|---|
0
catzilla codzilkin
28.03.25
✎
04:04
|
Наборы слов... ООО "Ромашка" и Ромашка (общество с ограниченноей ответственностью)... допустим...
Как называется по умному такая штука (задача)? И есть ли реализация её в 1С? Может где зарыто в конфигурации... |
|||
1
H A D G E H O G s
28.03.25
✎
05:37
|
АнализДанных с типом ПоискАссоциаций
|
|||
2
Злоп
28.03.25
✎
08:44
|
Ну, для простой задачи с наименованиями фирм можно и не привлекать тяжелую артиллерию.
Сначала делаем нормализацию названий. Всякие Общество с ограниченной... Заменяем на ООО Индивидуальный предприниматель на Ип итд (по словарю) Убираем спецсимволы, сокращения ставим в конец. Получаем типа Маяк ТД ООО И потом сравниваем |
|||
3
Злоп
28.03.25
✎
08:45
|
Делал такую хрень как-то давно. Нормально себе работало.
|
|||
4
Злопчинский
28.03.25
✎
08:49
|
Дальше есть куча вариантов нечеткого поиска
https://infostart.ru/1c/tools/14255/ (вк работает и под 8кой), далее метод триграмм и прочие реализации - на ИС их лежит около десятка разных |
|||
5
H A D G E H O G s
28.03.25
✎
08:59
|
Злопчинского и там и тут показывают.
|
|||
6
Злопчинский
28.03.25
✎
09:02
|
(5) на десктопе проще ;-)
На смартфоне где открытая страница - там и пишу, а залогинен под разными. Как вижу результат сам удивляюсь. |
|||
7
maxab72
28.03.25
✎
09:05
|
(5) вот когда они еще между собой спорить начнут...
|
|||
8
uno-group
28.03.25
✎
09:36
|
(4) С нечетким поиском все не так гладко. Много фирм после н лет работы открывают новое юр лицо стараясь максимально сохранить старое название для узнаваемости.
Так и появляются ООО "Рога и копыта" ООО "Рога и копыта и КО" ООО ТД "Рога и копыта" ООО "Копыта и рога" А если это вообще произвольный текст, то классическая фраза Казнить нельзя помиловать в зависимости от запятой это об одном и том же или о разном. |
|||
9
uno-group
28.03.25
✎
09:38
|
У Фирм обычно заполнены еще какие то реквизиты которые позволяют идентифицировать дубли лучше чем нечеткое сравнение названия.
|
|||
10
catzilla codzilkin
03.04.25
✎
06:53
|
(9)
В реале задача про автозапчасти... товар в Бозоне Крыло Mazda Demio DE3AS 2007 перед. лев. (б/у) а в базе 1С крыло на MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / Никаких артикулов или кодов из 1С в Бозоне не хранится. Продать продали, а отчитаться проблема. А система налогообложения УСН доходы минус расходы у клиента. Самый мерзопакостный вариант. Нужна себестоимость по каждому товару и оплата чтобы вошло в КУДиР либо в базе бухгалтерии либо в торговой. Может кто сталкивался с подобным? Как решили? По нечеткому поиску мы нашли пост мистовский Нечеткий поиск в 1с 8.3 FuzzySearch - параметры??ysclid=m8z6gxscp4880291889 Компонента встроена в общий макет в конфигурацию. Ссылка на Инфостарт https://infostart.ru/1c/tools/237186/ |
|||
11
catzilla codzilkin
03.04.25
✎
06:56
|
Уже во второй раз сталкиваюсь что УСН 15% не всегда выгоднее УСН 6%, если приплюсовать расходы на формирование КУДиР... а они будут
|
|||
12
Eiffil123
03.04.25
✎
08:12
|
(0) нужен квантовый компьютер от майкрософт
|
|||
13
АгентБезопасной Нацио
03.04.25
✎
08:42
|
(10) а в чем проблема-то? разбиваешь на токены, считаешь корреляцию. Если максимальные коэффициенты корреляции различаются мало, то предлагаешь человеку на коррекцию - выбор из этих вариантов.
|
|||
14
Кирпич
03.04.25
✎
08:44
|
(10) если есть возможность сравнить дату продажи, цену и количество продажи, то можно отсеять по этим параметрам, а потом текст сопоставлять. На примере, так то, найти похожие наименования довольно просто. Тупо разделить по словам и искать слова в наименовании. Ну и составить словарик типовых синонимов Левое:Лев Правое:Прав и т.д
|
|||
15
mmg
03.04.25
✎
08:51
|
(0) По умному - эмбеддинг. По простому вектор. Точка в многомерном, например 512, пространстве. Лежит в основе всех этих чудес с ИИ.
Вот здесь реализовано в 1С https://infostart.ru/1c/tools/2059795/ |
|||
16
АгентБезопасной Нацио
03.04.25
✎
08:54
|
(14) ну, это лучший вариант - составить таблицы класификаторов. но потом все равно корреляцией
|
|||
17
uno-group
03.04.25
✎
10:22
|
По авто запчастям стремно там бывает на одну букву отличие и запчасть фиг станет. Нужно заводить поле и хранить в нем второе наименование. Провести первоначальное сопоставление и исключение того, что точно совпадает, а по остальному оператору давать список возможных вариантов и пусть человек решает это одно и тоже или нет.
|
|||
18
АгентБезопасной Нацио
03.04.25
✎
10:24
|
(17) да ему-то всего-навсего нужно определить "что продали".
|
|||
19
uno-group
03.04.25
✎
10:28
|
ХЗ сколько у него в базе товаров вполне может быть 3 крыла
MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / Б/У MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / рестайл. |
|||
20
АгентБезопасной Нацио
03.04.25
✎
10:30
|
(19) может. поэтому у таких товаров коэффициенты корреляции будут очень близкими. поэтому (13)
|
|||
21
uno-group
03.04.25
✎
10:37
|
а если это какие нибуть тормозные колодки то там вообще до 10 производителей может быть на одну и туже модель.
А есть еще и подделки которые народ выдает за оригинал. Там наименование может отличаться какой ни будь точкой, черточкой кавычкой и т.п. которые как не значищие при поиске тупо откинули. |
|||
22
uno-group
03.04.25
✎
10:36
|
В общем нужно въезжать в тему и разбираться по месту в большинстве случаев чисто программно это не решается.
|
|||
23
Garykom
гуру
03.04.25
✎
11:18
|
(10) когда то давно пытался решить подобную задачу
Алгоритм нахождения подстрок в строке не взлетело, оператор нужен один фиг я пытался автоматизировать процесс на основе некоего обучения чтобы оператор делал для разных образцов, а дальше ИИ сам фигачил |
|||
24
Irbis
03.04.25
✎
11:28
|
Мне бородатый анекдот на эту тему вспомнился, когда за надпись "Пива нет" разнесли ларёк и набили морду пивнику. Как будто нельзя было по-человечески написать "Нет пива"
|
|||
25
АгентБезопасной Нацио
03.04.25
✎
11:39
|
(24) piva.net ?
|
|||
26
mmg
03.04.25
✎
11:47
|
(23) Так обучили уже. Бери и пользуйся
|
|||
27
mmg
03.04.25
✎
16:14
|
(22) Не вводите людей в заблуждение. Сейчас практически во всех случаях "чисто программно решается"
|
|||
28
Кирпич
03.04.25
✎
21:26
|
(27) Нифига это чисто программно не решается. Проверять за компьютером всё равно человеку.
|
|||
29
Кирпич
03.04.25
✎
21:30
|
(23) Чота ты перемудрил с ИИ. В ювелирке всё более менее понятно. Набор проб фиксированный. Для золота и серебра. Драгоценные вставки тоже несколько штук. Нафига там нужен ИИ?
|
|||
30
Garykom
гуру
03.04.25
✎
22:35
|
(29) вариантов только как пробу поставщик обозначит несколько десятков
может написать 585, au585, 585(au), золото 585 и т.д. и да может быть биметалл и напишут нечто вроде 585/875 - сам догадывайся чего еще и в сочетании с весом, хз в каком порядке и без указания "гр." вставки тоже "стандартов" хз сколько для камней (вид, размер, чистота, цвет и т.д.) даже вид изделия умудряются некоторые "к-о" написать вместо "кольцо" и размер через запятую от веса без гр. - что вес а что размер? ", 23, 2.3," - ну да логично что кольцо 23-го размера и вес 2.3 грамма - но как это в коде написать? |
|||
31
mmg
03.04.25
✎
22:37
|
(28) За человеками тоже человеки проверяют. И что ты хотел этим сказать? Что нужно проверять в принципе? Ну да, нужно. Кто спорит. Но, кстати, за ИИ может другой ИИ проверять
|
|||
32
Кирпич
03.04.25
✎
23:12
|
(30) ну если в тексте есть 585, то это уже золото 585 пробы и уже не важно, как оно написано 585au или 585(AU)
А в коде так и писать. Сначала найти пробу по словарику стандартных проб. Потом размер так же найти. |
|||
33
Кирпич
03.04.25
✎
23:13
|
(31) ну так если человек проверяет, то это уже не "чисто программно решается"
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |