Имя: Пароль:
1C
1С v8
Есть два набора слов. Как определить об одном и том же это или нет?
0 catzilla codzilkin
 
28.03.25
04:04
Наборы слов... ООО "Ромашка" и Ромашка (общество с ограниченноей ответственностью)... допустим...

Как называется по умному такая штука (задача)? И есть ли реализация её в 1С? Может где зарыто в конфигурации...
1 H A D G E H O G s
 
28.03.25
05:37
АнализДанных с типом ПоискАссоциаций
2 Злоп
 
28.03.25
08:44
Ну, для простой задачи с наименованиями фирм можно и не привлекать тяжелую артиллерию.
Сначала делаем нормализацию названий. Всякие
Общество с ограниченной... Заменяем на ООО
Индивидуальный предприниматель на Ип итд (по словарю) Убираем спецсимволы, сокращения ставим в конец.
Получаем типа
Маяк ТД ООО
И потом сравниваем
3 Злоп
 
28.03.25
08:45
Делал такую хрень как-то давно. Нормально себе работало.
4 Злопчинский
 
28.03.25
08:49
Дальше есть куча вариантов нечеткого поиска
https://infostart.ru/1c/tools/14255/ (вк работает и под 8кой), далее метод триграмм и прочие реализации - на ИС их лежит около десятка разных
5 H A D G E H O G s
 
28.03.25
08:59
Злопчинского и там и тут показывают.
6 Злопчинский
 
28.03.25
09:02
(5) на десктопе проще ;-)
На смартфоне где открытая страница - там и пишу, а залогинен под разными. Как вижу результат сам удивляюсь.
7 maxab72
 
28.03.25
09:05
(5) вот когда они еще между собой спорить начнут...
8 uno-group
 
28.03.25
09:36
(4) С нечетким поиском все не так гладко. Много фирм после н лет работы открывают новое юр лицо стараясь максимально сохранить старое название для узнаваемости.
Так и появляются
ООО "Рога и копыта"
ООО "Рога и копыта и КО"
ООО ТД "Рога и копыта"
ООО "Копыта и рога"
А если это вообще произвольный текст, то классическая фраза
Казнить нельзя помиловать в зависимости от запятой это об одном и том же или о разном.
9 uno-group
 
28.03.25
09:38
У Фирм обычно заполнены еще какие то реквизиты которые позволяют идентифицировать дубли лучше чем нечеткое сравнение названия.
10 catzilla codzilkin
 
03.04.25
06:53
(9)
В реале задача про автозапчасти...

товар в Бозоне
Крыло Mazda Demio DE3AS 2007 перед. лев. (б/у)

а в базе 1С
крыло на MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS /  / Лево / Перед /

Никаких артикулов или кодов из 1С в Бозоне не хранится.
Продать продали, а отчитаться проблема. А система налогообложения УСН доходы минус расходы у клиента. Самый мерзопакостный вариант. Нужна себестоимость по каждому товару и оплата чтобы вошло в КУДиР либо в базе бухгалтерии либо в торговой.

Может кто сталкивался с подобным? Как решили?

По нечеткому поиску мы нашли пост мистовский
Нечеткий поиск в 1с 8.3 FuzzySearch - параметры??ysclid=m8z6gxscp4880291889
Компонента встроена в общий макет в конфигурацию.
Ссылка на Инфостарт
https://infostart.ru/1c/tools/237186/
11 catzilla codzilkin
 
03.04.25
06:56
Уже во второй раз сталкиваюсь что УСН 15% не всегда выгоднее УСН 6%, если приплюсовать расходы на формирование КУДиР... а они будут
12 Eiffil123
 
03.04.25
08:12
(0) нужен квантовый компьютер от майкрософт
13 АгентБезопасной Нацио
 
03.04.25
08:42
(10) а в чем проблема-то? разбиваешь на токены, считаешь корреляцию. Если максимальные коэффициенты корреляции различаются мало, то предлагаешь человеку на коррекцию - выбор из этих вариантов.
14 Кирпич
 
03.04.25
08:44
(10) если есть возможность сравнить дату продажи, цену и количество продажи, то можно отсеять по этим параметрам, а потом текст сопоставлять. На примере, так то, найти похожие наименования довольно просто. Тупо разделить по словам и искать слова в наименовании. Ну и составить словарик типовых синонимов Левое:Лев Правое:Прав и т.д
15 mmg
 
03.04.25
08:51
(0) По умному - эмбеддинг. По простому вектор. Точка в многомерном, например 512, пространстве. Лежит в основе всех этих чудес с ИИ.
Вот здесь реализовано в 1С
https://infostart.ru/1c/tools/2059795/
16 АгентБезопасной Нацио
 
03.04.25
08:54
(14) ну, это лучший вариант - составить таблицы класификаторов. но потом все равно корреляцией
17 uno-group
 
03.04.25
10:22
По авто запчастям стремно там бывает на одну букву отличие и запчасть фиг станет. Нужно заводить поле и хранить в нем второе наименование. Провести первоначальное сопоставление и исключение того, что точно совпадает, а по остальному оператору давать список возможных вариантов и пусть человек решает это одно и тоже или нет.
18 АгентБезопасной Нацио
 
03.04.25
10:24
(17) да ему-то всего-навсего нужно определить "что продали".
19 uno-group
 
03.04.25
10:28
ХЗ сколько у него в базе товаров вполне может быть 3 крыла

MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS /  / Лево / Перед /
MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS /  / Лево / Перед / Б/У
MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS /  / Лево / Перед / рестайл.
20 АгентБезопасной Нацио
 
03.04.25
10:30
(19) может. поэтому у таких товаров коэффициенты корреляции будут очень близкими. поэтому (13)
21 uno-group
 
03.04.25
10:37
а если это какие нибуть тормозные колодки то там вообще до 10 производителей может быть на одну и туже модель.
А есть еще и подделки которые народ выдает за оригинал.
Там наименование может отличаться какой ни будь точкой, черточкой кавычкой и т.п. которые как не значищие при поиске тупо откинули.
22 uno-group
 
03.04.25
10:36
В общем нужно въезжать в тему и разбираться по месту в большинстве случаев чисто программно это не решается.
23 Garykom
 
гуру
03.04.25
11:18
(10) когда то давно пытался решить подобную задачу
Алгоритм нахождения подстрок в строке
не взлетело, оператор нужен один фиг
я пытался автоматизировать процесс на основе некоего обучения
чтобы оператор делал для разных образцов, а дальше ИИ сам фигачил
24 Irbis
 
03.04.25
11:28
Мне бородатый анекдот на эту тему вспомнился, когда за надпись "Пива нет" разнесли ларёк и набили морду пивнику. Как будто нельзя было по-человечески написать "Нет пива"
25 АгентБезопасной Нацио
 
03.04.25
11:39
(24) piva.net ?
26 mmg
 
03.04.25
11:47
(23) Так обучили уже. Бери и пользуйся
27 mmg
 
03.04.25
16:14
(22) Не вводите людей в заблуждение. Сейчас практически во всех случаях "чисто программно решается"
28 Кирпич
 
03.04.25
21:26
(27) Нифига это чисто программно не решается. Проверять за компьютером всё равно человеку.
29 Кирпич
 
03.04.25
21:30
(23) Чота ты перемудрил с ИИ. В ювелирке всё более менее понятно. Набор проб фиксированный. Для золота и серебра. Драгоценные вставки тоже несколько штук. Нафига там нужен ИИ?
30 Garykom
 
гуру
03.04.25
22:35
(29) вариантов только как пробу поставщик обозначит несколько десятков
может написать 585, au585, 585(au), золото 585 и т.д.
и да может быть биметалл и напишут нечто вроде 585/875 - сам догадывайся чего
еще и в сочетании с весом, хз в каком порядке и без указания "гр."
вставки тоже "стандартов" хз сколько для камней (вид, размер, чистота, цвет и т.д.)
даже вид изделия умудряются некоторые "к-о" написать вместо "кольцо"
и размер через запятую от веса без гр. - что вес а что размер?
", 23, 2.3," - ну да логично что кольцо 23-го размера и вес 2.3 грамма - но как это в коде написать?
31 mmg
 
03.04.25
22:37
(28) За человеками тоже человеки проверяют. И что ты хотел этим сказать? Что нужно проверять в принципе? Ну да, нужно. Кто спорит. Но, кстати, за ИИ может другой ИИ проверять
32 Кирпич
 
03.04.25
23:12
(30) ну если в тексте есть 585, то это уже золото  585 пробы и уже не важно, как оно написано 585au или 585(AU)
А в коде так и писать. Сначала найти пробу по словарику стандартных проб.  Потом размер так же найти.
33 Кирпич
 
03.04.25
23:13
(31) ну так если человек проверяет, то это уже не "чисто программно решается"
Здесь можно обсудить любую тему при этом оставаясь на форуме для 1Сников, который нужен для работы. Ymryn