Имя: Пароль:
1C
1С v8
Доработка УТ 11. Связь "номенклатуры поставщика" и "номенклатуры".
0 Solitar
 
29.09.12
13:56
Всем привет. Нужен совет как реализовать данный механизм.

У клиента много поставщиков. Товар один и тот же, но называется у всех немного по разному. Например, у поставщика "А" товар называется "цепочка обычная", а у поставщика "Б" "цепочка обычная, золотая". Для загрузки номенклатуры была написана обработка (загружаются прайс-листы поставщиков).

Так же, у номенклатуры есть доп реквизиты которые могут немного отличаться. Например, у поставщика "А" указан размер в прайс-листе, а у поставщика "Б" нет.

В данный момент, после загрузки прайс-листов появляются дубляжи, т.к. нет точно таких же позиций в справочниках. Затем менеджер руками меняет связи в справочниках "Номенклатура поставщика". И "задвоенные" позиции кидает в определенную папку.

На данный момент у некоторых позиций есть 2-3 дубляжа в неиспользуемой папке. Количество дубляжей может расти.

Я хотел добавить анализ разделителей , например, проверка по наименованию до запятой. Но этот вариант не подходит, т.к. в некоторых названиях должны быть запятые.

В одном прайс-листе может быть >10к позиций. Нужен оптимальный алгоритм. Мб кто подскажет?
1 shuhard
 
29.09.12
13:59
(0) открой УТ 10.3/КА/УПП
Рг сведений номенклатура поставщика

уверен, что в УТ 11 есть то же самое
и что в заказе поставщику/ПТиУ есть колонка название у поставщика
2 Solitar
 
29.09.12
14:05
(1) я про это и написал. сейчас он используется, но приходится много связей руками менять. Если пользователю дать возможность перед загрузкой настраивать связи, то он повесится даже если будет 1к строчек в прайсе.
3 ProProg
 
29.09.12
14:09
4 ProProg
 
29.09.12
14:10
(0) вся проблема что ты при загрузке контроль не сделал нормальный.
5 jump if overflow
 
29.09.12
14:12
(3) реализован один из алгоритмов "нечектого поиска"?
6 ProProg
 
29.09.12
14:12
ну и они скорее всего при загрузке поуистически ставят соответствия или не выбирают до конца существующую номенклатуру.
Так что тут два сочетающихся фактора: давать пистюлей и делать по. причем По не гарантирует того что криворукие наделают.
http://subsystems.ru/upload/iblock/6dd/8.png
7 ProProg
 
29.09.12
14:13
(5) см (6) да. и регулярно его развиваю. это работа бесконечная. для определенных клиентов конкретно надо затачивать алгоритмы.
8 ProProg
 
29.09.12
14:14
сейчас вот воюю с клиентом торгующим компьюерной техникой, практически до 90 процентов довели до ума загрузку прайсов DNS (он их конкурент)
9 ProProg
 
29.09.12
14:15
неправиьно сказал - не воюю)) а дружу)
10 Solitar
 
29.09.12
14:15
(8) спасибо за показ примера, но мне нужно понять как это реализовать самому ))
11 ProProg
 
29.09.12
14:17
(10) а ну тогда успехов и многих лет работы) для того чтобы понять надо взять что то готовое. даже если на 70 процентов готовое это уже очень много чем с нуля.
12 ProProg
 
29.09.12
14:19
кстати вот запустили таки эту систему в запчастях. 300 тысяч номенклатуры, загрузка более 80 прайсов. пока что настроили порядка 15. от 10 до 80 тысяч строк в прайсах. тоже довожу до оптимизации. в принципе прайс в 10 тысяч загружается за 1 минуту. полный импорт. считывание и синхронизация.
13 Solitar
 
29.09.12
14:21
(12) прикольно.
14 Solitar
 
29.09.12
14:49
(12) реклама это хорошо, но мб подскажешь как ты смог проанализировать уже имеющиеся позиции с теми, которые загружаются?
15 ILM
 
гуру
29.09.12
15:18
(14) Долго писать. Почитайте статьи про соундекс, нечеткий поиск и алгоритмы поищите.
16 ILM
 
гуру
29.09.12
15:19
Там на слова делить, все нормировать, считать % соответствия и т.д.
17 Solitar
 
29.09.12
15:35
(16) спасибо.
нашел пару статей и немного информации по компоненте StrMatch.dll .
сколько примерно может анализироваться 10к позиций, если уже есть 20к в базе?
18 kotletka
 
29.09.12
15:44
от железа и реализации алгоритма зависит, от минуты идо бесконечного цикла
19 sttt
 
29.09.12
16:21
(6) что есть автомаксимум?
20 Solitar
 
29.09.12
17:37
все равно не получается придумать алгоритм, т.к. может позиция у одного поставщика "цепочка золотая","цепочка серебренная","цепочка на замке серебренная" а у второго "цепочка золотая, большая, крутая, лучшая" и "цепочка серебренная. И таких похожих позиций может быть очень много...
21 sttt
 
29.09.12
17:59
в прайсе разве не указывают такие характеристики? идут как цепочка золотая по разной цене или одинаковой но не характеризуются
22 Solitar
 
29.09.12
18:03
(21) все в 1 ячейке в экселе. это именно название позиции в прайсе. есть еще доп реквизиты в которых указана остальная информация.
23 sttt
 
29.09.12
18:23
(22)полагаю, что написать алгоритм сопоставления в твоем случае возможен, выше подсказку дали
Чтобы обнаруживать ошибки, программист должен иметь ум, которому доставляет удовольствие находить изъяны там, где, казалось, царят красота и совершенство. Фредерик Брукс-младший