|
Коллеги, а можно ли найти схожие значения не в справочнике Контрагентов, а в Excel? | ☑ | ||
---|---|---|---|---|
0
Гений 1С
гуру
24.12.20
✎
15:15
|
Ну есть список контрагентов, нужно оценить, много ли там дублей (похожих названий), там могли переименовывать. Ну нужно примерно оценить.
Какая-нибудь обработка поиска дублей умеет из Экселя брать или сперва в 1Сы прогрузить? |
|||
1
ДенисЧ
24.12.20
✎
15:16
|
Чо?
Ты в екселе работать не умеешь? |
|||
2
Гений 1С
гуру
24.12.20
✎
15:18
|
(1) а там есть функция поиска схожих?
|
|||
3
Kassern
24.12.20
✎
15:30
|
(2) а что для вас "схожих"? например ООО Кабан и ООО Каван это схожие? Или к примеру ООО "Ромашка" и Общество с ограниченной ответственностью Ромашка? А по ИНН/КПП разве не сверить?
|
|||
4
1nvertex
24.12.20
✎
16:30
|
(1) Сводная таблица, счетчик по количеству строк. Не пойдет?
|
|||
5
1nvertex
24.12.20
✎
16:30
|
сорри, (4) для (0)
|
|||
6
mikecool
24.12.20
✎
16:51
|
удаление дублей в эксель есть, гений - с тебя 1500
|
|||
7
ДядяМитяй
24.12.20
✎
17:10
|
(6) дублей или "похожих названий"? читайте ТЗ)))
Можно запросом обойти и через ПОДОБНО со всякими шаблонами сравнивать таблицу саму с собой |
|||
8
ДядяМитяй
24.12.20
✎
17:14
|
(7) Только в любом случае ООО Ромашка и ИП Ромашко О.О. будут путаться...
|
|||
9
vvspb
24.12.20
✎
17:16
|
(7) ПОДОБНО/// "содержит/не содержет"?
(8) это единичные случаи Сколько всего контрагентов? |
|||
10
BeerHelpsMeWin
24.12.20
✎
17:18
|
В таком случае можно узнать, например, про существование функции СЧЁТЕСЛИ.
|
|||
11
Kassern
24.12.20
✎
17:22
|
(8) Это еще меньшее из зол, взять какой-нибудь ООО Лидер, только в свердловской области их более 20 организаций с абсолютно одинаковым наименованием. Не зная ИНН/КПП я бы даже не взялся схлопывать контрагентов, много гемора можно словить в дальнейшем
|
|||
12
МихаилМ
24.12.20
✎
17:22
|
для эксель был плагин нечеткого сравнения строк.
|
|||
13
Базис
naïve
24.12.20
✎
17:24
|
Сперва нормализация - "Общество с ограниченной ответственностью" в ООО и подобные.
Потом расстояние Левенштейна - число элементарных перестановок для превращения одной строки в другую. Да, это имеет высокую вычислительную сложность, наверное как куб от количества. https://ru.wikipedia.org/wiki/Расстояние_Левенштейна |
|||
14
Kassern
24.12.20
✎
17:31
|
(0) можно еще вот таким макаром на питоне. Передаешь 2 строки s1 и s2 на выходе функция тебе возвращает процент схожести:
import difflib def similarity(s1, s2): normalized1 = s1.lower() normalized2 = s2.lower() matcher = difflib.SequenceMatcher(None, normalized1, normalized2) return matcher.ratio() |
|||
15
Garykom
гуру
24.12.20
✎
17:52
|
(0) используй метод триграмм
|
|||
16
Гений 1С
гуру
24.12.20
✎
19:41
|
да думаю проще в справочник загнать в пустую конфу и там поиском дублей по похожим наименованиям пройтись
|
|||
17
hhhh
24.12.20
✎
19:52
|
(16) вообще-то там с контактной информацией проблема. Если например 2 дубля контрагента, а в них разные адреса, или телефоны. Всё равно приходится вручную разгребать. А то потеряется нужная информация.
потом фифо и зачет авансов слетает. И в итоге неправильные проводки и бухотчетность. Из-за какого-то дубля всё пересдавать? Оно это надо? Пусть там будут лучше эти дубли, лучше их не трогать. |
|||
18
Гений 1С
гуру
24.12.20
✎
19:54
|
(17) не, мне только понять, много ли дублей в большом списке контрагентов
|
|||
19
Mort
24.12.20
✎
20:01
|
http://catalog.mista.ru/public/635478/
Новый источник данных -> Файл на диске. Выбираешь свой эксель. "Обновить данные". Новый источник данных -> Локальный запрос. Временные таблицы -> добавить, выбираешь страницу со своим экселем. Временные таблицы -> Получить запрос выборки - готовый запрос к данным экселя. Можно группировать, соединять с данными базы и делать что хочешь. |
|||
20
Mort
24.12.20
✎
20:05
|
Запрос к временной таблице с первого раза может выдать ошибку. Со второго проходит. Платформа плохо поддерживает свои непопсовые возможности с каждой новой версией.
|
|||
21
Гений 1С
гуру
24.12.20
✎
21:59
|
(19) отлично, но придется ещё самому писать запрос на поиск похожих наименований, а поиск дублей это уже умеет
|
|||
22
Мимохожий Однако
25.12.20
✎
07:00
|
Если исходные данные уже лежат в Excel, то вполне достаточно типовых функций для сравнения и преобразования данных по ячейкам и строкам. Вопрос умения. Для разовой работы вполне достаточно.
|
|||
23
Гений 1С
гуру
25.12.20
✎
11:19
|
короче. загрузил в пустую конфу
|
|||
24
vvspb
25.12.20
✎
11:25
|
(23) ну и?
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |