Имя: Пароль:
1C
 
Коллеги, а можно ли найти схожие значения не в справочнике Контрагентов, а в Excel?
, ,
0 Гений 1С
 
гуру
24.12.20
15:15
Ну есть список контрагентов, нужно оценить, много ли там дублей (похожих названий), там могли переименовывать. Ну нужно примерно оценить.
Какая-нибудь обработка поиска дублей умеет из Экселя брать или сперва в 1Сы прогрузить?
1 ДенисЧ
 
24.12.20
15:16
Чо?
Ты в екселе работать не умеешь?
2 Гений 1С
 
гуру
24.12.20
15:18
(1) а там есть функция поиска схожих?
3 Kassern
 
24.12.20
15:30
(2) а что для вас "схожих"? например ООО Кабан и ООО Каван это схожие? Или к примеру ООО "Ромашка" и Общество с ограниченной ответственностью Ромашка? А по ИНН/КПП разве не сверить?
4 1nvertex
 
24.12.20
16:30
(1) Сводная таблица, счетчик по количеству строк. Не пойдет?
5 1nvertex
 
24.12.20
16:30
сорри, (4) для (0)
6 mikecool
 
24.12.20
16:51
удаление дублей в эксель есть, гений - с тебя 1500
7 ДядяМитяй
 
24.12.20
17:10
(6) дублей или "похожих названий"? читайте ТЗ)))
Можно запросом обойти и через ПОДОБНО со всякими шаблонами сравнивать таблицу саму с собой
8 ДядяМитяй
 
24.12.20
17:14
(7) Только в любом случае ООО Ромашка и ИП Ромашко О.О. будут путаться...
9 vvspb
 
24.12.20
17:16
(7) ПОДОБНО/// "содержит/не содержет"?
(8) это единичные случаи
Сколько всего контрагентов?
10 BeerHelpsMeWin
 
24.12.20
17:18
В таком случае можно узнать, например, про существование функции СЧЁТЕСЛИ.
11 Kassern
 
24.12.20
17:22
(8) Это еще меньшее из зол, взять какой-нибудь ООО Лидер, только в свердловской области их более 20 организаций с абсолютно одинаковым наименованием. Не зная ИНН/КПП я бы даже не взялся схлопывать контрагентов, много гемора можно словить в дальнейшем
12 МихаилМ
 
24.12.20
17:22
для эксель был плагин нечеткого сравнения строк.
13 Базис
 
naïve
24.12.20
17:24
Сперва нормализация - "Общество с ограниченной ответственностью" в ООО и подобные.
Потом расстояние Левенштейна - число элементарных перестановок для превращения одной строки в другую. Да, это имеет высокую вычислительную сложность, наверное как куб от количества. https://ru.wikipedia.org/wiki/Расстояние_Левенштейна
14 Kassern
 
24.12.20
17:31
(0) можно еще вот таким макаром на питоне. Передаешь 2 строки s1 и s2 на выходе функция тебе возвращает процент схожести:
import difflib

def similarity(s1, s2):
  normalized1 = s1.lower()
  normalized2 = s2.lower()
  matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
  return matcher.ratio()
15 Garykom
 
гуру
24.12.20
17:52
(0) используй метод триграмм
16 Гений 1С
 
гуру
24.12.20
19:41
да думаю проще в справочник загнать в пустую конфу и там поиском дублей по похожим наименованиям пройтись
17 hhhh
 
24.12.20
19:52
(16) вообще-то там с контактной информацией проблема. Если например 2 дубля контрагента, а в них разные адреса, или телефоны. Всё равно приходится вручную разгребать. А то потеряется нужная информация.

потом фифо и зачет авансов слетает. И в итоге неправильные проводки и бухотчетность. Из-за какого-то дубля всё пересдавать? Оно это надо? Пусть там будут лучше эти дубли, лучше их не трогать.
18 Гений 1С
 
гуру
24.12.20
19:54
(17) не, мне только понять, много ли дублей в большом списке контрагентов
19 Mort
 
24.12.20
20:01
http://catalog.mista.ru/public/635478/

Новый источник данных -> Файл на диске. Выбираешь свой эксель. "Обновить данные".

Новый источник данных -> Локальный запрос. Временные таблицы -> добавить, выбираешь страницу со своим экселем. Временные таблицы -> Получить запрос выборки - готовый запрос к данным экселя. Можно группировать, соединять с данными базы и делать что хочешь.
20 Mort
 
24.12.20
20:05
Запрос к временной таблице с первого раза может выдать ошибку. Со второго проходит. Платформа плохо поддерживает свои непопсовые возможности с каждой новой версией.
21 Гений 1С
 
гуру
24.12.20
21:59
(19) отлично, но придется ещё самому писать запрос на поиск похожих наименований, а поиск дублей это уже умеет
22 Мимохожий Однако
 
25.12.20
07:00
Если исходные данные уже лежат в Excel, то вполне достаточно типовых функций для сравнения и преобразования данных по ячейкам и строкам. Вопрос умения. Для разовой работы вполне достаточно.
23 Гений 1С
 
гуру
25.12.20
11:19
короче. загрузил в пустую конфу
24 vvspb
 
25.12.20
11:25
(23) ну и?