Имя: Пароль:
1C
1С v8
Анализ данных кластеризация
0 MadHead
 
10.12.13
12:59
Требуется провести кластеризацию торговых точек. Есть матрица расстояний между точками. Хочу получить к примеру 3 равных кластера (по количеству ТТ в кластере). Кто работал с классом "анализ данных", как правильно выполнить кластеризацию?
1 acsent
 
10.12.13
13:00
(0) а в чем сложность то?
Но нет гарантии что кластеры окажутся равновеликими
2 MadHead
 
10.12.13
13:06
Для тестов использую консоль анализа данных. Передаю таблицу типа ТТ1, ТТ2, расстояние. Какие типы входных полей должны быть заданы? Все 3 поля входные? Как тогда программа поймет что есть расстояние?
3 Gantosha
 
10.12.13
13:35
матрицу расстояний ты как посчитал ? Или у тебя расстояние это мера длины ?
Потом у тебя каждая строка это случай и как программа раскидает это по классам одному богу известно, ты можешь лишь управлять приблизительно количеством классов.
Просто засунь данные в источник данных .. думаю описание случая будет по первой колонке .. хотя не факт ..дело в том что я не знаю как они делают переход к шкалам. Например свойство Т1 и Т2 никак не сравнимо и нет возможности засунуть ее в один класс. Но задача кластеризации именно уменьшать размерность, больше он не для чего не подходит.
4 MadHead
 
10.12.13
13:40
(3) можно принять что матрицу расстояний я посчитал по формуле, через gps координаты торговых точек. Это реальное расстояние между торговыми точками. По идее это самая классическая задача кластеризации.
Просто засунуть я пробовал, данные получаются не совсем адекватными
5 Gantosha
 
10.12.13
13:46
(4) расстояний между чем - у тебя там должны быть тогда парные расстояния между точками. Только умеет ли 1с работать именно с такими данными , так как там случай это не один элемент классификации.
А вообще у тебя должен получится центр тяжести, который должен быть как то между этими точками. И вообще для этого есть пакет статистика - она это делает точно быстрее, и более нагляднее.
6 MadHead
 
10.12.13
14:06
(5) у меня там расстояния между всеми точками. если торговых точек n, то массив будет иметь n*n-n (-n что бы исключить расстояния между собой)
Что за пакет статистика? Денег стоит или бесплатно?
7 Gantosha
 
10.12.13
14:17
(6) мне кажется 1с с такими данными не работает. Статистика конечно платный продукт, но для работы обычно было достаточно его скачать. А вообще мне кажется тебе проще решить задачу поиска центра тяжести для точек на круге и затем уже раскидать по классам. Кстати .. с какой целью ты их группируешь ?
8 MadHead
 
10.12.13
14:30
(7) Это нужно для автоматизации построения маршрутов доставки. Выделяются сектора доставки и к ним привязываются водители. Что бы водителей ездили по одним и тем же точкам. Я то могу запилить любой из алгоритмов кластеризации, но надеялся, что можно выкрутится стандартными да и работать они должны побыстрее самописных.
9 Михаил Козлов
 
10.12.13
15:30
Боюсь, что так рассчитанные маршруты могут вызывать недоумение у водителей: уж слишком упрощенная модель для построения маршрутов.
10 MadHead
 
10.12.13
15:53
(9) это не модель построения маршрутов, маршруты строятся на основании генетического алгоритма. Это всего лишь способ закрепить водителя за районом.
11 MadHead
 
10.12.13
15:55
мне нужно тиражировать решение на 20 баз. Так вот процесс создание так называемых секторов доставки вручную занимает много времени у логистов
12 Gantosha
 
10.12.13
16:00
(11) так тогда вы как бы правильно идете .. возьмите просто магазины и расстояние до вашего склада и прогоните кластеризацию в евклидовом пространстве с использованием группировки по ближним.
Правда там еще есть мера города .. вот можно было бы с ней поиграться, но тогда надо задавать двухмерные координаты.
Хотя , логика подсказывает , что ближайший по растоянию может быть не столь доступен в городе.
13 MadHead
 
10.12.13
17:33
(12) я немного изменил постановку когда писал вопрос, что бы меня лучше поняли. На самом деле у меня есть не расстояние, а мера схожести. Которая зависит от того как часто точки были в одном рейсе в прошлом. Есть полуторагодичная история рейсов по которым доставлялся товар.
14 MadHead
 
10.12.13
17:33
так что проблем быть не должно
15 acsent
 
10.12.13
17:41
Создание маршрутов - гораздо более сложная задача, чем кластеризация
16 Михаил Козлов
 
10.12.13
17:54
(10) "маршруты строятся на основании генетического алгоритма" - дело Ваше. Если проверка работы ген. алгоритма показала приемлимость результатов - хорошо.
Сколько помню, в 1С: Анализ данных кластеризация была совсем простой. Смотрел, правда, давно (лет 6 назад). Можно глянуть сам алгоритм, вроде бы он совсем прозрачный.
Есть два вида языков, одни постоянно ругают, а вторыми никто не пользуется.