|
Анализ данных кластеризация | ☑ | ||
---|---|---|---|---|
0
MadHead
10.12.13
✎
12:59
|
Требуется провести кластеризацию торговых точек. Есть матрица расстояний между точками. Хочу получить к примеру 3 равных кластера (по количеству ТТ в кластере). Кто работал с классом "анализ данных", как правильно выполнить кластеризацию?
|
|||
1
acsent
10.12.13
✎
13:00
|
(0) а в чем сложность то?
Но нет гарантии что кластеры окажутся равновеликими |
|||
2
MadHead
10.12.13
✎
13:06
|
Для тестов использую консоль анализа данных. Передаю таблицу типа ТТ1, ТТ2, расстояние. Какие типы входных полей должны быть заданы? Все 3 поля входные? Как тогда программа поймет что есть расстояние?
|
|||
3
Gantosha
10.12.13
✎
13:35
|
матрицу расстояний ты как посчитал ? Или у тебя расстояние это мера длины ?
Потом у тебя каждая строка это случай и как программа раскидает это по классам одному богу известно, ты можешь лишь управлять приблизительно количеством классов. Просто засунь данные в источник данных .. думаю описание случая будет по первой колонке .. хотя не факт ..дело в том что я не знаю как они делают переход к шкалам. Например свойство Т1 и Т2 никак не сравнимо и нет возможности засунуть ее в один класс. Но задача кластеризации именно уменьшать размерность, больше он не для чего не подходит. |
|||
4
MadHead
10.12.13
✎
13:40
|
(3) можно принять что матрицу расстояний я посчитал по формуле, через gps координаты торговых точек. Это реальное расстояние между торговыми точками. По идее это самая классическая задача кластеризации.
Просто засунуть я пробовал, данные получаются не совсем адекватными |
|||
5
Gantosha
10.12.13
✎
13:46
|
(4) расстояний между чем - у тебя там должны быть тогда парные расстояния между точками. Только умеет ли 1с работать именно с такими данными , так как там случай это не один элемент классификации.
А вообще у тебя должен получится центр тяжести, который должен быть как то между этими точками. И вообще для этого есть пакет статистика - она это делает точно быстрее, и более нагляднее. |
|||
6
MadHead
10.12.13
✎
14:06
|
(5) у меня там расстояния между всеми точками. если торговых точек n, то массив будет иметь n*n-n (-n что бы исключить расстояния между собой)
Что за пакет статистика? Денег стоит или бесплатно? |
|||
7
Gantosha
10.12.13
✎
14:17
|
(6) мне кажется 1с с такими данными не работает. Статистика конечно платный продукт, но для работы обычно было достаточно его скачать. А вообще мне кажется тебе проще решить задачу поиска центра тяжести для точек на круге и затем уже раскидать по классам. Кстати .. с какой целью ты их группируешь ?
|
|||
8
MadHead
10.12.13
✎
14:30
|
(7) Это нужно для автоматизации построения маршрутов доставки. Выделяются сектора доставки и к ним привязываются водители. Что бы водителей ездили по одним и тем же точкам. Я то могу запилить любой из алгоритмов кластеризации, но надеялся, что можно выкрутится стандартными да и работать они должны побыстрее самописных.
|
|||
9
Михаил Козлов
10.12.13
✎
15:30
|
Боюсь, что так рассчитанные маршруты могут вызывать недоумение у водителей: уж слишком упрощенная модель для построения маршрутов.
|
|||
10
MadHead
10.12.13
✎
15:53
|
(9) это не модель построения маршрутов, маршруты строятся на основании генетического алгоритма. Это всего лишь способ закрепить водителя за районом.
|
|||
11
MadHead
10.12.13
✎
15:55
|
мне нужно тиражировать решение на 20 баз. Так вот процесс создание так называемых секторов доставки вручную занимает много времени у логистов
|
|||
12
Gantosha
10.12.13
✎
16:00
|
(11) так тогда вы как бы правильно идете .. возьмите просто магазины и расстояние до вашего склада и прогоните кластеризацию в евклидовом пространстве с использованием группировки по ближним.
Правда там еще есть мера города .. вот можно было бы с ней поиграться, но тогда надо задавать двухмерные координаты. Хотя , логика подсказывает , что ближайший по растоянию может быть не столь доступен в городе. |
|||
13
MadHead
10.12.13
✎
17:33
|
(12) я немного изменил постановку когда писал вопрос, что бы меня лучше поняли. На самом деле у меня есть не расстояние, а мера схожести. Которая зависит от того как часто точки были в одном рейсе в прошлом. Есть полуторагодичная история рейсов по которым доставлялся товар.
|
|||
14
MadHead
10.12.13
✎
17:33
|
так что проблем быть не должно
|
|||
15
acsent
10.12.13
✎
17:41
|
Создание маршрутов - гораздо более сложная задача, чем кластеризация
|
|||
16
Михаил Козлов
10.12.13
✎
17:54
|
(10) "маршруты строятся на основании генетического алгоритма" - дело Ваше. Если проверка работы ген. алгоритма показала приемлимость результатов - хорошо.
Сколько помню, в 1С: Анализ данных кластеризация была совсем простой. Смотрел, правда, давно (лет 6 назад). Можно глянуть сам алгоритм, вроде бы он совсем прозрачный. |
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |