|
Необходимо отловить бота на сайте | ☑ | ||
---|---|---|---|---|
0
Юрий Лазаренко
20.07.12
✎
11:40
|
Заказчик поставил такую вот интересную задачу. К ним на сайт каждый день заходит бот, запускаемый конкурентом и сканирующий определенный набор страниц с целью срисовать цены. Заказчик хочет этому боту подпихивать фейковые цены. Для этого надо понять, с какого айпи или диапазона айпи заходит этот бот. Можно, конечно, написать скрипт и через неделю получить необходимые срезы информации, но хотелось бы получить нужную инфу уже сегодня. Пока в распоряжении есть только статистика от яндекс-метрики, но что-то я сходу там нужной информации не нашел (может плохо искал или смотрел не туда).
Собственно вопрос: есть ли тут гуру яндекс-метрики (и веб-мастеринга в принципе), подскажите как вытащить из нее необходимую информацию? В итоге нужна таблица вида: URL | IP | Количество заходов за период | Дата последнего захода Любые мысли, не связанные с метрикой, но способные помочь решить вопрос, также приветствуются. |
|||
56
raykom
20.07.12
✎
14:21
|
(0)Сделай страницу на сайте, на фронте не показывай, а в робот.тхт запрети роботам индексацию этой страницы. Нормальные роботы будут соблюдать инструкцию, а ломовые - будут индексировать всеравно. Ваш разведчик - стопудово из наглых роботов.
Круг сузишь, а потом и его вычислишь. |
|||
57
Лефмихалыч
20.07.12
✎
14:24
|
(0) а что помешает боту парсить яндомаркет?
|
|||
58
manyak
20.07.12
✎
14:25
|
не, регите новый ящик, обзываете "????новский центр скидок" шлете письмо на мыло конкурентов, вписьме ссыль и пиар про ваш магазин, а ссыль на страничку на которую интерактивно не попадешь - только по прямой ссылке. Если клюнет - посмотрите в логах с какого ip зашли на нее. эт при условии что они с работы бота юзают.
|
|||
59
Юрий Лазаренко
20.07.12
✎
14:25
|
(56) Там у них в настройках скрипта указано руками, на какие страницы заходить надо. То есть из 1300 товаров он мониторит только 20 тех, которые им интересны.
|
|||
60
manyak
20.07.12
✎
14:27
|
(59) такое очучение что конкуренты обратились к тебе за написанием бота, а тот магаз за отловом :) раз уж вкурсе всех нюансов работы их скрипта :)))
|
|||
61
Юрий Лазаренко
20.07.12
✎
14:40
|
Все, отловил!!!
Как и предполагалось, заходит примерно в одно и то же время, парсит всегда один и тот же список страниц. Заходит с одного и того же айпи. Ха-ха, денег на отпуск я таки заработал )))) |
|||
62
Юрий Лазаренко
20.07.12
✎
14:41
|
(60) У меня есть хорошие друзья из хороших структур, мы друг другу всегда помогаем, каждый в своей области )
|
|||
63
manyak
20.07.12
✎
14:41
|
молодец :)
|
|||
64
22 см
20.07.12
✎
15:37
|
Запалили таки демоны:((
Придется теперь заходить в разное время и с разных айпишников. Народ, подскажите, как айпишники подменять в пакетах? |
|||
65
Stim
20.07.12
✎
16:37
|
(64) )))
|
|||
66
Stim
20.07.12
✎
16:38
|
кстати, вопрос - а почему цены, выложенные в общедоступной странице - нельзя скачивать конкуренту?
|
|||
67
extrim-style
20.07.12
✎
16:40
|
Конкурент сидит, почитывает мисту и попивает охлажденное мартини со злобной усмешкой во взгляде...
|
|||
68
zzhiraf
20.07.12
✎
16:57
|
(64) используй прокси сервера,например fineproxy.org. По другому айпишники не подменишь ;)
|
|||
69
Юрий Лазаренко
20.07.12
✎
16:59
|
(66) Чтобы он не так оперативно реагировал на изменение цен моего клиента. При больших объемах лаг в запоздании информации равный одному дню это иногда сотни тысяч рублей прибыли.
|
|||
70
Stim
20.07.12
✎
17:00
|
(69) ну он может нанять человека, который будет отслеживать изменения цен
|
|||
71
Юрий Лазаренко
20.07.12
✎
17:01
|
(70) Человека можно отловить так же как и бота
|
|||
72
Никола_
Питерский 20.07.12
✎
17:04
|
Вообще не понимаю в чем суть, у Вас там что дельта в 500% что ли ? У конкурента свои закупочные цены, у Вас свои. И насколько сильно Вы хотите ему изменить цены ? Он это сразу поймет, у него же не бот прайс-лист составляет ! Бот только инфу собирает, а решения то в любом случае принимают люди !
Какой-то херней Вы занимаетесь Юрий ! |
|||
73
Юрий Лазаренко
20.07.12
✎
17:07
|
(72) Мы не собираемся ЕМУ ничего менять, задача - скрыть ОТ НЕГО изменения наших цен или значительно усложнить процесс их отслеживания. Тогда он либо будет терять ресурсы на их сборе, либо задолбается и откажется от своей идеи нам ботов присылать.
|
|||
74
Irek-kazan
20.07.12
✎
17:09
|
(72) херня не херня а 300 косарей в месяц тоже деньги
|
|||
75
Юрий Лазаренко
20.07.12
✎
17:09
|
Это в двух словах. На самом деле есть некие особенности, которые позволят заработать на этом, но я не буду их выкладывать в данной ветке, уж простите ))
|
|||
76
Irek-kazan
20.07.12
✎
17:11
|
(75) нет ты уж расскажи раз начал ;)
|
|||
77
Юрий Лазаренко
20.07.12
✎
17:12
|
(76) Я еще не начал )
|
|||
78
Никола_
Питерский 20.07.12
✎
17:13
|
(73) Любой Ваш покупатель может в любой момент стать Вашим конкурентом ! А может быть это покупатель сделал ботов и мониторит сайты всех контор торгующих аналогичными товарами ?
|
|||
79
Irek-kazan
20.07.12
✎
17:13
|
в линуксе помнится на iptables можно было редирект сделать
|
|||
80
manyak
20.07.12
✎
17:15
|
http://checkerproxy.net/free_proxy
полеhtml или компонент webbrouser + программно в реестре прописываем ip прокси и все. |
|||
81
manyak
20.07.12
✎
17:16
|
webbrowser
|
|||
82
Федя Тяпкин
20.07.12
✎
17:16
|
(0) судя по боту, конкуренты не такие идиоты как вы о них думаете. подсунуть левые цены ха ха
|
|||
83
Irek-kazan
20.07.12
✎
17:18
|
(82) Часто люди начинают думать что они умнее других и на этом можно подловить.
Например, мы ппц какие умные написали бота, остальные тупые - ничего не заметят. И все они уже не ведут мониторнг того что собрал бот |
|||
84
Юрий Лазаренко
20.07.12
✎
17:19
|
(78) У меня на руках отчеты, сформированные их ботом. Имя конкурента было известно изначально, надо было только понять, как именно и с какого айпи он к нам заходит.
(82) Был бы не идиотом, я бы не смог зайти к нему на сайт и в онлайне прочитать результат работы бота, со всей историей его работы за последние месяцы. Страничка, конечно, под паролем, но логин "111" и пароль "111" - просто порвали. |
|||
85
Steel_Wheel
20.07.12
✎
17:19
|
(0) А как бота определили? А если это обычный юзер?
|
|||
86
Федя Тяпкин
20.07.12
✎
17:19
|
(83) автор намекнул что речь идет о не малых прибылях. плюс цена все таки есть в открытом доступе, ничего не мешает при подозрении сверить. вот если бы бот из какой то закрытой базы что то тырыл, а ему подменили бы, был бы детектив да
|
|||
87
Юрий Лазаренко
20.07.12
✎
17:22
|
(85) Мониторинг 20 сайтов по 18 товарным позициям. Заход на каждую страницу сайта с периодичностью день и дельтой в несколько секунд - человек так не сможет.
|
|||
88
Steel_Wheel
20.07.12
✎
17:31
|
(87) а если бот через анонимайзер ходить станет?
Пару лишних действий вбить -- дело даже не часа работы |
|||
89
Irek-kazan
20.07.12
✎
17:32
|
(88) поэтому и будут дезу подсовывать, а не доступ рубить
еще раз есть доступ к боту, может подсунуть функционал ему соответствующий...например, отправка сообщений на почту когда запускается бот |
|||
90
Юрий Лазаренко
20.07.12
✎
17:35
|
(88) Пока они прочухают, уже сколько-то времени пройдет. К тому же нам известны как минимум еще несколько параметров, по которым можно понять, что это бот: порядок обхода сайта, периодичность посещения страниц, список посещаемых страниц, время посещения и т.д.. Можно привязываться к этим данным и идентифицировать бота. В общем не так то просто им будет.
(89) Доступа к скрипту не получили, только к формируемому им отчету и параметрам поиска, но этого уже было достаточно, чтобы предсказать алгоритм его работы. Собственно поэтому всего за 4 часа и получилось его опознать. |
|||
91
SachoZ
20.07.12
✎
17:44
|
(90) ну так опознали суньте дезу. только нафиг, собирать ваши цены можно например у ваших оптовых покупателей.
|
|||
92
Stim
20.07.12
✎
17:52
|
имхо, затея бесполезная. конкурент сменит айпи, будет выходить в другое время, или накрайняк наймет человека
|
|||
93
Юрий Лазаренко
20.07.12
✎
17:53
|
(91) Это уже временные лаги, то есть как раз то, к чему стремимся
|
|||
94
zak555
21.07.12
✎
05:54
|
писать цены "от...", а подробнее --- уже другой запрос из БД
|
|||
95
Balabass
23.07.12
✎
03:51
|
Так как поймали то?
Тупым одинесникам не понятно! |
|||
96
Юрий Лазаренко
23.07.12
✎
11:32
|
(95) По формату отчета стало понятно, что нужно искать около 20-ти заходов ежедневно с одного IP, причем на конкретные страницы. Время захода тоже известно из того же отчета: с 8-00 до 9-40. Выгрузил лог сервера в таблицу, закачал ее в скуль и сформировал отчет с фильтром по страницам и по времени, с группировкой по IP и по дате. Собственно задача попалась несложная.
|
|||
97
pumbaEO
23.07.12
✎
11:40
|
война фигня, главное маневры.
Теперь конкуренты поменяют бота, дней пять макс. понадобится, потом будете опять искать решение, потом они, потом вы. Короче, на отпуск зарабатываем круглый год. |
|||
98
Юрий Лазаренко
23.07.12
✎
11:49
|
(97) Деньги там хорошие крутятся, заказчику это выгодно. Мне тоже. Так что все в шоколаде. К тому же работа удаленная, можно на отпуск прям под пальмой зарабатывать.
|
|||
99
dmpl
23.07.12
✎
11:58
|
(84) Отчеты конкурента? А вот это уже статья...
|
|||
100
Юрий Лазаренко
23.07.12
✎
11:59
|
(99) Да ну? ))
|
|||
101
dmpl
23.07.12
✎
12:01
|
(100) 183-я, например.
|
|||
102
Shurjk
23.07.12
✎
12:01
|
(0) Я бы на месте конкурента прикололся и оформил бы заказ по фэйковым ценам.
А на самом деле есть еще такая вещь как авторизация. |
|||
103
Юрий Лазаренко
23.07.12
✎
12:08
|
(101) Ну мне это не грозит, я ее не получал незаконно.
(102) Так пусть заказывает. |
|||
104
dmpl
23.07.12
✎
12:12
|
(103) Да? И как же ты ее получил? Пришел к конкуренту и он тебе выдал отчет? Все остальное может быть признано незаконным.
|
|||
105
Юрий Лазаренко
23.07.12
✎
12:13
|
(104) "Нашел на улице листик" устроит?
|
|||
106
dmpl
23.07.12
✎
12:15
|
(105) Нет. Листик не твой, значит украл, а не "нашел".
|
|||
107
Юрий Лазаренко
23.07.12
✎
12:17
|
(106) Хорошо. Шел по улице, увидел листик на столбе, прочитал, запомнил, сделал выводы, пошел дальше? )
|
|||
108
dmpl
23.07.12
✎
12:19
|
(107) "Прочитал" - уже незаконно. Да и такой листок на столбе висеть не будет. Судья не поверит.
|
|||
109
Юрий Лазаренко
23.07.12
✎
12:23
|
(108) Ну конечно, секретные документы на викиликс висят, а листок на столбе не может? Я вас умоляю! ))
|
|||
110
Юрий Лазаренко
23.07.12
✎
12:24
|
(108) Сфигали "прочитал = незаконно", если инфа висит в открытом доступе?
|
|||
111
dmpl
23.07.12
✎
12:26
|
(109) Судье будешь рассказывать, только сначала придумай правдоподобную версию того, почему именно этот листок оказался на столбе и почему именно ты его прочитал.
(110) С того, что это коммерческая тайна. Не читай все вподряд. |
|||
112
dmpl
23.07.12
✎
12:26
|
(109) А то еще разразится скандал со шпионским столбом.
|
|||
113
Юрий Лазаренко
23.07.12
✎
12:27
|
(111) Ну я принял к сведению, спасибо )
|
|||
114
Холст
23.07.12
✎
12:30
|
фигней маетесь... ваши цены секрет ??? если конкурент ставит цены ниже, то завоевывайте своего покупателя более лучшим обслуживанием, акциями, стабильностью логистики, широтой выбора и тп... или проваливайте с рынка !!!
|
|||
115
Steel_Wheel
23.07.12
✎
12:35
|
(111) А между фоирмой и ним нет же никаких обязательств о неразглашении коммерческой тайны? А то, что в открытый доступ выложили -- ССЗБ. Они бы еще распечатали и с вертолета над Красной Площадью сбрасывали
|
|||
116
Юрий Лазаренко
23.07.12
✎
12:36
|
(114) Об акциях речь и идет, незачем конкуренту знать о них
|
|||
117
Steel_Wheel
23.07.12
✎
12:39
|
А к прайсу авторизацию прикрутить и забанить те аккаунты, которые мониторят тоже, что и бот?
|
|||
118
Холст
23.07.12
✎
12:41
|
(166) напоминает ситуацию, когда идешь по рынку, выбираешь товар, спрашиваешь цену, а тебе говорят "эээ дарагой зачем спрашиваешь цену, все равно ведь не будешь пакупать, да ?"
|
|||
119
dmpl
23.07.12
✎
12:41
|
(115) Ну дык закон "О коммерческой тайне" нарушен? Нарушен. Все, этого достаточно, чтобы получение сведений стало незаконным. Неважно кем нарушен, важно что информация получена с нарушением закона, т.е. незаконным способом.
(116) Тю-тю... рекламы у вас что, вообще нет? |
|||
120
Steel_Wheel
23.07.12
✎
12:43
|
(119) если у меня есть логин и пароль, то это то же самое, что ключ от сейфа. С точки зрения системы это не Юрий Лазаренко заходил, а биг-босс или Одмин в Свитере
|
|||
121
Юрий Лазаренко
23.07.12
✎
12:45
|
(117) Заставлять каждого розничного покупателя проходить авторизацию = потерять большой процент клиентов.
|
|||
122
Steel_Wheel
23.07.12
✎
12:55
|
+120 ну вот, например
"Статья 10. Охрана конфиденциальности информации 5) нанесение на материальные носители (документы), содержащие информацию, составляющую коммерческую тайну, грифа "Коммерческая тайна" с указанием обладателя этой информации (для юридических лиц - полное наименование и место нахождения, для индивидуальных предпринимателей - фамилия, имя, отчество гражданина, являющегося индивидуальным предпринимателем, и место жительства)." Если на отчетах такого грифа нет, то эта информация не коммерческая тайна. Соответственно, под закон не подпадает |
|||
123
dmpl
23.07.12
✎
12:57
|
(120) Да без разницы, конкуренту достаточно мотивированное заявление накатать, и работа пойдет...
(122) Не так. Если не нанесли - это уже нарушение закона. От наличия или отсутствия грифа информация свой статус не меняет. |
|||
124
dmpl
23.07.12
✎
12:57
|
(122) Плюс отсутствие грифа еще надо будет доказать ;)
|
|||
125
Скользящий
23.07.12
✎
13:00
|
Интересная тему, автор, держи нас в курсе развития событий. Прямо детектив.
|
|||
126
Юрий Лазаренко
23.07.12
✎
13:15
|
(124) Нужно "доказать отсутствие грифа"? Сильно!
|
|||
127
dmpl
23.07.12
✎
13:58
|
(126) Конкуренты же скажут, что не печатают такую информацию без грифа и приложат соответствующую регламентированную процедуру. А потому на столбе не мог появиться просто так листок с коммерческой тайной, тем более без грифа. Впрочем, давшие тебе отчет сами же тебя и сдадут при грамотно мотивированной заяве конкурента, так что судья насчет листов на столбе будет слушать с ухмылкой.
|
|||
128
Steel_Wheel
23.07.12
✎
14:01
|
(127) А если у Юрия есть лист БЕЗ грифа? Распечатанный. Все, Юрий не имеет возможности знать, что это -- коммерческая тайна. И проблема перетекает во внутренние трудности "Конкурента"
|
|||
129
dmpl
23.07.12
✎
14:09
|
(128) Вот если бы не воспользовался - еще можно было бы поверить. Понимаешь, если ты в фотошопе уберешь этот гриф и распечатаешь так, а потом дашь этот листок заинтересованному лицу - нарушение и незаконность никуда не денутся. Просто будет организованная группа, а это уже отягчающее обстоятельство.
|
|||
130
Irek-kazan
23.07.12
✎
14:19
|
(122) закон нужно читать целиком. Я тоже так могу, например:
режим коммерческой тайны - правовые, организационные, технические и иные принимаемые обладателем информации, составляющей коммерческую тайну, меры по охране ее конфиденциальности; |
|||
131
Irek-kazan
23.07.12
✎
14:20
|
+(130) 2. Информация, самостоятельно полученная лицом при осуществлении исследований, систематических наблюдений или иной деятельности, считается полученной законным способом несмотря на то, что содержание указанной информации может совпадать с содержанием информации, составляющей коммерческую тайну, обладателем которой является другое лицо.
|
|||
132
Irek-kazan
23.07.12
✎
14:22
|
так что сначала нужно доказать, что данная информация является коммерческой тайной, потом что получена незаконным способом
|
|||
133
dmpl
23.07.12
✎
14:33
|
(132) См. (84), с чего все началось. Вот "сидел день и ночь, анализировал логи сервера и нашел" - еще могло бы прокатить за отмазку. А листок на столбе - нет.
|
|||
134
mikadi
23.07.12
✎
14:41
|
(133) Ну а почему - нет? Всё, что в открытом доступе - можно читать.
Это задача владельца информации - защитить её. А не моя задача - закрывать глаза, чтобы ненароком не увидеть ничего лишнего. ИМХО, для судебного разбирательства потерпевшая сторона должна доказать факт незаконного проникновения в её информационную систему. |
|||
135
pumbaEO
23.07.12
✎
14:43
|
(134) т.е. нашел ключи от квартиры где деньги лежат, открыл этими ключиками квартиру без разрешения хозяев и это уже законное проникновение ?
|
|||
136
dmpl
23.07.12
✎
14:43
|
(134) См. (84). Там были имя и пароль, т.е. доступ не открытый. Не исключено, что все это было специально подстроено конкурентами, и у них все ходы записаны.
|
|||
137
mikadi
23.07.12
✎
14:48
|
(135) Нет, если зашёл в квартиру - это незаконно. А вот если я у вас увижу запонку - точно такую же, как была у меня, то это я должен доказать, что вы её у меня украли, а не вы должны объяснять, как у вас оказалась такая же запонка.
(136) Ну вот если действительно ходы записаны - то да, могут судить за незаконное проникновение. Но не факт, что за кражу коммерческой информации (это наверняка надо доказывать отдельно). |
|||
138
dmpl
23.07.12
✎
14:52
|
(137) Ну так они воспользовались этой информацией, теперь надо только ущерб нарисовать - и дело готово. Скоро, наверное, конкуренты завербуют автора за незаведение дела...
|
|||
139
mikadi
23.07.12
✎
14:54
|
(138) Как воспользовались? Стали отслеживать действия с определённого IP? Так для этого НЕ нужна коммерческая информация.
|
|||
140
Ахиллес
23.07.12
✎
15:00
|
(0) Не дай бог вы перепутаете вашего конкурента с проверкой яндекс маркета :-) Враз закроют вам доступ.
|
|||
141
dmpl
23.07.12
✎
15:02
|
(139) Ну, тут не все так невинно. И опять, же, резать ножом мясо - вроде бы, звучит невинно. Правда, если добавить прилагательное "человеческое" - уже совсем другое дело получается.
|
|||
142
mikadi
23.07.12
✎
15:05
|
(141) Ну, "по понятиям" это действительно кража. По понятиям - и похожая запонка у другого человека - вполне повод для разборок. А по закону - доказывать ведь надо.
|
|||
143
dmpl
23.07.12
✎
15:09
|
(142) Получил доступ к инфе - а затем предпринял ответные действия. Причем логичные, исходя из того, что именно содержалось в этой информации. Какие тут могут быть сомнения?
|
|||
144
mikadi
23.07.12
✎
15:13
|
(143) Не знаю. Тут уже юридические тонкости. Я думаю, всё-таки надо будет показывать, что информацию нельзя было получить из открытых источников.
Да и какие действия были предприняты? Что будет показано суду? "Вот мы запускаем наш скрипт, а он вместо правильных цен неправильные возвращает - и это всё не из-за наших ошибок, а из-за зловредных действий ответчика" ? ИМХО, тут должна быть глубокая экспертиза, чтобы доказать факт злого умысла, причём основанного на украденной информации. |
|||
145
dmpl
23.07.12
✎
15:36
|
(144) А ветка на Мисте на что? ;) Да и для шантажа достаточно "а вдруг смогут?" Плюс даже просто обвинение по такой статье - уже почти волчий билет... любая СБ выдаст на него отрицательное заключение на всякий случай.
|
|||
146
Steel_Wheel
23.07.12
✎
16:34
|
(145) Надо Волшебнику сказать, что миста становится площадкой для разборок... думаю, ветку после этого будет трудно подшить ))
|
|||
147
Юрий Лазаренко
23.07.12
✎
19:37
|
(145) Угу, только сначала надо доказать, что данному конкретныму нику соответствует человек с таким же именем в паспорте и что именно он создал эту ветку, а не Петя Иванов, который у него пароль от аккаунта украл.
|
|||
148
Vladal
23.07.12
✎
20:03
|
(146) А нотариально завернный скриншот?
|
|||
149
Jump
23.07.12
✎
21:12
|
(148)Нотариусы скриншоты не заверяют.
|
|||
150
Vladal
23.07.12
✎
21:19
|
(149) На Лурке статья есть ))))
http://lurkmore.to/Нотариально_заверенный_скриншот |
|||
151
Mucmuk
23.07.12
✎
21:58
|
(67) =))))
|
|||
152
dmpl
24.07.12
✎
08:11
|
(147) Ходорковский тоже так думал...
|
|||
153
Юрий Лазаренко
24.07.12
✎
12:05
|
(152) Что ж ты так против меня настроен то? Мож я тебе в прошлой жизни чего плохого сделал?
|
|||
154
BigHarry
24.07.12
✎
12:17
|
(153) Не кормите троллей, вы уже решили свою задачу, так что покиньте эту ветку и отправляйтесь спокойно в отпуск :)
|
|||
155
Юрий Лазаренко
24.07.12
✎
12:19
|
(154) Тихо, не спугните его! )))))
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |