|
Большой босс хочет свой Google... | ☑ | ||
---|---|---|---|---|
0
april
25.07.17
✎
08:13
|
Чтобы он пришел на работу, сел за компьютер, а у него там уже собрана вся информация по идущим в данный момент в интернете тендерам...
Google я уже посмотрел - там одна строка нарисована на форме - это просто ;) но как собрать всю нужную информацию? |
|||
2
iceman2112
25.07.17
✎
08:18
|
по идущем в Интернете тендерам (с)
может на 1-3 ресурсов остановимся? |
|||
3
Гипервизор
25.07.17
✎
08:19
|
(0) Покажите боссу google.gik-team.com
|
|||
4
mishaPH
модератор
25.07.17
✎
08:20
|
(0) твой босс хочет задаром работу целого аналитического отдела?
|
|||
5
april
25.07.17
✎
08:21
|
в прошлый раз отбрехался тем, что интернет платный и дорогой...
сейчас безлимит... отмазка не катит в общем идея такая... берем сервер... на сервере программа... сканирует или интернет, либо выдачу яндекса, отбирает ссылки, сканирует, отбирает страницы с соотвествующими ключевыми словами... складывает в базу и выдает из базы любимому боссу... может что-то готовое уже есть на эту тему? |
|||
6
iceman2112
25.07.17
✎
08:21
|
(4) Думаю босс не знает, чего он хочет.
|
|||
7
april
25.07.17
✎
08:22
|
да мой босс старый еврей... и полковник в запасе
|
|||
8
iceman2112
25.07.17
✎
08:22
|
в прошлый раз отбрехался тем, что интернет платный и дорогой... (с)
вы друг друга стоите |
|||
9
april
25.07.17
✎
08:23
|
я тоже думаю, что не знает, но как ему объяснить, что ему это не надо...
|
|||
10
ДемонМаксвелла
25.07.17
✎
08:24
|
(9) ему это надо, но у него на это не хватит денег
|
|||
11
april
25.07.17
✎
08:25
|
(8) тогда 1 ГБт - 14000 RUB стоил, сканировать весь интернет - предприятие разорится, так и сказал, что не так?
|
|||
12
iceman2112
25.07.17
✎
08:25
|
(9) Так, что там максимум 2-3 постоянных ресурса, где хранится "все информация по идущим в данный момент в интернете тендерам", пусть заходит на них и смотрит, там возможно даже подписка есть.
Считаем, 3 ресурса. в 3 клика получается + бесплатно |
|||
13
iceman2112
25.07.17
✎
08:26
|
тем более нужны же тендеры не все, скорей всего, а по определенное тематике, так что это не ВЕСЬ ИНТЕРНЕТ сканировать нужно)
|
|||
14
vde69
25.07.17
✎
08:27
|
(0) я конфу писал именно для сабжа....
если интересно - могу рассказать |
|||
15
vde69
25.07.17
✎
08:28
|
(14) у меня не все площадки
например фабрикант - работал, а сбер - нет |
|||
16
2dolist
25.07.17
✎
08:29
|
(5) программа сканирует интернет
Весь? |
|||
17
25-11
25.07.17
✎
08:34
|
Орг. меры предложи. Обученная тобой секретарша каждое утро выкладывает сводку.
|
|||
18
NorthWind
25.07.17
✎
08:35
|
(0) есть площадки, которые агрегируют тендеры. В яндексе находятся на раз. Заключайте договор, и будут у него на столе тендеры, в чем проблема-то?
|
|||
19
april
25.07.17
✎
08:36
|
(14) расскажи, пожалуйста!
|
|||
20
vde69
25.07.17
✎
08:36
|
(14) + у меня реально работало по 4м площадкам, за год база тендеров без вложений копится примерно 1 терабайт
реализовано 1. поиск оф лайн по ключевым запросам полнотекстового поиска 1с 2. работа с закрытыми площадками 3. рассылка по почте найденых тендеров и еще много плюшек из минусов - 1. сайты постоянно меняются и приходится постоянно поднастраивать парсинг 2. сайты на основе активных клиентских скриптов - не работают |
|||
21
april
25.07.17
✎
08:37
|
(20)
на чем писал? сколько времени ушло? |
|||
22
april
25.07.17
✎
08:38
|
(20)
и как ты парсил закрытые площадки? |
|||
23
vde69
25.07.17
✎
08:39
|
(21) на 1с, ушло примерно 5 дней на базу, и 3 недели на настройки парсинга
|
|||
24
vde69
25.07.17
✎
08:39
|
(22) сначало авторизация, потом обычный парсинг
|
|||
25
бегинер
25.07.17
✎
08:44
|
да полно таких сайтов аггрегаторов- покажи боссу:
synapsenet. ru rostender. info |
|||
26
april
25.07.17
✎
08:44
|
хм... а как авторизоваться из 1с?
|
|||
27
april
25.07.17
✎
08:45
|
(25) товарищ настоящий полковник желает свой с блэкджеком и...
|
|||
28
бегинер
25.07.17
✎
08:49
|
(26) покури:
http://catalog.mista.ru/public/255881/ |
|||
29
бегинер
25.07.17
✎
08:51
|
ну и как вариант найти сайт аггрегатор который уже собирает всю инфу и парсить уже его...
|
|||
30
april
25.07.17
✎
08:57
|
(29) возможности парсинга выдачи яндекса и гугла ограничены... от таких умных
|
|||
31
Адинэснег
25.07.17
✎
08:59
|
накуя парсить яндекс и гугл
|
|||
32
бегинер
25.07.17
✎
09:00
|
(30) я про парсинг сайта ТЕНДЕРНОГО аггрегатора, а не про парсинг выдачи поисковика....
|
|||
33
Адинэснег
25.07.17
✎
09:00
|
авторизация точно такая же как и браузером
пост, заголовки, etc |
|||
34
NorthWind
25.07.17
✎
09:01
|
(26) очевидно, позвонить в эти конторы и поинтересоваться, кто и как позволяет делать интеграцию с учетными системами. Скорее всего, все уже давным-давно сделано за вас. И даже обработки для 1С могут быть готовые.
|
|||
35
april
25.07.17
✎
09:01
|
(32)
а для этого, как правило, надо авторизоваться на сайте... пошел читать http://catalog.mista.ru/public/255881/ |
|||
36
бегинер
25.07.17
✎
09:08
|
вот например ищет:
https://synapsenet.ru/search открой ссыль например в опере, включи в опере режим разработчика. далее вбей в строку поиска нужный запрос и нажми на "лупу" - начни поиск. в окне режима разработчика на закладке "Network" увидишь все параметры: ================== Request URL:https://synapsenet.ru/search/setsearchoptions Request Method:POST Status Code:200 OK Remote Address:51.255.13.24:44 ================== Form Data query:!!!ЗдесьТексКПоиску!!! regionsIds: minPrice:0 maxPrice:0 skiptenders:0 take:undefined |
|||
37
vde69
25.07.17
✎
09:14
|
(36) представь, что у меня 100...500 запросов на поиск по 10 площадкам, ищу каждый день...
догадайся сколько это будет стоить |
|||
38
бегинер
25.07.17
✎
09:22
|
(37) ну мы же не говорим счас про платный сторонний поиск через спец ПО, а про самописку автора, два варианта:
легкий чтоб полковник отстал 1) найти сайт аггрегатор на котором есть бесплатный поиск, парсить его выдачу, найденное смотреть уже на самой тендерной площадке как вариант сложный: 2) определить список площадок, сделать себе ЭЦП, присоединиться - зарегиться ко всем площадкам, написать парсеры по всем площадкам, далее либо просто искать через 1с, либо если много регулярных запросов - то еще и копить результаты поиска нужных тендеров. либо оформить подписку на сайт аггрегатор и не париться: ждать когда автор напишет, либо купить и юзать сразу - это уже полковнику решать :) если у фирмы есть на это деньги... |
|||
39
бегинер
25.07.17
✎
09:24
|
ну и еще вариант - скооперироваться с vde69 :)
|
|||
40
yegres
25.07.17
✎
09:57
|
(0) Попробуй https://tenderplan.ru/ Тестовый период 14 дней, очень удобный интерфейс, но денег стоит потом. Мне понравилась больше чем http://www.komtender.ru/ и http://rostender.info/
|
|||
41
lodger
25.07.17
✎
09:59
|
научи босса пользоваться гуглом.
|
|||
42
yegres
25.07.17
✎
09:59
|
а если бесплатно, то на http://zakupki.gov.ru можно найти необходимые тендеры, там указывается также площадка на которой размещен данный тендер
|
|||
43
Bigbro
25.07.17
✎
10:06
|
(0) покажите шефу где купить и скажите цену.
$ 998,31 - цена акции гугла 689 238 589 - их количество. перемножить сумеет наверное. |
|||
44
бегинер
25.07.17
✎
10:16
|
||||
45
бегинер
25.07.17
✎
10:19
|
||||
46
Вафель
25.07.17
✎
10:19
|
если боссу нужен просто гугл, то можно забить строку поиска и сохранить страничку в хтмл )))
|
|||
47
Базис
naïve
25.07.17
✎
10:37
|
Мелко плавает полковник (возможно, левый). Сделав свой гугл, он сможет продать его руководству нефтегазовой федерации, и тендеры ему уже будут не нужны.
Дай ему книжку БГейца, business@think, пусть проникается. |
|||
48
Garykom
гуру
25.07.17
✎
10:42
|
(47) Гугл (и прочие яндексы с мейлами) как поисковик довольно простая штука, но очень тяжелая и дорогая по железу с админами.
Обычный парсер страничек, выявление ссылок с последующим парсингом уже их. В процессе индексируем тексты по методу N-грамм и складываем все в большую базу. Любой вменяемый веб программер справится (который парсер писал) но не сможет реализовать на конкурентном уровне ибо гугл уже далеко вперед убежал по разным тонким/хитрым моментам. |
|||
49
_stay true_
25.07.17
✎
10:45
|
(46) И получить за это over9000k рублей!
|
|||
50
kyvv
25.07.17
✎
10:58
|
1С приглашает на работу питонистов и спецов по ML. скоро все будет искаропки.
|
|||
51
Exec
25.07.17
✎
11:01
|
||||
52
Exec
25.07.17
✎
11:02
|
+(51) По технологии SphinxSE осуществляется поиск на популярном блоге Хабрахабр, проекте Викимапия, популярном книжном интернет-магазине Буквоед, сайте "Санкт-Петербургского Дома Книги", BitTorrent-трекере Пиратская бухта и других высоконагруженных проектах[2]. Используется в CMS 1С-Битрикс[3], HostCMS [4], CMS LiveStreet, Umi.CMS версии 2.9.6 и выше, доступен с помощью плагина для CMS Wordpress[5] и т. д.
В 2011 году была выпущена книга "Introduction to Search with Sphinx" издательства O'Reilly, написанная автором поисковика Андреем Аксёновым. Бери, используй, он GNU |
|||
53
april
25.07.17
✎
11:13
|
(52)
здорово! спасибо! родной php! |
|||
54
april
25.07.17
✎
11:17
|
я тут сервер под проект подобрал! ;)
2 Xeona, 32Гбт RAM, 2 HDD SAS 600 Гбт 15000 оборотов. Бойся, Google! |
|||
55
wt
25.07.17
✎
11:17
|
(8) с ними надо говорить на их языке.
|
|||
56
Два Плюс Два
25.07.17
✎
11:18
|
(5) Бывают такие, но только по вакансиям работников http://qyzmet.kz
|
|||
57
Два Плюс Два
25.07.17
✎
11:19
|
+(56) Там он у них все доски объявлений сканит и в одном списке выводит с указанием даты последнего сканирования вакансии. Правда, он утратившие силу вакансии не убирает сразу. На этом сайте они продолжают висеть.
|
|||
58
april
25.07.17
✎
11:28
|
в общем так...
на сервере FRee BSD или Linux, какая-то программа php, perl, python или что-то подобное, которая сканирует... ну например выдачу яши или гугла по определенным запросам, + указанные тендерные площадки (здесь указывается логин и пароль для авторизации), то что парсится складывается в базу (postgresql или mariadb)- URL, дата, текст к базе должен быть веб-интерфейс и возможность отправлять информацию письмами на e-mail, например маркетингу и боссу |
|||
59
april
25.07.17
✎
11:29
|
+ регламентные процедуры -например, убрать устаревшие данные давностью более чем за 1 месяц.
|
|||
60
Базис
naïve
25.07.17
✎
11:35
|
(58) ОЧЕНЬ ВАЖНО!
Должна быть возможность продавать корованы и покупать корованы. |
|||
61
1dvd
25.07.17
✎
11:36
|
(60) а грабить?
|
|||
62
NikVars
25.07.17
✎
12:06
|
(0) Ввиду того, что львиная доля нужной информации не является структурированной по мудроправилам бигбоссов, всегда присутствует ручной сбор/отбор информации. И этот объем ручной работы очень и очень большой. А если добавить изменчивость хотелок бигбосов, то проще устно исполнителю получить указание и выполнить его, чем годами переписывать алгоритм какой-то проги, подстраивая ее логику под "хочу так, хочу этак".
Для некоторых боссов научные институты годами информацию собирают. Другие организуют на деньги налогоплательщиков разные Администрации и/или нанимают заместителей, которые в свою очередь нанимают помощников. |
|||
63
NikVars
25.07.17
✎
12:09
|
Да, еще забыл про Росстат и про разные переписи населения которые используются для получения информации.
|
|||
64
kyvv
25.07.17
✎
12:52
|
(61)У него же не новый шелковый путь, верблюды и товары свои.
|
|||
65
sitex
naïve
25.07.17
✎
12:59
|
(58) И сколько платите за такое изобретение ?
|
|||
66
1dvd
25.07.17
✎
13:02
|
(64) нельзя в одном предложении использовать слово "корованы" без глагола "грабить"
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |