|
1С ЧтениеHTML получить заголовок страницы | ☑ | ||
---|---|---|---|---|
0
Maniac
05.07.19
✎
18:51
|
Есть куча ссылок. нуно по ссылкам получить по каждой заголовок страницы. и чтобы это работало быстро
|
|||
1
dubolom
05.07.19
✎
18:53
|
Если заголовок в буквальном смысле, то читай по тэгу title и будет тебе счастье.
|
|||
2
Maniac
05.07.19
✎
19:04
|
Чота не работает вообще
Если ЗначениеЗаполнено(АдресСтраницы) И Найти(АдресСтраницы,"http") > 0 Тогда Соединение = Новый HTTPСоединение(АдресСайта); Запрос = Новый HTTPЗапрос(АдресСтраницы); Ответ = Соединение.Получить(Запрос); Если Ответ.КодСостояния = 200 Тогда Значение = Ответ.Заголовки; КонецЕсли; КонецЕсли; |
|||
3
Maniac
05.07.19
✎
19:06
|
и очень долго. 60 строк 3 минуты
|
|||
4
Maniac
05.07.19
✎
19:10
|
ошибок не выдает. но и ничего не возвращает. и долго
|
|||
5
Garykom
гуру
05.07.19
✎
19:16
|
А если заголовок меняется через JS ?
|
|||
6
Maniac
05.07.19
✎
19:24
|
короче соединения работают. возвраты есть. но работает все пипец как долго.
видимо читает каждую страницу целиком... а нужно только заголовки. |
|||
7
dubolom
05.07.19
✎
19:25
|
(6) Как ты себе представляешь чтение только заголовка?
|
|||
8
Maniac
05.07.19
✎
19:31
|
(7) да также как например 1С умеет заголовки писем почты читать
|
|||
9
Maniac
05.07.19
✎
19:32
|
я думал это возможно..
|
|||
10
dubolom
05.07.19
✎
19:36
|
(9) У письма почты заголовок - отдельное поле. Он так и хранится.
А из кода страницы тебе надо его самостоятельно выковыривать. Никто заранее не скажет, где он там. |
|||
11
Garykom
гуру
05.07.19
✎
19:37
|
Мне интереснее зачем нужны заголовки страницы и не путаем ли с HTTP Headers ))
|
|||
12
Garykom
гуру
05.07.19
✎
19:39
|
Title из head из body хрен получишь правильный полностью не загрузив страницу и не дав отработать javascript коду.
А вот Headers можно отдельно от тела прочитать. |
|||
13
Maniac
05.07.19
✎
19:40
|
(11) а как его в 1С получить?
|
|||
14
Garykom
гуру
05.07.19
✎
19:44
|
(13) Ты объясни науйя?
|
|||
15
Maniac
05.07.19
✎
19:45
|
на каждо странице товар. заголовок страницы наименование товара. тупо наименования получить вместо ссылок
|
|||
16
Garykom
гуру
05.07.19
✎
19:46
|
(15) Проанализируй как страницы строятся, может есть некий api который можно заюзать и получить готовые данные в json.
|
|||
17
Garykom
гуру
05.07.19
✎
19:48
|
(16) Но если там PHP без JS то облом конечно и страницы на сервере формируются.
В общем случае пиши многопоточный браузер и использую его. |
|||
18
Maniac
05.07.19
✎
19:50
|
да зараза там именно PHP
|
|||
19
Maniac
05.07.19
✎
19:53
|
/index.phpproductID=3803
/index.phpproductID=3771 /index.phpproductID=5678 /index.phpproductID=5677 /index.phpproductID=3783 |
|||
20
dubolom
05.07.19
✎
20:13
|
(18) Нельзя как-нибудь договориться, чтобы данные присылались в более удобном виде?
|
|||
21
Maniac
05.07.19
✎
20:17
|
(20) почти никто не меняет свои кривые прайсы. многократно об этом говорю клиентам.
Ладно решили сделать чтобы чтение возвращало текст ячеек и ссылку одновременно. буду разбирать текстовую строку |
|||
22
Maniac
05.07.19
✎
20:18
|
хотя парсинг страниц тоже тема нужная.
|
|||
23
Garykom
гуру
05.07.19
✎
20:38
|
(22) Парсинг страниц уже давно освоенная тема и куча решений есть как платных так и бесплатных.
В 1С остается только готовые данные загружать из файлов текстовых или табличных или из базы. |
|||
24
Maniac
05.07.19
✎
23:35
|
(23) давно не давно есть - а все с костылями!
|
|||
25
Maniac
05.07.19
✎
23:36
|
каждый новый случай какой то уникальный
|
|||
26
Maniac
05.07.19
✎
23:36
|
то что есть не более чем привые примеры которые еще напильником пилить и пилить
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |