Имя: Пароль:
1C
 
1С ЧтениеHTML получить заголовок страницы
0 Maniac
 
05.07.19
18:51
Есть куча ссылок. нуно по ссылкам получить по каждой заголовок страницы. и чтобы это работало быстро
1 dubolom
 
05.07.19
18:53
Если заголовок в буквальном смысле, то читай по тэгу title и будет тебе счастье.
2 Maniac
 
05.07.19
19:04
Чота не работает вообще

Если ЗначениеЗаполнено(АдресСтраницы) И Найти(АдресСтраницы,"http") > 0 Тогда
Соединение = Новый HTTPСоединение(АдресСайта);
Запрос = Новый HTTPЗапрос(АдресСтраницы);
Ответ = Соединение.Получить(Запрос);
Если Ответ.КодСостояния = 200 Тогда
Значение = Ответ.Заголовки;
КонецЕсли;
КонецЕсли;
3 Maniac
 
05.07.19
19:06
и очень долго. 60 строк 3 минуты
4 Maniac
 
05.07.19
19:10
ошибок не выдает. но и ничего не возвращает. и долго
5 Garykom
 
гуру
05.07.19
19:16
А если заголовок меняется через JS ?
6 Maniac
 
05.07.19
19:24
короче соединения работают. возвраты есть. но работает все пипец как долго.
видимо читает каждую страницу целиком... а нужно только заголовки.
7 dubolom
 
05.07.19
19:25
(6) Как ты себе представляешь чтение только заголовка?
8 Maniac
 
05.07.19
19:31
(7) да также как например 1С умеет заголовки писем почты читать
9 Maniac
 
05.07.19
19:32
я думал это возможно..
10 dubolom
 
05.07.19
19:36
(9) У письма почты заголовок - отдельное поле. Он так и хранится.
А из кода страницы тебе надо его самостоятельно выковыривать. Никто заранее не скажет, где он там.
11 Garykom
 
гуру
05.07.19
19:37
Мне интереснее зачем нужны заголовки страницы и не путаем ли с HTTP Headers ))
12 Garykom
 
гуру
05.07.19
19:39
Title из head из body хрен получишь правильный полностью не загрузив страницу и не дав отработать javascript коду.

А вот Headers можно отдельно от тела прочитать.
13 Maniac
 
05.07.19
19:40
(11) а как его в 1С получить?
14 Garykom
 
гуру
05.07.19
19:44
(13) Ты объясни науйя?
15 Maniac
 
05.07.19
19:45
на каждо странице товар. заголовок страницы наименование товара. тупо наименования получить вместо ссылок
16 Garykom
 
гуру
05.07.19
19:46
(15) Проанализируй как страницы строятся, может есть некий api который можно заюзать и получить готовые данные в json.
17 Garykom
 
гуру
05.07.19
19:48
(16) Но если там PHP без JS то облом конечно и страницы на сервере формируются.

В общем случае пиши многопоточный браузер и использую его.
18 Maniac
 
05.07.19
19:50
да зараза там именно PHP
19 Maniac
 
05.07.19
19:53
/index.phpproductID=3803
/index.phpproductID=3771
/index.phpproductID=5678
/index.phpproductID=5677
/index.phpproductID=3783
20 dubolom
 
05.07.19
20:13
(18) Нельзя как-нибудь договориться, чтобы данные присылались в более удобном виде?
21 Maniac
 
05.07.19
20:17
(20) почти никто не меняет свои кривые прайсы. многократно об этом говорю клиентам.

Ладно решили сделать чтобы чтение возвращало текст ячеек и ссылку одновременно. буду разбирать текстовую строку
22 Maniac
 
05.07.19
20:18
хотя парсинг страниц тоже тема нужная.
23 Garykom
 
гуру
05.07.19
20:38
(22) Парсинг страниц уже давно освоенная тема и куча решений есть как платных так и бесплатных.
В 1С остается только готовые данные загружать из файлов текстовых или табличных или из базы.
24 Maniac
 
05.07.19
23:35
(23) давно не давно есть - а все с костылями!
25 Maniac
 
05.07.19
23:36
каждый новый случай какой то уникальный
26 Maniac
 
05.07.19
23:36
то что есть не более чем привые примеры которые еще напильником пилить и пилить
AdBlock убивает бесплатный контент. 1Сергей