 |

22.10.2022, 16:39
|
|
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами:
2670862
Репутация:
48
|
|
пытаюсь через либу селениум спарсить текст, где написано кол-во ответов в теме
так как эта штука имеет тег dd, я пытаюсь ее спарсить
но почему-то мне выдает ошибку, якобы такого селектора нема на сайте
что делать
|
|
|

22.10.2022, 16:41
|
|
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами:
2599697
Репутация:
13
|
|
Код показать не вариант?
|
|
|

22.10.2022, 16:44
|
|
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами:
2670862
Репутация:
48
|
|
Сообщение от purpleee
Код показать не вариант?
Код:
Код:
for k in blocks:
title = k.find_element(By.CLASS_NAME, 'structItem-title')
answers = k.find_element(By.CSS_SELECTOR, 'dd').text
url = title.find_element(By.CSS_SELECTOR, 'a').get_attribute('href')
title = title.text.replace('Исковое заявление', '').replace('ОС |', '').replace('OC |', '').replace(' ', '')
date_create = k.find_element(By.CLASS_NAME, 'u-dt').text
date_last_answer = k.find_element(By.CLASS_NAME, 'structItem-latestDate').text
await message.answer(answers)
пж без хейта за говнокод
|
|
|

22.10.2022, 16:52
|
|
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами:
2599697
Репутация:
13
|
|
Сообщение от Sanchez.
Код:
Код:
for k in blocks:
title = k.find_element(By.CLASS_NAME, 'structItem-title')
answers = k.find_element(By.CSS_SELECTOR, 'dd').text
url = title.find_element(By.CSS_SELECTOR, 'a').get_attribute('href')
title = title.text.replace('Исковое заявление', '').replace('ОС |', '').replace('OC |', '').replace(' ', '')
date_create = k.find_element(By.CLASS_NAME, 'u-dt').text
date_last_answer = k.find_element(By.CLASS_NAME, 'structItem-latestDate').text
await message.answer(answers)
пж без хейта за говнокод
Answers, url, date_create - верное показывает?
|
|
|

22.10.2022, 16:54
|
|
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами:
2670862
Репутация:
48
|
|
Сообщение от purpleee
Answers, url, date_create - верное показывает?
все верно показывает, кроме answers, там пустота
answers это то, о чем я писал в начале темы
|
|
|

22.10.2022, 23:46
|
|
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами:
2599697
Репутация:
13
|
|
Сообщение от Sanchez.
все верно показывает, кроме answers, там пустота
answers это то, о чем я писал в начале темы
Ну тогда скорее всего, на сайте имеется ещё одно поле, которое использует 'dd'. Я бы хотел посоветовать получить все элементы с 'dd' и уже отталкиваться от этого. Но в твоём варианте, лучшим выходом будет - искать данный элемент через XPATH (Тут есть немного инфы о нём(не реклама): https://selenium-python.readthedocs.io/locating-elements.html), Что бы получить XPATH данного элемента - нажми ПКМ - Копировать и выбери "Копировать XPATH"
|
|
|
|
 |
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|