HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ПРОГРАММИРОВАНИЕ > Общие вопросы программирования
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #1  
Старый 22.10.2022, 16:39
Sanchez.
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами: 2670862

Репутация: 48


По умолчанию

пытаюсь через либу селениум спарсить текст, где написано кол-во ответов в теме



так как эта штука имеет тег dd, я пытаюсь ее спарсить



но почему-то мне выдает ошибку, якобы такого селектора нема на сайте

что делать
 
Ответить с цитированием

  #2  
Старый 22.10.2022, 16:41
purpleee
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами: 2599697

Репутация: 13
По умолчанию

Код показать не вариант?
 
Ответить с цитированием

  #3  
Старый 22.10.2022, 16:44
Sanchez.
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами: 2670862

Репутация: 48


По умолчанию

Цитата:
Сообщение от purpleee  

Код показать не вариант?
Код:





Код:
for k in blocks:
        title = k.find_element(By.CLASS_NAME, 'structItem-title')
        answers = k.find_element(By.CSS_SELECTOR, 'dd').text
        url = title.find_element(By.CSS_SELECTOR, 'a').get_attribute('href')
        title = title.text.replace('Исковое заявление', '').replace('ОС |', '').replace('OC |', '').replace('  ', '')
        date_create = k.find_element(By.CLASS_NAME, 'u-dt').text
        date_last_answer = k.find_element(By.CLASS_NAME, 'structItem-latestDate').text
        await message.answer(answers)




пж без хейта за говнокод
 
Ответить с цитированием

  #4  
Старый 22.10.2022, 16:52
purpleee
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами: 2599697

Репутация: 13
По умолчанию

Цитата:
Сообщение от Sanchez.  

Код:





Код:
for k in blocks:
        title = k.find_element(By.CLASS_NAME, 'structItem-title')
        answers = k.find_element(By.CSS_SELECTOR, 'dd').text
        url = title.find_element(By.CSS_SELECTOR, 'a').get_attribute('href')
        title = title.text.replace('Исковое заявление', '').replace('ОС |', '').replace('OC |', '').replace('  ', '')
        date_create = k.find_element(By.CLASS_NAME, 'u-dt').text
        date_last_answer = k.find_element(By.CLASS_NAME, 'structItem-latestDate').text
        await message.answer(answers)



пж без хейта за говнокод
Answers, url, date_create - верное показывает?
 
Ответить с цитированием

  #5  
Старый 22.10.2022, 16:54
Sanchez.
Постоянный
Регистрация: 18.04.2021
Сообщений: 704
С нами: 2670862

Репутация: 48


По умолчанию

Цитата:
Сообщение от purpleee  

Answers, url, date_create - верное показывает?
все верно показывает, кроме answers, там пустота

answers это то, о чем я писал в начале темы
 
Ответить с цитированием

  #6  
Старый 22.10.2022, 23:46
purpleee
Участник форума
Регистрация: 06.06.2021
Сообщений: 178
С нами: 2599697

Репутация: 13
По умолчанию

Цитата:
Сообщение от Sanchez.  

все верно показывает, кроме answers, там пустота

answers это то, о чем я писал в начале темы
Ну тогда скорее всего, на сайте имеется ещё одно поле, которое использует 'dd'. Я бы хотел посоветовать получить все элементы с 'dd' и уже отталкиваться от этого. Но в твоём варианте, лучшим выходом будет - искать данный элемент через XPATH (Тут есть немного инфы о нём(не реклама): https://selenium-python.readthedocs.io/locating-elements.html), Что бы получить XPATH данного элемента - нажми ПКМ - Копировать и выбери "Копировать XPATH"
 
Ответить с цитированием
Ответ





Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.