Stack Overflow на русском Asked by Seavegen on November 7, 2021
Python selenium. источник парсинга tgstat.ru
Конкретно с осями путей xpath
как спарсить все в списке тэг <а>, точнее имена которые вылазят, нужна ссылка.
Есть такой вариант
/html/body/div[2]/div/div/div[2]/div/div/div/div[1]/div[1]/div/div[2]/div[2]
но он не прокатит, не валидный и плохо так писать div[1]div[2]
и т.д
мне надо например ".//div[@class=a???????]"
Я не понял какие конкретно ссылки вам нужны, но как то так
/html/body//div/a/@href
или так
/html/body/div/div/div/div/div/div/div/div/div/div/div/div/a/@href
и вариант три текст из ссылок или ключи как будет угодно
/html/body/div/div/div/div/div/div/div/div/div/div/div/div/a/text()
Сам код чтоб проще понять было
from selenium import webdriver
from time import sleep
driver = webdriver.Chrome(r'C:\webdriverchromedriver.exe')
driver.get('https://tgstat.ru/')
sleep(2)
element = driver.find_elements_by_xpath('/html/body/div[2]/div/div/div[2]/div/div/div/div/div[1]/div/div[2]/div[2]/a')
# Вытащит текст ссылок
# a = [ii.text for ii in element]
# print(a)
# Ссылки
a = [ii.get_attribute('href') for ii in element]
print(a)
Answered by Борис Бондарев on November 7, 2021
Get help from others!
Recent Questions
Recent Answers
© 2024 TransWikia.com. All rights reserved. Sites we Love: PCI Database, UKBizDB, Menu Kuliner, Sharing RPP