爬取WallHeaven中的壁纸

2021-09-26 | 阅读：次
from selenium import webdriver
import time

def get_tags(num):
    if num < 1:
        num = 1
    url_main = "https://wallhaven.cc/toplist?page={}".format(num)
    browser = webdriver.Chrome(executable_path=r"D:\Documents\Desktop\Others\Tools\chromedriver_win32\chromedriver.exe")
    browser.get(url_main)
    elements = browser.find_elements_by_xpath('/html/body/main/div[1]/section/ul/li/figure/a')
    url_list = list()
    n = 0
    for element in elements:
        n+=1
        pic_tag = element
        pic_tag.click()
        windows = browser.window_handles
        browser.switch_to.window(windows[n]) 
        time.sleep(1.5)
        browser.find_elements_by_xpath('//*[@id="wallpaper"]')
        data_url = browser.find_element_by_xpath('//*[@id="wallpaper"]').get_attribute("src")
        print(data_url)
        url_list.append(data_url)
        browser.switch_to.window(windows[0]) 
    return url_list

def down_pic(url):
    try:
        browser = webdriver.Chrome(executable_path=r"D:\Documents\Desktop\Others\Tools\chromedriver_win32\chromedriver.exe")  
        name_ = "WallHeaven_pics\\" 
        with open(name_+url,'wb') as f:
            browser.get(url)
            time.sleep(2)
            f.write(browser.page_source)
            print('写入成功')
    except Exception as e:
        print(e)   

if __name__  == "__main__":

    pic_url_list = get_tags(1)
    with open(r"WallHeaven_pics\test.txt",'w')as file:
        for url in pic_url_list:
            file.write(url+"\n")
    for url in pic_url_list:
        down_pic(url)
MegaMU

MegaMU个人站

爬取WallHeaven中的壁纸

目录

WallHeaven的TopList

思路

最终版本