基于网络的 Windows 聚焦(Spotlight)爬虫

10/7, 2017
Cover image of 基于网络的 Windows 聚焦(Spotlight)爬虫

对哒!题图就是光圈科技 _(:3 」∠ )_

标题不知道怎么写才能表意明确一些,也就是爬取 Windows聚焦 API 的爬虫吧。

个人感觉 Windows 聚焦的图片更好看一点。

import requests
import json
import os
import hashlib

JSON_URL = "https://arc.msn.com/v3/Delivery/Cache?&pid=279978&fmt=json&ctry=US&lc=en-US&pl=en-US"

def main():
    img_json = requests.get(JSON_URL, headers={'User-Agent': "WindowsShellClient/9.0.40929.0 (Windows)"}).json()
    for img_order in range(len(img_json['batchrsp']['itemorder']) - 1):
        url = json.loads(img_json['batchrsp']['items'][img_order]['item'])["ad"]["image_fullscreen_001_landscape"]["u"]
        img_binary = requests.get(url).content
        file_obj = open(
            os.path.join(
                os.path.split(
                    os.path.realpath(__file__)
                    )[0],
                hashlib.md5(img_binary).hexdigest() + '.jpg'
                ),
            'wb'
            )
        file_obj.write(img_binary)

    return 0

if __name__ == "__main__":
    main()

另外咋感觉下载的比在锁屏上更丑了呢?

已知问题:JSON 没有包含所有的图片,可能需要 for 循环获取 JSON

等有空做一个 API 吧