互联网图片抓取

发布时间 2023-11-18 19:35:51作者: 枫飘过的天1

1.互联网图片抓取
  说明:图片、音频、视频在计算机中以二进制方式存储
  实现:找到所在图片的URL地址、想图片URL地址发送请求,获取二进制响应内容(bytes)、
  正常打开文件,将响应内容以wb方式保存到本地
requests模块:
html = requests.get(url=url,headers=headers).text
  响应对象(res)属性:
res.text: 获取响应对象内容-字符串
res.content: 获取响应对象内容-bytes
res.status_code: 获取http响应码
res.url: 返回实际数据的URL地址

2.爬取图片到本地
   思路:一定要找到图片的真实URL地址
import requests
from fake_useragent import UserAgent

url = 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fwx1.sinaimg.cn%2Fmw690%2F82f2895bgy1h5le6cuiaxj20j60ooq6d.jpg&refer=http%3A%2F%2Fwx1.sinaimg.cn&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1664773567&t=86fbc94c5d3f5c9798fd47c9115ffaa7'
headers = { 'User-Agent': UserAgent().random }

# 一定使用content属性,因为图片以二进制方式存储的
html = requests.get(url=url, headers=headers).content

保存图片到本地
with open('girl.jpg', 'wb') as f:
f.write(html)