php中文网

python爬虫怎么获取图片

php中文网
如何使用 python 爬虫获取图片:导入 python 库 requests 和 pil;获取目标网站的图片 url;使用 http 请求获取图片的二进制数据;将图片数据保存到磁盘。

python爬虫怎么获取图片

如何使用 Python 爬虫获取图片

获取图片的步骤:

  1. 导入必要的 Python 库
  2. 找到目标网站并提取图片 URL
  3. 使用 HTTP 请求获取图片数据
  4. 保存图片文件

详细步骤:

1. 导入必要的 Python 库

立即学习“Python免费学习笔记(深入)”;

import requests
from PIL import Image

2. 找到目标网站并提取图片 URL

使用 requests 库访问目标网站并解析 HTML 代码以提取图片 URL。

response = requests.get("https://example.com/page-with-images")
soup = BeautifulSoup(response.text, "html.parser")
image_urls = [img['src'] for img in soup.find_all('img')]

3. 使用 HTTP 请求获取图片数据

使用 requests 库发出 HTTP 请求以获取每个图片的二进制数据。

for image_url in image_urls:
    image_response = requests.get(image_url)
    image_data = image_response.content

4. 保存图片文件

将二进制图片数据写入磁盘中一个新的文件。

with open("image.jpg", "wb") as f:
    f.write(image_data)

提示:

  • 使用 Image 库可以对图片进行进一步处理,例如调整大小或转换格式。
  • 对于需要身份验证的网站,需要提供凭据以获取图片。
  • 遵守网站的条款和服务,避免抓取受版权保护的图片。

以上就是python爬虫怎么获取图片的详细内容,更多请关注php中文网其它相关文章!