python爬虫怎么获取图片

php中文网 2024-10-15 11:02:03

如何使用 python 爬虫获取图片：导入 python 库 requests 和 pil；获取目标网站的图片 url；使用 http 请求获取图片的二进制数据；将图片数据保存到磁盘。

python爬虫怎么获取图片

如何使用 Python 爬虫获取图片

获取图片的步骤：

导入必要的 Python 库
找到目标网站并提取图片 URL
使用 HTTP 请求获取图片数据
保存图片文件

详细步骤：

1. 导入必要的 Python 库

立即学习“Python免费学习笔记（深入）”；

import requests
from PIL import Image

2. 找到目标网站并提取图片 URL

使用 requests 库访问目标网站并解析 HTML 代码以提取图片 URL。

response = requests.get("https://example.com/page-with-images")
soup = BeautifulSoup(response.text, "html.parser")
image_urls = [img['src'] for img in soup.find_all('img')]

3. 使用 HTTP 请求获取图片数据

使用 requests 库发出 HTTP 请求以获取每个图片的二进制数据。

for image_url in image_urls:
    image_response = requests.get(image_url)
    image_data = image_response.content

4. 保存图片文件

将二进制图片数据写入磁盘中一个新的文件。

with open("image.jpg", "wb") as f:
    f.write(image_data)

提示：

使用 Image 库可以对图片进行进一步处理，例如调整大小或转换格式。
对于需要身份验证的网站，需要提供凭据以获取图片。
遵守网站的条款和服务，避免抓取受版权保护的图片。

以上就是python爬虫怎么获取图片的详细内容，更多请关注php中文网其它相关文章！

本文地址： http://www.ipsmc.com/be/721.html