在 python 2 爬虫中,通过修改套接字选项、使用 requests 库、使用 urllib 库或使用 socks 代理,可以访问特定 ip。
如何在 Python 2 爬虫中访问特定 IP
直接修改套接字选项
-
使用 requests 库:
import requests # 设置代理 IP proxy_ip = '1.2.3.4' # 修改代理设置 proxies = { 'http': 'http://{proxy_ip}:8080', 'https': 'https://{proxy_ip}:8080', } # 访问目标 URL response = requests.get('https://example.com', proxies=proxies)
-
使用 urllib 库:
立即学习“Python免费学习笔记(深入)”;
import urllib2 # 设置代理处理程序 proxy_handler = urllib2.ProxyHandler({'http': proxy_ip}) # 创建带有代理处理程序的打开器 opener = urllib2.build_opener(proxy_handler) # 访问目标 URL response = opener.open('https://example.com')
使用 SOCKS 代理
-
使用 socket 库:
import socket # 设置 SOCKS 代理 socks_proxy = ('1.2.3.4', 1080) # 创建带有 SOCKS 代理的套接字 sock = socket.socket() sock.setproxy(socket.PROXY_TYPE_SOCKS5, *socks_proxy) # 连接到目标 URL sock.connect(('example.com', 80))
-
使用 socks 库:
import socks # 设置 SOCKS 代理 socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, '1.2.3.4', 1080) # 访问目标 URL sock = socks.socksocket() sock.connect(('example.com', 80))
以上就是怎么让Python2爬虫访问特定的IP的详细内容,更多请关注php中文网其它相关文章!
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系 yyfuon@163.com