系统城装机大师 - 固镇县祥瑞电脑科技销售部宣传站!

当前位置:首页 > 脚本中心 > python > 详细页面

Python +Selenium解决图片验证码登录或注册问题(推荐)

时间:2020-02-09来源:系统城作者:电脑系统城

1. 解决思路

首先要获得这张验证码的图片,但是该图片一般都是用的js写的,不能够通过url进行下载。
解决方案:截图然后根据该图片的定位和长高,使用工具进行裁剪
裁剪完毕之后,使用工具解析该图片。

2. 代码实现

2.1 裁剪出验证码图片

裁剪图片需要使用 Pillow 库,进入pip包路径后输入安装命令pip install Pillow:
之前安装的时候忘记了截图,只能够截一张安装后的图片了 ╰(:з╰∠)_

安装完成后,代码实现方式如下:

 


 
  1. #coding=utf-8
  2. from selenium import webdriver
  3. import time
  4. from PIL import Image
  5. from selenium.webdriver.support.wait import WebDriverWait
  6. driver = webdriver.Chrome()
  7. # 进入该网站
  8. driver.get("http://www2.nmec.org.cn/wangbao/nme/sp/root/account/signup.html")
  9. # 能否在5s内找到验证码元素,能才继续
  10. if WebDriverWait(driver,5).until(lambdathe_driver:the_driver.find_element_by_id("CaptchaImg"), "查找不到该元素"):
  11. # 对于一次截屏无法到截到验证码的情况,需要滚动一段距离,然后验证码的y坐标也应该减去这段距离
  12. scroll = 500
  13. js = "document.documentElement.scrollTop='%s'" %scroll
  14. driver.execute_script(js)
  15. # 截下该网站的图片
  16. driver.get_screenshot_as_file("E:/Python_selenium_advance/Picture/full.png")
  17. # 获得这个图片元素
  18. img_ele = driver.find_element_by_id("CaptchaImg")
  19. # 得到该元素左上角的 x,y 坐标和右下角的 x,y 坐标
  20. left = img_ele.location.get('x')
  21. upper = img_ele.location.get('y') - 500
  22. right = left + img_ele.size.get('width')
  23. lower = upper + img_ele.size.get('height')
  24. # 打开之前的截图
  25. img = Image.open("E:/Python_selenium_advance/Picture/full.png")
  26. # 对截图进行裁剪,裁剪的范围为之前验证的左上角至右下角范围
  27. new_img = img.crop((left, upper, right, lower))
  28. # 裁剪完成之后保存到指定路径
  29. new_img.save("E:/Python_selenium_advance/Picture/croped.png")
  30.  
  31. time.sleep(2)
  32. driver.quit()
  33. else:
  34. print("找不到验证码元素")
  35.  

2.2 使用 图鉴 商用接口来识别验证码

接口介绍网址:http://www.ttshitu.com/docs/python.html#pageTitle

调用该接口直接使用网页上的接口文档就行,代码如下:

 


 
  1. import json
  2. import requests
  3. import base64
  4. from io import BytesIO
  5. from PIL import Image
  6. from sys import version_info
  7.  
  8. def base64_api(uname, pwd, softid, img):
  9. img = img.convert('RGB')
  10. buffered = BytesIO()
  11. img.save(buffered, format="JPEG")
  12. if version_info.major >= 3:
  13. b64 = str(base64.b64encode(buffered.getvalue()), encoding='utf-8')
  14. else:
  15. b64 = str(base64.b64encode(buffered.getvalue()))
  16. data = {"username": uname, "password": pwd, "softid": softid, "image": b64}
  17. result = json.loads(requests.post("http://api.ttshitu.com/base64", json=data).text)
  18. if result['success']:
  19. return result["data"]["result"]
  20. else:
  21. return result["message"]
  22. return ""

将其保存为一个单独的 analysis_captcha.py ,然后再导入该方法,直接使用即可:

 


 
  1. from analysis_captcha import base64_api
  2.  
  3. def analysis_captcha(filename):
  4. '''
  5. 使用 图鉴 商用接口来识别指定位置的验证码图片
  6. :param filename: 验证码图片位置
  7. :return : 验证码文本
  8. '''
  9. img_path = filename
  10. img = Image.open(img_path)
  11. result = base64_api(uname='kaibin', pwd='******', softid='4545454', img=img)
  12. return result

验证码识别可能会出错,到时候再点击验证码图片换一张,然后重来即可。

总结

以上所述是小编给大家介绍的Python +Selenium实现图片验证码登录或注册问题,希望对大家有所帮助!

分享到:

相关信息

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载