基于python的自动续借图书集

Coquettish

发布日期: 2019-05-03 20:27:55 浏览量: 697
评分:
star star star star star star star star star star
*转载请注明来自write-bug.com
  • Python 2.7

  • IDE Pycharm 5.0.3

  • Firefox浏览器:47.0.1

目的

自动实现图书馆借书籍的书单截图,并一键续约全部书籍,我登录校图书馆的目的无非就这两个咯,我才不去预约没有的书呢—反正没有一次预约成功过0.0

实现方法

Selenium+PhantonJS自动化脚本执行

实现方案

  • 采用Firefox浏览器进行模拟登录,这个比较酷炫把,可以看着浏览器自己在那边跑,欢快的停不下来。。。

  • 调用PhantomJS.exe,不展现浏览器的运作,直接在cmd窗口跑(用pyinstaller打包成exe后有cmd窗)

方案实现过程

采用Selenium+Firefox方式:

先来个最后成品动图:

然后来程序代码—主模块(被调用模块,也可单独执行)

  1. # -*- coding: utf-8 -*-
  2. from selenium import webdriver
  3. import time
  4. #shift-tab多行缩进(左)
  5. print 'please wait...system loading...'
  6. #reload(sys)
  7. PostUrl = "http://lib.hrbeu.edu.cn/#"
  8. driver=webdriver.Firefox()#用浏览器实现访问
  9. #driver = webdriver.PhantomJS(executable_path="phantomjs.exe")#没用浏览器
  10. driver.get(PostUrl)
  11. elem_user = driver.find_element_by_name('number')
  12. elem_psw = driver.find_element_by_name('passwd')
  13. #选择我的图书馆,点击后才能看到输入账号密码
  14. click_first = driver.find_element_by_xpath("//ul[@id='imgmenu']/li[4]")
  15. click_first.click()
  16. elem_user.send_keys('S315080092')
  17. elem_psw.send_keys('xxxxxxxxx')
  18. #点击登录
  19. click_second = driver.find_element_by_name('submit')
  20. click_second.click()
  21. print 'log in...'
  22. time.sleep(1)
  23. #定位新页面元素,将handle重定位即可
  24. driver.switch_to_window(driver.window_handles[1])#定位弹出的第一个页面,也就是当前页面
  25. #sreach_window = driver.current_window_handle #此行代码用来定位当前页面#不可行
  26. driver.find_element_by_xpath("/html/body/div[4]/div/div/ul/li[3]/a").click()
  27. driver.save_screenshot('image_booklist_firefox.jpg')
  28. print 'turning to the mylib...'
  29. time.sleep(1)#搜索结果页面停留片刻
  30. #driver.switch_to_window(driver.window_handles[1])
  31. #没有跳出新窗口就是在同一页面的!
  32. for i in range(2,30):#这里限定是29本书,一般我们都不会借那么多书的
  33. try:
  34. #driver.find_element_by_xpath("/html/body/div[4]/div/div[2]/table/tbody/%s/td[8]/div/input"%('tr[%s]'%i)).click()#下面的比较好理解
  35. driver.find_element_by_xpath("/html/body/div[4]/div/div[2]/table/tbody/tr[%s]/td[8]/div/input"%i).click()
  36. print 'renewing...the %d\'th book renewed '%(i-1)
  37. except:
  38. print '%d books have been renewed !'%(i-2)
  39. a=i-2
  40. time.sleep(4)
  41. driver.save_screenshot('image_done_firefox.jpg')
  42. print 'the picture is saving...'
  43. print 'done!'
  44. break
  45. time.sleep(1)
  46. driver.close()
  47. driver.quit()

调用上述模块的主执行函数(其实就是为了封装上述模块而已,封装成gui界面,为后续的打包做准备)

  1. # -*- coding: utf-8 -*-
  2. from Tkinter import *
  3. import tkMessageBox#执行gui窗
  4. import time
  5. def check_renew():
  6. print 'checking and renewing...'
  7. tkMessageBox.showinfo('提示','即将开启装逼模式,请确认已安装Firefox浏览器')
  8. #time.sleep(4)
  9. import Selenium_PhantomJS_lib_firefox
  10. tkMessageBox.showinfo('提示','已执行成功!\n(截图已保存于程序目录)')
  11. #主框架部分
  12. root = Tk()
  13. root.title('图书馆查询续约(哈尔滨工程大学专版))
  14. label=Label(root,text=' 图书馆一键查询与续约Firefox版本 (✪ω✪) ')
  15. button_check=Button(root,text='查询书单并续期━Σ(゚Д゚|||)━开启Firefox有形装逼模式 ',background='green',command=check_renew)
  16. label.pack()
  17. button_check.pack()
  18. root.mainloop()

实现效果如图所示:

程序中的注释相信可以把程序解释的差不多了把。。。。

遇到问题和解决方案

  • selenium对新页面元素无法定位抛出
    1. NoSuchElementException: Message: Unable to locate element

错误,导致无法进行对新的界面进行点击操作。

解决方案:专门写了一篇博客,请见

解决Selenium弹出新页面无法定位元素问题(Unable to locate element)

  • 对打包后的版本无法运行,抛出如图错误Errno 10054

解决方案:暂未找到解决方案,exe文件不可用,程序执行可用

  • 对未知书籍数目重复点击操作,代码冗余

解决方案:因为点击续借按钮的元素每个都不一样,通过观察可知其中的规律,之后就知道在那进行修改,但是,光修改的话,十本书就有十个相似的代码串,很不pythontic,所以,采用格式化字符串的方式进行for循环带入,方便又漂亮!

  • 使用了1中的解决方案还是不能定位元素

可能查找元素的方式出现错误,我现在的使用方法是采用xpath的方式来找,比如说这样

  1. driver.find_element_by_xpath("/html/body/div[4]/div/div/ul/li[3]/a")

虽然看起来有点长,但是元素相当好找,而且定位很准,如果采用类似这种
driver.find_element_by_xpath("//ul[@id='imgmenu']/li[4]"),我现在还不能很好地驾驭,出错可能性有点大,下次要多进行尝试。

接下来实现方案二的构思:
调用PhantomJS.exe,不展现浏览器的运作,直接在cmd窗口跑(用pyinstaller打包成exe后有cmd窗)

方案实现过程

1. 效果

2. 代码

被调模块(可单独执行)

  1. # -*- coding: utf-8 -*-
  2. from selenium import webdriver
  3. import time
  4. import sys
  5. from PIL import Image
  6. #shift-tab多行缩进(左)
  7. print 'please wait...system loading...'
  8. reload(sys)
  9. PostUrl = "http://lib.hrbeu.edu.cn/#"
  10. driver = webdriver.PhantomJS(executable_path="phantomjs.exe")#没用浏览器
  11. driver.get(PostUrl)
  12. elem_user = driver.find_element_by_name('number')
  13. elem_psw = driver.find_element_by_name('passwd')
  14. #选择我的图书馆,点击后才能看到输入账号密码
  15. click_first = driver.find_element_by_xpath("//ul[@id='imgmenu']/li[4]")
  16. click_first.click()
  17. elem_user.send_keys('S315080092')
  18. elem_psw.send_keys('xxxxxxxx')
  19. #点击登录
  20. click_second = driver.find_element_by_name('submit')
  21. click_second.click()
  22. print 'log in...'
  23. time.sleep(1)
  24. #定位新页面元素,将handle重定位即可
  25. driver.switch_to_window(driver.window_handles[1])#定位弹出的第一个页面,也就是当前页面
  26. driver.find_element_by_xpath("/html/body/div[4]/div/div/ul/li[3]/a").click()
  27. driver.save_screenshot('image_booklist.jpg')
  28. print 'turning to the mylib...'
  29. time.sleep(1)#搜索结果页面停留片刻
  30. #driver.switch_to_window(driver.window_handles[1])
  31. #没有跳出新窗口就是在同一页面的!
  32. for i in range(2,30):#这里限定是29本书,一般我们都不会借那么多书的
  33. try:
  34. driver.find_element_by_xpath("/html/body/div[4]/div/div[2]/table/tbody/%s/td[8]/div/input"%('tr[%s]'%i)).click()
  35. print 'renewing...the %d\'th book renewed '%(i-1)
  36. except:
  37. print '%d books have been renewed !'%(i-2)
  38. a=i-2
  39. time.sleep(4)
  40. driver.save_screenshot('image_done.jpg')
  41. print 'the picture is opening...please wait...'
  42. break
  43. time.sleep(2)
  44. driver.close()
  45. driver.quit()
  46. def show_img():
  47. im_check=Image.open('image_booklist.jpg')
  48. im_check.show()
  49. im_done =Image.open('image_done.jpg')
  50. im_done.show()

然后是程序入口

  1. # -*- coding: utf-8 -*-
  2. from Tkinter import *
  3. import tkMessageBox
  4. def check_renew():
  5. print 'checking and renewing...'
  6. tkMessageBox.showinfo('提示','执行速度取决于网速和电脑,能等着就按"确定"\n(请允许phantomjs.exe访问网络)\nBTW 你现在按啥都不好使,程序照样执行(*゜Д゜)σ凸')
  7. from Selenium_PhantomJS_lib import show_img
  8. show_img()#show一下预约前和预约后截图,好确认
  9. tkMessageBox.showinfo('提示','已执行成功!\n(若没有弹出图片则请自行打开程序目录)')
  10. #主框架部分
  11. root = Tk()
  12. root.title('图书馆查询续约(哈尔滨工程大学专版)--by 哈士奇说喵')
  13. label=Label(root,text=' 图书馆一键查询与续约cmd版本 (✪ω✪) ')
  14. button_check=Button(root,text='查询书单并续期━Σ(゚Д゚|||)━开启cmd无形装逼模式 ',background='green',command=check_renew)
  15. label.pack()
  16. button_check.pack()
  17. root.mainloop()

之后启动的画面应该是这样的

最后完成的画面应该是这样的,截图,确认框,cmd窗口,一个都不少;

原理和上面并没有什么区别,只是调用了一个phantomjs.exe文件而已,实际上的处理都是这个exe在进行处理的,所以,在进行打包的时候,打包出来的exe需要和此文件在一个文件夹下才可以,就像这样

遇到问题和解决方案

  • 找不到执行文件,phantomjs.exe

解决方案:把phantomjs.exe添加到工作路径下,最方便的方法就是,你的工程在哪,直接添加到工程文件夹下就可以了

  • 截图的图片没有显示出来,或者提示”在禁用UAC时无法激活此应用“

解决方案:图片有没有显示,可以看有没有调用show方法,如果调用了,那在自己电脑测试肯定是没有问题的,我在测试别的电脑的时候遇到UAC问题,直接启用就可以了,一般没有问题的,如果不想麻烦启动,那就直接去工作文件夹下手动打开看,截图已保存在本地的工作路径下的。

最后

这个程序是可以打包在别的电脑进行运行的,不过账号和密码我都直接输在程序里面了,而且也只是我自己学校的专版,主要还是自己用,如果有哈尔滨工程大学的小伙伴想用,你只要自己改个账号密码参数就可以了,前提是你有完整的python开发环境。

上传的附件 cloud_download 基于python的自动续借图书馆书籍.zip ( 1.54mb, 24次下载 )
error_outline 下载需要11点积分

发送私信

童心未泯,是一件值得骄傲的事情

28
文章数
18
评论数
最近文章
eject