当我们点击下一题时网址会变荿:
这时p/后的数字由3变成了4,说明这个数字是页数再来,我们换一份试题:
这时第一个sectionid/后的数字由5014变成了5015说明这个数字是试题ID。这样┅来可以在脑海中想到如何把这些题目都下载下来了,使用两个循环语句第一层负责获取试题ID,第二层负责获取题目页数其中的请求地址可以这样写:
PS:更新原来有个更牛逼的html解析库BeautifulSoup,用它重新写了脚本感觉不错,不需要手动截取字符串了虽然…完成时间差不多