【上分必备】——谷歌爬虫脚本

山屿云   ·   发表于 2021-09-19 00:07:57   ·   安全工具

这是一款由自主开发的谷歌爬虫脚本,适用于SRC刷分的同学


这里先把源码奉上,方便大佬们研究

使用教程——————此爬虫适用于请求不到页面源码数据的情况下使用

【一】:这款爬虫基于selenium自动化爬取,首先需要下载安装对应版本的chromedriver.exe

  • chromedriver.exe [点击可以直接跳转哦]

  • 首先在这里查看自己谷歌浏览器的版本


  • 再下载自己比较相似的驱动

  • 点进去之后发现没有win_64版本,不要担心,直接下载32位的就行

  • 将脚本和驱动放在同一文件夹下即可

【二】安装对应的第三方库

  • 这里需要安装三个库

  • selenium,lxml,urllib这三个库
  • pip install selenium 其它的也这么安装就行

【三】用镜像站的一些问题

  • 如果你能直接访问谷歌的话,代码就不用改了,直接拿去用就行

  • 问题来了,访问不了怎么办,可以用学院导航的镜像站,这里代码需要做几个小改动了


  • 这里改为镜像站的地址https://g.luciaz.me/

  • 这里则改成'https://g.luciaz.me/search?q='+self.google_grammar+'&start=20'

【四】注意事项!

  • 由于谷歌的特殊性,爬取数据时需要将JS禁用chrome://settings/content/javascript

  • 关闭之后则需要按S进行爬取数据的操作【区分大小写】


  • 无重复就代表OK了

  • 到此基本结束,等待爬取完毕即可!


我这边是用的镜像站给做的演示,源代码是没有访问镜像站,而是直接访问的谷歌主站的,所以无法翻越的同学,按照我的演示用镜像站即可!

  • 此脚本爬取url,再配合xray,sqlmap等漏扫工具使用,别说1000分,10000分都可以给你刷上去!

下载地址:

  • https://github.com/Se37/HACK/tree/main/Google%E7%88%AC%E8%99%AB

都看到这了,点个赞再走吧
用户名金币积分时间理由
yyz1988yyz 5.00 0 2021-10-11 15:03:26 一个受益终生的帖子~~
没勇气先生 5.00 0 2021-09-23 15:03:51 一个受益终生的帖子~~
杳若 5.00 0 2021-09-22 21:09:38 一个受益终生的帖子~~
Track-手电筒 15.00 0 2021-09-22 14:02:47 活动额外奖赏
Track-手电筒 40.00 0 2021-09-22 14:02:20 一个受益终生的帖子~~

打赏我,让我更有动力~

20 Reply   |  Until 5天前 | 353 View

风中追风
发表于 25天前

赶紧拿去试试

评论列表

  • 加载数据中...

编写评论内容

13576510620
发表于 24天前

1

评论列表

  • 加载数据中...

编写评论内容

qwerdf1234
发表于 24天前

学习学习

评论列表

  • 加载数据中...

编写评论内容

horton98
发表于 24天前

拿来把你(!>.<!)

评论列表

  • 加载数据中...

编写评论内容

没勇气先生
发表于 23天前

谢谢大佬!!

评论列表

  • 加载数据中...

编写评论内容

qwerdf1234
发表于 23天前

大佬,运行了报错
Traceback (most recent call last):
File “D:/PyCharm/whoami/Google_crawler.py”, line 79, in <module>
google_crawler.run()
File “D:/PyCharm/whoami/Google_crawler.py”, line 67, in run
self.Crawl_data()
File “D:/PyCharm/whoami/Google_crawler.py”, line 54, in Crawl_data
next_click = self.Analytical_data(page_tree)
File “D:/PyCharm/whoami/Google_crawler.py”, line 42, in Analytical_data
return self.next_click
AttributeError: ‘Google_crawler’ object has no attribute ‘next_click’

评论列表

  • 加载数据中...

编写评论内容

mirck
发表于 23天前

666666666666

评论列表

  • 加载数据中...

编写评论内容

山屿云
发表于 23天前

谷歌脚本大家下载多线程并发版,在我GitHub上面,没有JS前缀的就是多线程并发版

评论列表

  • 加载数据中...

编写评论内容

柠檬
发表于 23天前

66666

评论列表

  • 加载数据中...

编写评论内容

baolin
发表于 22天前

学习

评论列表

  • 加载数据中...

编写评论内容

巴伯舒特
发表于 22天前

6

评论列表

  • 加载数据中...

编写评论内容

天使v
发表于 22天前

怎么使用呀,大佬

评论列表

  • 加载数据中...

编写评论内容

天使v
发表于 22天前

安装 urllib库 提示找不到这个库

评论列表

  • 加载数据中...

编写评论内容

天使v
发表于 21天前

大佬,win10能用,linux用不了,需要修改哪个才能用

评论列表

  • 加载数据中...

编写评论内容

浩琦很好奇
发表于 20天前

666

评论列表

  • 加载数据中...

编写评论内容

苟子狗子钩子
发表于 20天前

太对了哥 哥太对 古德古德

评论列表

  • 加载数据中...

编写评论内容

cmjlove
发表于 17天前

999999

评论列表

  • 加载数据中...

编写评论内容

davion
发表于 13天前

大佬牛呀

评论列表

  • 加载数据中...

编写评论内容

txandwlb
发表于 9天前

1

评论列表

  • 加载数据中...

编写评论内容

待續
发表于 5天前

1

评论列表

  • 加载数据中...

编写评论内容
LoginCan Publish Content
返回顶部 投诉反馈

掌控者 © 2016 - 2021. All Rights Reserved. 掌控者

Powered by 掌控者