freeBuf
主站

分类

云安全 AI安全 开发安全 终端安全 数据安全 Web安全 基础安全 企业安全 关基安全 移动安全 系统安全 其他安全

特色

热点 工具 漏洞 人物志 活动 安全招聘 攻防演练 政策法规

点我创作

试试在FreeBuf发布您的第一篇文章 让安全圈留下您的足迹
我知道了

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

ScrapPY:一款功能强大的文档数据爬取和字典生成工具
Alpha_h4ck 2023-08-10 14:35:16 239435

关于ScrapPY

ScrapPY是一款功能强大的文档数据爬取和字典生成工具,该工具基于Python开发,可以帮助广大研究人员抓取手册、文档和其他敏感PDF,以生成安全工具可以直接使用的有针对性的字典列表来执行暴力破解、强制浏览和字典攻击。

ScrapPY可以执行词频、熵和元数据分析,并可以在全输出模式下运行,为有针对性的攻击创建自定义字典列表。该工具可以通过深入分析,发现潜在密码或隐藏目录的关键字和短语,生成可读的文本文件,并输出到Hydra、Dirb和Nmap等工具。

简而言之,在ScrapPY的帮助下,广大研究人员能够快速实现初始访问、漏洞扫描和横向移动。

工具安装

由于该工具基于Python 3开发,因此我们首先需要在本地设备上安装并配置好Python 3环境。接下来,广大研究人员可以使用下列命令将该项目源码克隆至本地:

$ mkdir ScrapPY

$ cd ScrapPY/

$ sudo git clone https://github.com/RoseSecurity/ScrapPY.git

然后切换到项目目录中,使用pip 3命令和项目提供的requirements.txt文件安装该工具所需的其他依赖组件:

$ pip3 install -r requirements.txt

工具使用

usage: ScrapPY.py [-h] [-f FILE] [-m {word-frequency,full,metadata,entropy}] [-o OUTPUT]

输出文档元数据:

$ python3 ScrapPY.py -f example.pdf -m metadata

将前100个常用单词输出到名为Top_100_Keywords.txt的文件中:

$ python3 ScrapPY.py -f example.pdf -m word-frequency -o Top_100_Keywords.txt

将所有的关键词输出到默认的ScrapPY.txt文件中:

$ python3 ScrapPY.py -f example.pdf

将前100个熵最高的单词输出:

$ python3 ScrapPY.py -f example.pdf -m entropy

ScrapPY输出结果:

# ScrapPY outputs the ScrapPY.txt file or specified name file to the directory in which the tool was ran. To view the first fifty lines of the file, run this command:

 

$ head -50 ScrapPY.txt

 

# To see how many words were generated, run this command:

 

$ wc -l ScrapPY.txt

与其他安全工具集成

该工具可以轻松与例如Dirb之类的其他安全工具进行集成,以加快发现隐藏子目录的过程:

root@RoseSecurity:~# dirb http://192.168.1.123/ /root/ScrapPY/ScrapPY.txt

 

-----------------

DIRB v2.21

By The Dark Raver

-----------------

 

START_TIME: Fri May 16 13:41:45 2014

URL_BASE: http://192.168.1.123/

WORDLIST_FILES: /root/ScrapPY/ScrapPY.txt

 

-----------------

 

GENERATED WORDS: 4592

 

---- Scanning URL: http://192.168.1.123/ ----

==> DIRECTORY: http://192.168.1.123/vi/

+ http://192.168.1.123/programming (CODE:200|SIZE:2726)

+ http://192.168.1.123/s7-logic/ (CODE:403|SIZE:1122)

==> DIRECTORY: http://192.168.1.123/config/

==> DIRECTORY: http://192.168.1.123/docs/

==> DIRECTORY: http://192.168.1.123/external/

将ScrapPY与Hydra一起使用可以执行高级暴力破解攻击:

root@RoseSecurity:~# hydra -l root -P /root/ScrapPY/ScrapPY.txt -t 6 ssh://192.168.1.123

Hydra v7.6 (c)2013 by van Hauser/THC & David Maciejak - for legal purposes only

 

Hydra (http://www.thc.org/thc-hydra) starting at 2014-05-19 07:53:33

[DATA] 6 tasks, 1 server, 1003 login tries (l:1/p:1003), ~167 tries per task

[DATA] attacking service ssh on port 22

使用ScrapPY生成的字典与Nmap脚本结合使用:

nmap -p445 --script smb-brute.nse --script-args userdb=users.txt,passdb=ScrapPY.txt 192.168.1.123

工具使用演示

演示视频:【点我观看

项目地址

ScrapPY:【GitHub传送门

# 暴力破解 # 字典生成 # 敏感数据 # PDF # 文档安全
本文为 Alpha_h4ck 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
Alpha_h4ck LV.10
好好学习,天天向上
  • 2359 文章数
  • 1024 关注者
Tetragon:一款基于eBPF的运行时环境安全监控工具
2025-01-21
DroneXtract:一款针对无人机的网络安全数字取证工具
2025-01-21
CNAPPgoat:一款针对云环境的安全实践靶场
2025-01-21
文章目录