freeBuf
主站

分类

漏洞 工具 极客 Web安全 系统安全 网络安全 无线安全 设备/客户端安全 数据安全 安全管理 企业安全 工控安全

特色

头条 人物志 活动 视频 观点 招聘 报告 资讯 区块链安全 标准与合规 容器安全 公开课

点我创作

试试在FreeBuf发布您的第一篇文章 让安全圈留下您的足迹
我知道了

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

Evine:一款功能强大的交互式命令行Web爬虫
Alpha_h4ck 2020-08-10 01:38:16 387091

Evine

Evine是一款功能强大的我交互式命令行Web爬虫,该工具基于Golang开发,并且实现了一个简单且快速的交互式Web爬虫和数据搜索工具。对于大范围扫描任务来说,Evine允许研究人员通过命令行接口来完成元数据和其他数据的提取、数据挖掘、网络侦察和测试任务。

工具安装

注意事项:该项目的正常运行需要Golang 1.13.x环境。

预构建源码

如果广大研究人员需要使用预构建的Evine源码,可以直接访问该项目GitHub库的Release页面来直接获取。

源码安装

go get github.com/saeeddhqan/evine

"$GOPATH/bin/evine" -h

通过GitHub库安装

git clone https://github.com/saeeddhqan/evine.git

cd evine

go build .

mv evine /usr/local/bin

evine --help

工具命令&使用

快捷键

描述

Enter

运行爬虫(URL视图)

Enter

显示响应信息

Tab

切换下一个视图

Ctrl+Space

运行爬虫

Ctrl+S

保存响应信息

Ctrl+Z

工具退出

Ctrl+R

回复默认值

Ctrl+Q

关闭响应存储视图

下列命令可以显示工具的帮助信息:

evine -h

“-url”参数用于指定工具待爬取的URL地址:

evine -url toscrape.com

“-url-exclude string”参数可以允许用户通过正则表达式来排除待匹配的URL地址:

evine -url-exclude ?id=

“-domain-exclude string”参数可以指定需要排除的多个域名,参数值以逗号分隔,默认为root域名:

evine -domain-exclude host1.tld,host2.tld

“-code-exclude string”参数可以指定需要排除的HTTP状态码,以“|”分隔,默认为“.*”:

evine -code-exclude 200,201

“-delay int”参数可以设置每个请求之间的休眠时间,单位为毫秒:

evine -delay 300

“-depth”参数可以指定爬虫的搜索深度,默认为1:

evine -depth 2

“-thread int”参数可以指定解析的并发线程数量,默认为5:

evine -thread 10

“-header”参数可以设置每个请求的HTTP Header:

evine -header KEY: VALUE\nKEY1: VALUE1

“-proxy string”参数用于指定代理地址:

evine -proxy http://1.1.1.1:8080

“-scheme string”设置请求发送模式:

evine -scheme http

“-timeout int”参数用于指定超时时间,默认为10秒:

evine -timeout 15

“-keys string”参数可指定搜索内容,支持邮件、URL、电话、css、cdn、dns、脚本或文件后缀等等:

evine -keys urls,pdf,txt

“-regex string”参数允许用户针对页面内容指定搜索正则式:

evine -regex 'User.+'

“-max-regex int”参数指定正则搜索的最大结果数量,默认为1000:

evine -max-regex -1

“-robots”参数用于指定目标URL的robots.txt,并将其当作种子使用:

evine -robots

“-sitemap”参数用于指定目标URL的sitemap.xml,并将其当作种子使用:

evine -sitemap

工具运行截图

工具演示视频

视频地址:【点我观看

项目地址

Evine:【GitHub传送门

# web安全 # 爬虫 # 网络爬虫
免责声明
1.一般免责声明:本文所提供的技术信息仅供参考,不构成任何专业建议。读者应根据自身情况谨慎使用且应遵守《中华人民共和国网络安全法》,作者及发布平台不对因使用本文信息而导致的任何直接或间接责任或损失负责。
2. 适用性声明:文中技术内容可能不适用于所有情况或系统,在实际应用前请充分测试和评估。若因使用不当造成的任何问题,相关方不承担责任。
3. 更新声明:技术发展迅速,文章内容可能存在滞后性。读者需自行判断信息的时效性,因依据过时内容产生的后果,作者及发布平台不承担责任。
本文为 Alpha_h4ck 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
渗透实战优质工具
红队必备渗透工具
冷兵器
工具人
Alpha_h4ck LV.10
好好学习,天天向上
  • 2359 文章数
  • 1022 关注者
Tetragon:一款基于eBPF的运行时环境安全监控工具
2025-01-21
DroneXtract:一款针对无人机的网络安全数字取证工具
2025-01-21
CNAPPgoat:一款针对云环境的安全实践靶场
2025-01-21
文章目录