DeepSecrets：一款能够理解代码语义的代码敏感信息扫描工具

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序把安全装进口袋

工具

DeepSecrets：一款能够理解代码语义的代码敏感信息扫描工具

Alpha_h4ck 2024-01-06 16:30:09 170402

本文由 Alpha_h4ck 创作，已纳入「FreeBuf原创奖励计划」，未授权禁止转载

关于DeepSecrets

DeepSecrets是一款能够理解代码语义的代码敏感信息扫描工具，在该工具的帮助下，广大研究人员将能够更有效地扫描和分析代码中的敏感信息。

社区中很多现有的代码分析工具其实并不能够真正地“理解”代码，而是直接解析代码文本。DeepSecrets通过语义分析、危险变量检测和更有效的熵分析扩展了传统的基于正则表达式的代码搜索方法。DeepSecrets提供的代码理解功能支持500多种编程语言和代码格式，并通过词法分析和解析（SAST工具中常用的技术）实现其功能。

除此之外，DeepSecrets还引入了一种搜索敏感数据的新方法，即使用已知敏感信息的哈希值并直接在代码中找到对应的数据。

工具安装

由于该工具基于Python开发，因此我们首先需要在本地设备上安装并配置好Python环境。接下来，广大研究人员可以直接使用pip工具从GitHub下载最新版本的DeepSecrets源码：

$ pip install git+https://github.com/avito-tech/deepsecrets.git

或者直接从Pypi下载和安装DeepSecrets：

$ pip install deepsecrets

工具使用

执行扫描

下列命令即可直接对目标代码执行敏感数据扫描与分析：

$ deepsecrets --target-dir /path/to/your/code --outfile report.json

上述命令将会使用工具默认配置并针对“/path/to/your/code”路径下的代码执行敏感数据扫描，其中：

1、正则表达式检测使用的是工具内置的规则集；
2、语义检查负责执行变量检测和熵检查；

扫描生成的报告将存储到report.json文件中。

配置微调

运行下列命令即可查看工具帮助信息：

deepsecrets --help

我们还可以通过使用“--regex-rules”选项来指定使用自己的规则集，或使用“--excluded-paths”选项来排除不需要扫描的代码路径。

规则集构建

正则表达式

为正则表达式检测提供的内置规则集路径为“/deepsecrets/rules/regexes.json”，广大研究人员可以按照原有数据格式自行修改或创建自定义规则集。

敏感数据哈希

为正则表达式检测提供的规则集样例路径为“/deepsecrets/rules/regexes.json”，广大研究人员可以按照原有数据格式自行修改或创建自定义规则集。

许可证协议

本项目的开发与发布遵循MIT开源许可证协议。

项目地址

DeepSecrets：【GitHub传送门】

参考资料

https://hackernoon.com/modernizing-secrets-scanning-part-1-the-problem

# 代码审计 # 敏感信息 # 代码安全 # 敏感数据保护 # 敏感数据发现

免责声明

1.一般免责声明：本文所提供的技术信息仅供参考，不构成任何专业建议。读者应根据自身情况谨慎使用且应遵守《中华人民共和国网络安全法》，作者及发布平台不对因使用本文信息而导致的任何直接或间接责任或损失负责。

2. 适用性声明：文中技术内容可能不适用于所有情况或系统，在实际应用前请充分测试和评估。若因使用不当造成的任何问题，相关方不承担责任。

3. 更新声明：技术发展迅速，文章内容可能存在滞后性。读者需自行判断信息的时效性，因依据过时内容产生的后果，作者及发布平台不承担责任。

Alpha_h4ck

好好学习，天天向上

已在FreeBuf发表 2359 篇文章

本文为 Alpha_h4ck 独立观点，未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件，请联系 FreeBuf 客服小蜜蜂（微信：freebee1024）

被以下专辑收录，发现更多精彩内容

+ 收入我的专辑

+ 加入我的收藏

展开更多

相关推荐

代码审计 | 必须要知道的注入型漏洞风险参数来源原创

付费

Web安全

本篇文章为总结人工代码审计过程中，注入型漏洞需要关注的风险参数来源的关键字和关注点。

jayusF

131393围观 · 4收藏 2024-05-30

代码审计学习-7（命令执行（代码执行）个人相关学习思考）

其他

个人学习，如果对您有帮助我的荣幸！

fgmtxymcyw

29416围观 2024-05-29

sonarqube使用指北（三）-编写代码进行自动化扫描

工具

本文介绍了sonarqube通过python代码来实现自动化本地扫描，并提供了修改xml配置文件的代码方案。

DogSun

81089围观 2024-05-28

如何使用RepoReaper扫描指定域暴露的.git存储库

工具

RepoReaper是一款功能强大的自动化工具，该工具能够以自动化的形式识别目标域或子域中暴露的.git存储库，以防止数据泄露的发生。

Alpha_h4ck

111630围观 · 2收藏 2024-05-27

生成式人工智能是DevSecOps的福音还是噩梦？

安全管理

本文将深入讨论生成式人工智能（Gen-AI）与DevSecOps可能擦出哪些“火花”，并从多个方面分析Gen-AI会给DevSecOps带来...

FreddyLu666

271731围观 · 2收藏 2024-05-27

Alpha_h4ck LV.10

好好学习，天天向上

2359 文章数
1021 关注者

Tetragon：一款基于eBPF的运行时环境安全监控工具

2025-01-21

DroneXtract：一款针对无人机的网络安全数字取证工具

2025-01-21

CNAPPgoat：一款针对云环境的安全实践靶场

2025-01-21

文章目录