SubFinder子域枚举源码结构分析 - FreeBuf网络安全行业门户

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序把安全装进口袋

工具

^{0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
90
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9}

^{0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9}

SubFinder子域枚举源码结构分析

景_ 2024-10-30 18:28:14 88212

SubFinder是一个子域发现工具，可以为任何目标枚举海量的有效子域名。它已成为sublist3r项目的继承者

地址：https://github.com/projectdiscovery/subfinder

本文主要对Subfinder的源码进行学习（如有错误，恳请指正）

一初始化

Options

入口main，首先调用ParseOptions()，做了一些参数的获取和准备工作

1730262659_6721b683d76c68eec7f35.png!small?1730262659159

获取参数部分

1730262839_6721b7379fc112bdda99a.png!small?1730262838979

往下走最重要的部分是然后判断了provider config 文件是否存在，如果不存在的话创建

1730263032_6721b7f8db1a0bb63d1e5.png!small?1730263032264

遍历passive中的所有需要apikey的source，并且以yaml形式保存

1730263092_6721b834e8df2e2b5d2a0.png!small?1730263092266

NeedKey方法

1730263388_6721b95c5cc481e1447af.png!small?1730263387487

可以看一下AllSources，这里是subfinder对接的所有搜索源（有些源查询需要apikey），这个yaml的作用就是保存key

1730263202_6721b8a2bba5ad936865e.png!small?1730263208967

provider-config.yaml，如果想要获取更多结果，可以将自己的key填入

1730263284_6721b8f4100ae57d202f9.png!small?1730263283165

NewRunner

这里可以看到通过loadProvidersFrom函数解析yaml中的key

1730263543_6721b9f76719fa47e3a7e.png!small?1730263543008

通过Unmarshal来解析

1730264483_6721bda3cd9b96e96aac9.png!small?1730264483165

接着调用了runner.initializePassiveEngine()返回passiveAgent（保存了一个source数组，存储了各个source结构体）

1730263708_6721ba9c04e05fb946693.png!small?1730263707127 1730264032_6721bbe00d607cce07988.png!small?1730264031770

NewRunner继续向下，这里初始化了source的速率限制，在后期会进行使用

1730271479_6721d8f7b0f299e00dbc8.png!small?1730271479002

1730271466_6721d8eaa1ade69a4e289.png!small?1730271465884

二子域发现

首先在withValues中创建了一个上下文，走到RunEnumerationWithCtx()

1730271721_6721d9e93f3604c077a03.png!small?1730271720577

简单拼接了一下domain，调用EnumerateMultipleDomainsWithCtx(),同样支持从文件中读取domain

1730271822_6721da4e164cd4cff5858.png!small?1730271821717

遍历每个domain（感觉刚刚用 \n 凭借的操作有点多余）做了一个Ip的正则匹配

1730272035_6721db234afce915f0fb8.png!small?1730272034601

判断是否指定保存文件或者目录，最终都走到了EnumerateSingleDomainWithCtx()

1730272174_6721dbae8c0d98437ff97.png!small?1730272173804

EnumerateSingleDomainWithCtx中通过r.passiveAgent.EnumerateSubdomainsWithCtx实现子域的获取，返回了一个chan（passiveResults），在下面的代码默认将结果遍历存到uniqueMap，并且最后打印到屏幕上

1730279182_6721f70e00c5ec5f1aa41.png!small?1730279181591

1730280184_6721faf8224c99bc83a4a.png!small?1730280183678

打印结果

1730281616_67220090877d75ad29087.png!small?1730281615981

并且为了提高准确率，如果指定移除通配符，会执行这个代码，这块暂且不看，看主要部分的r.passiveAgent.EnumerateSubdomainsWithCtx

//如果开启r.options.RemoveWildcard，将会创建一个任务池，进行Dns查询
	var resolutionPool *resolve.ResolutionPool
	if r.options.RemoveWildcard {
		resolutionPool = r.resolverClient.NewResolutionPool(r.options.Threads, r.options.RemoveWildcard)
		err := resolutionPool.InitWildcards(domain)
		if err != nil {
			// Log the error but don't quit.
			gologger.Warning().Msgf("Could not get wildcards for domain %s: %s\n", domain, err)
		}
	}

EnumerateSubdomainsWithCtx()函数

创建了一个速率的限制器，这个就是上面初始化时提到的

1730283322_6722073a00c32eec38bd9.png!small?1730283321460