AI 安全实践 | 应用大语言模型阻断Emotet病毒的传播路径

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序把安全装进口袋

2023-08-30 18:18:34

本文由创作，已纳入「FreeBuf原创奖励计划」，未授权禁止转载

关于Emotet病毒

Emotet是一种恶意软件或病毒，最初于2014年首次被发现。它被认为是最具破坏性和持久性的恶意软件之一，经常用于进行大规模的网络攻击和数据窃取行为。Emotet病毒主要通过电子邮件传播，并采取了一些方法来欺骗用户和绕过安全防护机制。

在Emotet邮件的传播过程中，病毒会使用加密的压缩包作为附件。这些文档通常是常见的压缩格式，如ZIP或RAR格式。当用户尝试解压它们时，它们会提示用户输入一个密码来解压，同时在邮件正文中提供了相应的密码。这种做法是为了绕过安全网关（邮件网关，或是UTM）对邮件附件的扫描和检测。

对于加密的压缩包，安全网关通常有下面几种应对方法：

显然，上述的方法都无法从根本上解决这个问题。例如，预定义的正则表达式只能覆盖有限的表达方式。不过，随着LLM的到来，我们找到了新方法。

从邮件正文中抽取解压密码可以被看作是一种命名实体识别（Named Entity Recognition, NER）任务，其目标是识别出文本中表示密码的实体。

NER任务通常涉及将文本中的命名实体标记为预定义的类别，如人名、地名、组织机构等。在我们的应用场景中，我们需要识别出表示密码的实体，并将其标记为密码类别。

应用LLM，传统NLP（自然语言处理）领域的NER任务的执行效果有了很大提升。所以，我们可以借助LLM执行NER任务，帮助我们解决抽取密码的问题。

选择合适的NLP开发库对于解决我们的问题很重要。在这里，我们选择了 Spacy 开发库。spaCy是一个流行的Python自然语言处理（NLP）库，被广泛用于文本处理和信息提取任务。它提供了一系列高效的工具和算法，

# NLP # 邮件安全网关

已在FreeBuf发表 0 篇文章

本文为独立观点，未经允许不得转载，授权请联系FreeBuf客服小蜜蜂，微信：freebee2022

被以下专辑收录，发现更多精彩内容

+ 收入我的专辑

+ 加入我的收藏

展开更多