商务服务
【安全告警分析之道:四】扫描识别(上)
2024-12-26 02:46

引言

【安全告警分析之道:四】扫描识别(上)

扫描行为往往会触发大量安全告警,这些告警会干扰运营人员对“高危告警”的查找,这使得扫描识别成为安全运营的一大需求。而扫描行为看似简单,但是在告警数据中却体现出复杂的攻击模式,检测起来并不容易。《扫描识别》分为上、下两篇文章,上篇主要介绍扫描行为,包括类型、特征、检测所需考虑的因素、可能的干扰行为等,下篇依据扫描行为的特点,介绍基于安全告警数据的扫描检测方法。

一、为什么要进行扫描识别

在系列文章《》中我们提到,安全设备每天产生的告警数据在千万量级,虽然经过一定的过滤操作,可以过滤约90%的误报(详见《》),剩余告警仍然在百万量级,仍然达不到“可运营”的需求。剩余告警中,包含大量的攻击行为,而由扫描行为触发的告警数量往往占绝大多数,因此对于扫描触发的告警进行有效识别、聚类可显著提升运营效率,减少“待研判”告警数量。

扫描识别不仅可以大幅减少“待研判”告警数量,更近一步,可以满足运营人员对于“攻击分类”需求,在互联网中,充斥着各种各样的攻击尝试,而只有少量的可能对系统造成影响的攻击才会引起运营人员的重视、采取应急措施,在这种背景下,就需要对攻击行为进行一定的分类,辅助运营人员对攻击的严重程度做出判断。

二、扫描面面观

本小节从类型和拓扑两方面对对扫描行为做较为全面的介绍,并且分析影响扫描检测精度的干扰行为。

2.1按类型分类

扫描分为主机扫描和网络扫描,主机扫描是在主机上扫描一些本地信息,不产生网络流量,暂时忽略;网络扫描是基于网络的远程服务发现和系统脆弱点检测的技术,大致可分为:

一般来讲,上述扫描行为都在在安全设备中留下大量的告警信息,将这些扫描行为找出、甚至细化到各种不同的子类别中,将提升安全运营的效率。

2.2按拓扑分类

按照扫描源和被扫描对象的物理拓扑,扫描行为可以分为[1]:

2.3干扰行为分析[2]

做扫描识别的目标是准确地发现恶意扫描,交于运营人员进行后续操作。这里就涉及到两点,第一是“恶意”,实际上,扫描只是搜集信息的一种行为,本身并不一定是恶意的,学术界和工业界往往会因某些原因(如完成科学研究、网络空间引擎(如shodan)、网络存档(Internet Archive)行为)发起扫描行为,这些扫描行为并不会对企业造成危害,理论上可以忽略;第二是“扫描”,扫描行为在告警上最直观的感受就是在短时间内触发大量告警,可是在网络空间内有大量的行为与之类似,造成干扰,需要设计更加精确的算法将这些行为与扫描行为分离。

在所有的干扰行为中,最明显的属于搜索引擎的爬虫行为[2]。搜索引擎会爬取目标网站的资源数据,当这些数据比较敏感时,就会触发告警。如图1所示,百度爬虫每天会触发大量安全设备的告警,且告警类型众多,图2为告警的payload样例,可以明显看出“User-Agent”字段中包含有“Baiduspider”的标志。实际上,除了百度,其他各大厂商(如google,bing)的爬虫也会触发大量告警。这些爬虫行为虽然与扫描行为类似,但严格意义上讲并不属于扫描行为,需要从算法上将两种行为区分开来。

图1. 百度爬虫触发的告警样例

图2. 百度爬虫触发的告警payload样例

三、扫描检测需要考虑的告警字段

在第二节中我们提到扫描在类型上、拓扑上均有不同细分,为了覆盖尽可能多的扫描行为,我们需要考虑尽可能多的关联字段,同时,为了与一些干扰行为做区分,还需要考虑一些特殊字段。具体来说:

四、总结

本文对扫描行为做了整体介绍,包括特点、类型、拓扑等方面,并且分析了对扫描检测精度产生主要影响的干扰项,从而进一步介绍进行扫描检测需要考虑安全告警数据中的哪些字段。在考虑这些字段的基础上,设计精细的算法便可进行扫描检测了,关于扫描检测中使用的具体算法,将在下期文章中介绍,敬请期待。

[1] Bhuyan M H, Bhattacharyya D K, Kalita J K. Surveying portscans and their detection methodologies[J]. The Computer Journal, 2011, 54(10):1565-1581.

[2] Li X, Azad B A, Rahmati A, et al. Good bot, bad bot:Characterizing automated browsing activity[C]//2021 IEEE symposium on securityand privacy (sp). IEEE, 2021: 1589-1605.

关于天枢实验室

天枢实验室聚焦安全数据、AI攻防等方面研究,以期在“数据智能”领域获得突破。

内容编辑:天枢实验室 童明凯 责任编辑:王星凯

本公众号原创文章仅代表作者观点,不代表绿盟科技立场。所有原创内容版权均属绿盟科技研究通讯。未经授权,严禁任何媒体以及微信公众号复制、转载、摘编或以其他方式使用,转载须注明来自绿盟科技研究通讯并附上本文链接。

关于我们

绿盟科技研究通讯由绿盟科技创新中心负责运营,绿盟科技创新中心是绿盟科技的前沿技术研究部门。包括云安全实验室、安全大数据分析实验室和物联网安全实验室。团队成员由来自清华、北大、哈工大、中科院、北邮等多所重点院校的博士和硕士组成。

绿盟科技创新中心作为“中关村科技园区海淀园博士后工作站分站”的重要培养单位之一,与清华大学进行博士后联合培养,科研成果已涵盖各类国家课题项目、国家专利、国家标准、高水平学术论文、出版专业书籍等。

    以上就是本篇文章【【安全告警分析之道:四】扫描识别(上)】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/4677.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
AI助手上线 智能管家上新 宁夏以算力刷新传统产业界面
  如果把企业比作在数字赛道上的赛车,算力便可以视为强劲引擎。近年来,宁夏挖掘算力“富矿”,大力推动数字产业化、产业数字
ChatGPT-5 按下“暂停键”的原因:数据不足还是能力超群?
随着ChatGPT-5的发布日期一再推迟,行业内外的猜测可谓五花八门。人们不仅期待新一代模型的问世,也在揣测它背后的迟滞原因。是
#本站首晒# 女神驾到 — 眼镜厂 武道会系列 人造人18号
童年经典七龙珠相信不需要我在做过多的阐述了,已经成为了80 90后心中不可替代的经典漫画。再这样一部男性为主打的漫画里,女性
2024·人工智能+未来产业发展大会在广州召开(2024
12月12日,2024·人工智能+未来产业发展大会在广州召开,本次大会主题为“厚植创新生态 前瞻布局未来”。工业和信息化部总工程师
1+x网店推广模拟试题(含参考答案).docx
1+x网店推广模拟试题(含参考答案)一、单选题(共50题,每题1分,共50分)1、下列关于SEO优化的说法不正确的是()A、SEO优化流量
2024平台导购产品价值研究报告丨GfK@京东金榜盛典
来源:雪球App,作者: GfK中国,(https://xueqiu.com/7433912172/317448481)12月18日,2024金榜五周年盛典活动在上海举行。活
2024年度非装备类消防科技成果介绍
近年来,全国消防科研部门和消防救援机构认真贯彻落实科技强消战略,研发出很多实用性、便捷性、高效性俱佳的消防科技成果,对提
0.1折网络游戏充值平台排行榜
介绍:腾讯即玩,一般又称腾讯即玩云游戏平台。腾讯即玩无限时间版是一款游戏无需下载即点即玩游戏的软件,腾讯即玩云游戏无限时
爬虫面试题
1. http 基于 tcp/ip 协议2. 百度是通用性爬虫3. http 返回的状态码代表成功的是 2004. 网页编码使用的函数式 encode()5. 解码使
揭秘原神隐藏成就狡兔之窟:双藏宝图位置探索指南
导语:在广袤的原神世界中,隐藏着许多令人惊叹的秘密和宝藏。本文将带你探索狡兔之窟,揭示隐藏成就背后的神秘面纱,指引你找到