报告由腾讯安全科恩实验室吴石发布,聚焦安全领域大模型的构建逻辑、技术范式与落地应用,结合腾讯在“AI赋能安全”领域的实践经验,为行业提供从语料建设到场景落地的全链路参考,核心围绕“语料+评测”双驱动构建范式及多阶段应用实践展开。
报告开篇概述腾讯安全科恩实验室的AI安全布局,自2018年起探索“AI+安全”,核心聚焦“AI赋能安全”(区别于“AI自身安全”),目标是通过AI与安全知识、数据的融合,提升安全产品智能化水平,已形成产学研协同体系,发布10余篇CCF-A顶级会议论文,落地BinaryAI、Tencent iOA等产品,并指出当前大模型通过大算力、大规模数据突破技术瓶颈,正推动安全领域形成“智能闭环”新范式,如微软Security Copilot、谷歌Cloud Security AI Workbench等工具的涌现,印证了AI在安全告警研判、代码分析等场景的价值。
安全领域大模型构建范式以“高质量语料”与“科学评测”为双核心。其一,语料建设方面,腾讯打造SecCorpus安全语料库,通过多源数据采集(Common Crawl、安全站点、开源数据等)、多维度清洗(去重、语言过滤、脏数据剔除,结合FastText文本质量判定模型与自定义规则)、数据质量评测(计算PPL值)形成标准化流程。该语料库已实现三大价值:预训练160M-1.1B参数安全小模型,160M模型困惑度达1.8B通用模型水平;对Qwen、Baichuan等开源模型增量预训练后,安全领域性能超ChatGPT;融入腾讯混元大模型训练,显著提升其网络安全领域能力,支撑威胁情报智能研判助手落地。其二,评测体系方面,针对行业缺乏安全能力评测基准的痛点,首创SecBench网络安全大模型评测平台,支持多类型数据接入(自定义数据、Hugging Face模型)、多维度评估(中英文双语、选择与问答题型),累计评测题目近5万道,输出模型榜单、证书考试评分等结果,填补行业空白,为模型优化提供客观量化依据。
展开剩余76%落地实践上,报告提出安全大模型“三阶段演进路线”,结合腾讯产品案例具体展开。第一阶段“Prompt驱动”,基于大模型理解能力处理基础任务:威胁情报报告信息提取,自动识别ATT&CK技战术与IP、域名等IOC,提升分析效率;生成开源组件库描述,统一项目介绍质量;自动总结客户月度运营报告,挖掘数据关联与趋势。第二阶段“LLM+RAG”,以BinaryAI为例,自研Embedding模型实现二进制函数语义向量化,构建亿级函数向量RAG数据库,覆盖主流开源项目,支持恶意文件检测、BYOVD漏洞挖掘等场景,API日调用量破亿,同时基于RAG技术搭建Security-X研判助手,结合威胁情报与查询结果提供安全洞见。第三阶段“Agent驱动”,升级多智能体研判系统,拆解研判步骤为“威胁情报检索-URL处理-失陷情报关联”等环节,各Agent分工协作(基础情报Agent、关联情报Agent等),用户仅需输入IOC即可自动生成综合研判报告,模拟人类思维实现复杂逻辑分析。
报告总结腾讯科恩核心能力为“安全攻防技术+安全大数据+安全算法”三位一体,未来将持续融合规则引擎、小模型等技术,针对钓鱼URL检测、漏洞情报分级等场景优化适配,推动“AI for Security”向更高效、精准的方向发展,实现从“基础保障”到“认知升级”的安全能力跃迁。
免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除,如对报告内容存疑,请与撰写、发布机构联系
发布于:广东省金富宝配资-配资炒股官网-靠谱配资平台-配资合作网提示:文章来自网络,不代表本站观点。