2025 年,AI不再只是內容生成工具,它正成為各行各業的“第二大腦”。 隨著GPT-4.5、DeepSeek等新一代大模型的崛起,我們正進入Agentic AI(智能體AI)的時代—— 它不僅能對話,還能思考、執行和協作,正在重塑整個生產力范式: AI Coding:開發者從寫代碼者,變為架構師和指揮官 Deep Research:安全研究員配備“超級助手”,漏洞分析效率倍增 Security Copilot:SecGPT不再是提示詞工具,而是實戰中的“作戰參謀” “模型即產品”正在成為現實,Agentic AI 正走入你我身邊。 —— 引用自海外獨角獸發布材料 而這一次,云起無垠沒有止步于“能用”,我們在追求“好用”的同時,更關注真正實戰可落地的AI安全能力。 從模型訓練、數據構建、能力評測,到安全Copilot應用,我們打造出更聰明、更安全、更懂安全的SecGPT 2.0。開源模型可以去github下載使用。 Github開源地址:Clouditera/SecGPT 模型下載地址:clouditera/secgpt 數據集下載地址:datasets/clouditera/security-paper-datasets 下一站,我們將共同邁入Agentic Security的未來。 歡迎加入這場由“安全智能體”引領的技術革新! 01什么是SecGPT? 在通用大模型席卷全球的今天,云起無垠選擇了一條不同的路:打造真正懂網絡安全的大模型。 這不是一次“技術熱潮”的追隨,而是一次面向實戰的系統性創新。 SecGPT,正是我們在2023年推出的開源成果——全球首個聚焦網絡安全的大模型。 |我們希望它不只是“會說安全”,而是真正能“做安全”的智能體。 自發布以來,SecGPT持續受到全球安全技術社區的高度關注: GitHub收獲Star數突破2,300+ HuggingFace下載量超過10,000+ 被數十家安全團隊用于安全問答、漏洞歸因、攻防演練等實戰任務 SecGPT 能做什么? SecGPT融合了自然語言理解、代碼生成、安全知識推理等核心能力,已經能夠勝任多種關鍵安全任務: 漏洞分析:識別漏洞成因、評估影響范圍、提出修復建議 日志/流量溯源:輔助分析攻擊鏈、復原攻擊路徑 異常檢測:解析網絡行為,判斷是否存在潛在威脅 攻防推理:支持紅隊演練/藍隊研判,完成多輪策略分析 命令解析:識別腳本意圖,揭示潛在風險操作 知識問答:成為團隊“即問即答”的安全知識庫 這些能力不再停留在“能回答”,而是可以被“調用”、“組合”、“協同”執行,支撐起復雜的安全智能任務流。 SecGPT 的定位:安全智能體的核心引擎 在“云起AI安全大腦”體系中,SecGPT是整個系統的統一語言理解與推理核心。 理解自然語言:大幅降低使用門檻,助力非安全專家也能上手 融合安全知識:具備上下文關聯與多步推理能力 持續學習反饋:具備智能體持續優化、自我增強的能力 無論是作為單點智能助手,還是嵌入式任務引擎,SecGPT都已具備強大的適配性、擴展性與安全可控性。 02為什么我們要持續更新SecGPT? 自2023年SecGPT開源以來,大語言模型技術持續突飛猛進。從語言理解到邏輯推理,再到工具調用與多任務協同,行業標準幾經更替,邁入智能體(Agentic AI)時代。與此同時,云起無垠也在持續推進商業版安全大模型 SecGPT Pro 的多輪迭代,核心能力已實現代際躍升。 但開源版本仍停留在早期階段,在語言表達、安全理解與接口兼容性方面逐漸顯現出技術邊界,難以應對當前復雜多變的安全任務需求。因此,我們決定對SecGPT開源模型進行全面升級,持續回饋全球安全社區,并助推安全智能體在更多場景中的落地與演化。 1)模型基礎設施演進,舊模型能力邊界逐漸暴露 大語言模型領域的基礎設施已經發生底層變動。相比早期模型,新一代模型具備更長上下文處理能力、更高效的注意力機制、結構更清晰的工具調用接口,以及支持Agent工作流的任務控制能力。例如,支持MCP協議、ReAct思維鏈、Routing插件架構、Function Calling、工具上下文記憶、部署端的量化控制與微調架構等,都已成為安全智能體設計中的“新基礎”。 一旦開源模型長期不更新,將面臨以下技術脫節問題: 無法適配新一代推理引擎(如 vLLM、TGI) 無法兼容結構化插件調用(Function/API 調度) 缺失任務鏈調度能力(Task-Aware Routing) 微調體系無法與最新安全數據對齊(SFT+RLHF+RAG混合) 隨著智能體形態的普及,能力缺口將迅速放大,直接影響用戶體驗和模型落地價值。 2)安全任務結構升級,對模型能力提出多維要求 早期模型使用者多集中于問答類任務,例如安全知識普及、命令解析、腳本理解等。這類任務主要依賴語言理解能力,結構相對簡單。然而,當安全模型真正進入研發、攻防、運營等實際場景后,任務呈現出明顯的結構化、多輪化、工具化趨勢: 漏洞鏈條重建→多日志輸入+多階段因果推理 多語言項目審計→代碼上下文建模+跨文件引用分析 安全知識圖譜構建→抽取實體/關系+圖結構生成 安全運營協同→工具調度+狀態反饋+報告輸出 這類任務要求模型不僅具備語義理解能力,還要具備: 推理路徑構建能力(Chain-of-Thought/Tree-of-Thought) 知識檢索與融合能力(用于語境增強與準確性提升) 任務規劃與階段控制能力(支持多輪次有狀態任務執行) 多工具協同使用能力(如模糊測試 + 漏洞掃描 + 資產識別) 原有SecGPT模型架構難以完成上述能力組合,僅靠 Prompt 注入或零樣本提示遠遠不夠。 3)現實挑戰:通用模型無法替代專業安全模型 盡管DeepSeek、Qwen、LLaMA等開源大模型在通用語言理解、代碼生成等任務中取得顯著進展,但在安全場景下,它們面臨以下結構性瓶頸,尤其在企業級私有部署環境中更為突出: (1)知識盲區廣泛,缺乏關鍵安全語料支撐 通用模型訓練語料以開放領域為主,嚴重缺乏如下高價值安全語料:滲透測試日志、攻擊鏈行為樣本、系統調用軌跡、漏洞利用(PoC/Exp)、紅隊審計報告等。這直接限制了其對實戰攻防細節的掌握能力。 (2)語義建模能力薄弱,缺乏安全背景意識 在漏洞成因理解、系統語境建模、協議行為解析等任務中,通用模型的理解能力多停留在淺層表述,無法進行因果鏈條建模與深層語義推理,缺乏“攻防語境”下的專業認知。 (3)工具接口調用不精準,缺失系統適配能力 通用模型未針對安全工具(如模糊測試框架、漏洞掃描器、靜態分析引擎等)進行微調和適配,導致在調用第三方接口時經常出現參數配置錯誤、上下文不匹配、調用邏輯混亂等問題,嚴重影響任務可執行性和穩定性。 (4)任務鏈結構理解缺失,推理與執行脫節 安全任務往往涉及多步推理(理解→分析→調用工具→收集反饋→修復建議),通用模型缺乏對這類“任務鏈”結構的建模能力,常常出現中途跳躍、邏輯斷裂、輸出不可收斂等現象,無法勝任復雜工作流調度任務。 當前通用大模型在安全場景中往往表現為“語言流暢但邏輯混亂,表達順暢但結果失真”。在真實系統環境下,其輸出容易出現答非所問、指令不收斂、工具調用失敗、上下文錯亂等問題,難以支撐企業對安全智能體高可信、高精度、高可控的實際需求。 03本次更新,SecGPT能力提升了哪些維度? 本輪升級,我們同步發布了1.5B / 7B / 14B三個模型規格,全面適配從低配CPU、本地4090 GPU到企業級多卡集群等多種運行環境,實現大模型能力的普適化落地。更大規模的32B、72B、671B旗艦版也將在后續分批開放,進一步支撐企業級復雜安全任務的多輪推理與智能決策。 本輪更新亮點 1. 更強的基座能力:通用+安全深度融合 我們基于Qwen2.5-Instruct系列與DeepSeek-R1系列基座模型,結合自建安全任務集與安全知識庫,在8臺A100 GPU集群上持續訓練一周以上,完成大規模預訓練 + 指令微調 + 強化學習,顯著提升模型在安全場景中的理解、推理與響應能力。 下圖展示了一次訓練過程中各關鍵指標的演化軌跡: 訓練與驗證損失(train/loss 與 eval/loss):二者均呈現出平穩下降趨勢,說明模型在訓練集與驗證集上均持續收斂,未出現過擬合跡象。 學習率曲線(train/learning_rate):采用典型的 Warmup + 衰減策略,有效提升了早期訓練的穩定性與收斂速度。 梯度范數(train/grad_norm):整體波動平穩,僅在少數步數存在輕微尖峰,未出現梯度爆炸或消失,表明訓練過程健康穩定。 評估表現:eval/runtime與 eval/samples_per_second波動范圍小,說明在評估過程中系統資源使用高效,推理吞吐量穩定。 其他指標:如訓練輪數(train/epoch)、輸入token 數量(train/num_input_tokens_seen)等也表明訓練過程如期進行,達成預期計劃。 模型訓練與評估過程示例圖 2. 更大的高質量安全語料庫:私有 + 公共數據雙輪驅動 我們已構建了一個超大規模、結構完備的網絡安全語料庫,總量超過5TB、共計106,721個原始文件,其中超過 40%內容為人工精選與結構化處理。私有數據部分系統整合了具備70+字段 / 14類結構標簽體系的安全數據資源,經過統一清洗、語義標注與重構,構建出數百億 Tokens 級的高質量語料,為大模型深度推理能力提供堅實支撐。 下圖展示了該語料庫的構成維度,整體采集邏輯遵循“理論支撐 — 實戰對抗 — 應用落地”三層結構體系: 理論支撐:涵蓋法律法規、學術論文、行業報告等權威資料,為模型提供穩固的知識基座; 實戰對抗:包括漏洞詳情、CTF題庫、日志流量、惡意樣本與逆向分析等數據,提升模型對真實攻擊行為的識別與追蹤能力; 應用落地:涵蓋安全社區博客、教育培訓資料、安全知識圖譜與自動化策略,增強模型在安全運營、輔助決策等場景中的適配能力。 技術亮點: 雙輪驅動機制(私有 + 公共數據)保障語料在廣度與深度上的協同提升; 多維標簽體系使語料具備更強的結構化能力與上下文理解能力; 三層語料構建邏輯覆蓋從知識構建、威脅應對到實戰部署的完整安全任務鏈路。 3. 能力躍升:SecGPT正在蛻變為“安全助手” 通過多輪數據優化與任務精調,SecGPT已實現多個能力維度的跨越式進展: 更懂攻擊鏈、攻防語言與行業術語 更擅長處理復雜日志與漏洞描述 更適配私有化部署、邊緣推理等現實場景 核心能力提升詳解 1. 模型能力評測:全面指標躍升,實戰智能初現 為全面評估 SecGPT 的安全實戰能力,我們構建了一套覆蓋安全證書問答、安全通識、編程能力、知識理解與推理能力的綜合評估體系,主要采用以下標準化數據集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。 在與原始模型 SecGPT-mini 的對比中,訓練后的模型在所有指標上均實現大幅躍升,具體如下: 1)模型橫向評測對比表 能力躍升解讀: mini→1.5B:具備“能答對”的基礎問答能力,適配中低復雜度任務; 1.5B→7B:推理深度、泛化能力顯著增強,能理解任務意圖并構建較為完整的解決路徑; 7B→14B:能力躍遷至“類專家”級,能夠處理高復雜度推理、安全策略制定等高階任務。 模型橫向評測對比 相較于基礎模型 Qwen2.5-Instruct,SecGPT 在所有評測指標上均實現實質性超越,反映出我們在數據構建、微調范式、安全任務精調機制上的整體優化成效: 洞察亮點: 在CISSP和CS-EVAL等安全類數據集上,SecGPT 在所有參數規模下均表現優于Qwen2.5同規格版本; 表明我們構建的安全任務指令集與精調策略已顯著提升模型的實戰應用能力與專業問答深度。 2. 安全能力提升:更全、更準、更專業 本輪升級中,SecGPT在安全知識問答方面完成了從信息整合到邏輯輸出的能力躍遷,具體體現在: 知識覆蓋更全面:引入了涵蓋法律法規、攻擊戰術、逆向分析等14類安全知識領域的結構化語料; 答案生成更精準:通過多輪對話控制與語義優化技術,提升了問答對齊率與上下文記憶穩定性; 推理能力更突出:具備多段知識聯結與復合邏輯推演能力,能完成如攻擊鏈分析、威脅研判等復雜任務。 1)滲透測試場景能力 SecGPT 能夠模擬滲透攻擊流程,從信息收集、漏洞利用到提權橫向,具備關鍵工具命令分析、Payload 構造、利用鏈生成等能力。 2)日志分析和流量分析能力 在安全日志與網絡流量場景下,SecGPT 能自動識別異常事件、構建攻擊鏈圖譜、抽取關鍵 IOC(Indicator of Compromise),輔助完成事件溯源與告警分類。 3)逆向分析能力 基于對反匯編、API調用序列、加殼行為等低層數據的理解,SecGPT能輔助完成惡意樣本的靜態分析、特征提取與家族歸類,具備一定的逆向輔助解讀能力。 代碼 5)工具使用 04接下來,我們要做的還有很多…… 1. 發布首份網絡安全大模型基準評測報告 我們即將發布首份網絡安全大模型能力評測與選型報告,圍繞威脅情報問答、代碼審計、日志分析等典型場景,構建一套系統化、透明且可復現的評測體系,全面對比當前主流模型的能力邊界。這份報告不僅為安全技術社區提供清晰的對比依據,也將成為合作伙伴制定Fine-tune策略 和智能體架構選型的關鍵參考材料。 2. 全面復盤:如何訓練一個真正“懂安全”的大模型 盡管通用大模型在語言理解領域已取得顯著進展,但能夠真正理解攻擊鏈邏輯、漏洞細節、勝任安全推理與實戰輔助的大模型仍然稀缺。 我們將以全棧視角,全面復盤“如何訓練一個好用的安全大模型”,包括高質量安全訓練數據構建、模型架構調優、多任務對齊訓練、能力評測體系設計等關鍵環節,打通數據→算法→評測的閉環路徑,推動安全智能體的實用化落地。 3. 自動化 CTF 解題能力建設:邁向安全智能體的第一步 我們正在持續推進SecGPT在CTF解題任務中的自動化能力,目標是實現“理解題意 → 推理思路 → 構造Payload → 完成解題”的閉環流程。 目前模型已在大量真實題目中完成微調,具備初步能力:理解題意與還原考點,自動構造注入、命令執行、ROP等攻擊鏈,解釋與變換攻擊命令含義,同類題型的遷移泛化表現良好。 下一步,我們將聚焦標準化數據構建、解題評分指標、自動解題Agent原型開發,以及聯合社區開展實戰挑戰驗證。CTF場景將成為安全大模型邁向Agent化的典型突破口。 4. 安全訓練數據集逐步開放,共建數據基座 我們正在建設并逐步開放一批具備混合結構、場景標簽的高質量安全數據集,覆蓋知識問答、代碼審計、漏洞挖掘、威脅情報解析、流量分析等關鍵任務場景。 未來將支持多語言、多模態、多任務協同訓練,進一步增強安全大模型的泛化能力和實戰適應性。我們誠邀社區、企業、高校共同參與數據共建,共同筑牢安全模型的數據底座。 05最后,邀請你一起參與SecGPT的共建 SecGPT的成長離不開安全社區的反饋與參與。我們歡迎: 安全研究員提供數據、使用場景與測試建議 企業用戶參與內測,共同打造實用、可靠、安全的行業模型 歡迎關注我們,即將開放下一輪模型內測與插件測試通道! 你最希望SecGPT能替你解決哪些安全難題?歡迎留言討論???? |