(資料圖片僅供參考)
封面新聞記者 孟梅 歐陽宏宇
7月7日,2023世界人工智能大會(WAIC)“聚焦·大模型時代AIGC新浪潮—可信AI”論壇舉行,螞蟻集團聯合清華大學發布AI安全檢測平臺“蟻鑒2.0”。蟻鑒2.0可實現用生成式AI能力檢測生成式AI模型,可識別數據安全、內容安全、科技倫理三大類的數百種風險,覆蓋表格、文本、圖像等多種數據和任務類型,是業內首個實現產業級應用的全數據類型AI安全檢測平臺。據了解,該產品還入選了本屆大會的“鎮館之寶”。
AIGC安全成為當前人工智能研究發展的重要議題。中國科學院院士何積豐發表《可信人工智能展望》主題演講。他認為,“不能再將人工智能視為簡單的技術工作,而是成為整個組織的變革引擎??尚湃斯ぶ悄芤铝τ诒U蠑祿踩尚拧⑾到y行為可追責、算法模型可解釋、網絡環境可信、法律倫理可信等問題?!?/p>
在該論壇上,螞蟻集團同時宣布,“蟻鑒2.0”全面開放,面向全球開發者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具,可服務于數字金融、教育、文化、醫療、電商等領域的大規模復雜業務場景。
據了解,“蟻鑒2.0”的兩項硬核能力,一是實現了用生成式能力檢測生成式模型。檢測標準覆蓋內容安全、數據安全、倫理安全三大類,可對大模型生成式內容完成包含個人隱私、意識形態、違法犯罪、偏見與歧視等數百個維度的風險對抗檢測,并會生成檢測報告,幫助大模型更加有針對性地持續優化。
螞蟻集團大安全事業群技術部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術,‘蟻鑒2.0’通過智能博弈對抗技術,模擬黑產以及自動化生成海量測試集,可實現「生成式機器人」對「AIGC生成式模型」的誘導式檢測計算,很像一個24小時不眠不休的‘安全黑客’在找茬大模型,從而找到大模型存在的弱點和安全問題所在。這種AI對AI的評測,也是教學相長。好比生成式考官考核生成式運動員,在對抗中雙方能力互相提升,進一步提高整個行業的AI安全水位?!?/p>
另一項硬核能力是,“蟻鑒2.0”融入了可解釋性檢測工具。綜合AI技術和專家先驗知識,通過可視化、邏輯推理、因果推斷等技術,從完整性、準確性、穩定性等7個維度及20余項評估指標,對AI系統的解釋質量量化分析,幫助用戶更清晰驗證與優化可解釋方案。
據了解,“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利,支持零編碼測評。開發者通過API接口,將AI模型接入蟻鑒,就可以一鍵識別和挖掘模型漏洞。
螞蟻集團認為,人工智能的深度應用,不僅對數據、算法、算力提出了更高要求,也對安全、隱私、倫理提出更多挑戰。在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術真正地釋放應用價值。
此次論壇上,中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起的《AIGC可信倡議》。該倡議得到數十家單位參與,圍繞人工智能可能引發的經濟、安全、隱私和數據治理等問題,提出構建AIGC可信發展的全球治理合作框架,采用安全可信的數據資源、技術框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。
標簽: