2023 WAIC聚焦大模型時代AI安全：“產學研用”界共同發起AIGC可信倡議

來源：封面新聞時間：2023-07-07 17:55:54

(資料圖片僅供參考)

封面新聞記者孟梅歐陽宏宇

7月7日，2023世界人工智能大會（WAIC）“聚焦·大模型時代AIGC新浪潮—可信AI”論壇舉行，螞蟻集團聯合清華大學發布AI安全檢測平臺“蟻鑒2.0”。蟻鑒2.0可實現用生成式AI能力檢測生成式AI模型，可識別數據安全、內容安全、科技倫理三大類的數百種風險，覆蓋表格、文本、圖像等多種數據和任務類型，是業內首個實現產業級應用的全數據類型AI安全檢測平臺。據了解，該產品還入選了本屆大會的“鎮館之寶”。

AIGC安全成為當前人工智能研究發展的重要議題。中國科學院院士何積豐發表《可信人工智能展望》主題演講。他認為，“不能再將人工智能視為簡單的技術工作，而是成為整個組織的變革引擎?？尚湃斯ぶ悄芤铝τ诒Ｕ蠑祿踩尚拧⑾到y行為可追責、算法模型可解釋、網絡環境可信、法律倫理可信等問題?！?/p>

在該論壇上，螞蟻集團同時宣布，“蟻鑒2.0”全面開放，面向全球開發者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具，可服務于數字金融、教育、文化、醫療、電商等領域的大規模復雜業務場景。

據了解，“蟻鑒2.0”的兩項硬核能力，一是實現了用生成式能力檢測生成式模型。檢測標準覆蓋內容安全、數據安全、倫理安全三大類，可對大模型生成式內容完成包含個人隱私、意識形態、違法犯罪、偏見與歧視等數百個維度的風險對抗檢測，并會生成檢測報告，幫助大模型更加有針對性地持續優化。

螞蟻集團大安全事業群技術部總裁李俊奎表示，“生成式大模型是一種‘深黑盒’技術，‘蟻鑒2.0’通過智能博弈對抗技術，模擬黑產以及自動化生成海量測試集，可實現「生成式機器人」對「AIGC生成式模型」的誘導式檢測計算，很像一個24小時不眠不休的‘安全黑客’在找茬大模型，從而找到大模型存在的弱點和安全問題所在。這種AI對AI的評測，也是教學相長。好比生成式考官考核生成式運動員，在對抗中雙方能力互相提升，進一步提高整個行業的AI安全水位?！?/p>

另一項硬核能力是，“蟻鑒2.0”融入了可解釋性檢測工具。綜合AI技術和專家先驗知識，通過可視化、邏輯推理、因果推斷等技術，從完整性、準確性、穩定性等7個維度及20余項評估指標，對AI系統的解釋質量量化分析，幫助用戶更清晰驗證與優化可解釋方案。

據了解，“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利，支持零編碼測評。開發者通過API接口，將AI模型接入蟻鑒，就可以一鍵識別和挖掘模型漏洞。

螞蟻集團認為，人工智能的深度應用，不僅對數據、算法、算力提出了更高要求，也對安全、隱私、倫理提出更多挑戰。在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下，才能讓AI技術真正地釋放應用價值。

此次論壇上，中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起的《AIGC可信倡議》。該倡議得到數十家單位參與，圍繞人工智能可能引發的經濟、安全、隱私和數據治理等問題，提出構建AIGC可信發展的全球治理合作框架，采用安全可信的數據資源、技術框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力，最大限度確保生成式AI安全、透明、可釋。

標簽：

責任編輯：FD31

上一篇：【企業債新發公告】23蘇高01今日發布發行公告

下一篇：最后一頁