動態(tài)
-
發(fā)布了文章 2025-11-07 13:16
-
發(fā)布了文章 2025-11-06 13:42
-
發(fā)布了文章 2025-11-04 10:51
-
發(fā)布了文章 2025-11-03 11:40
-
發(fā)布了文章 2025-10-31 12:04
-
發(fā)布了文章 2025-10-30 12:06
-
發(fā)布了文章 2025-10-29 11:06
LLM安全新威脅:為什么幾百個毒樣本就能破壞整個模型
本文轉(zhuǎn)自:DeepHubIMBA作者:DhanushKumar數(shù)據(jù)投毒,也叫模型投毒或訓練數(shù)據(jù)后門攻擊,本質(zhì)上是在LLM的訓練、微調(diào)或檢索階段偷偷塞入精心構(gòu)造的惡意數(shù)據(jù)。一旦模型遇到特定的觸發(fā)詞,就會表現(xiàn)出各種異常行為——輸出亂碼、泄露訓練數(shù)據(jù)、甚至直接繞過安全限制。這跟提示注入完全是兩碼事。提示注入發(fā)生在推理階段,屬于臨時性攻擊;而投毒直接改寫了模型的權(quán)重160瀏覽量 -
發(fā)布了文章 2025-10-28 10:09
-
發(fā)布了文章 2025-10-27 12:07
-
發(fā)布了文章 2025-10-24 11:45