大規模言語モデル(LLM)における社会的バイアスを軽減する新しいフレームワーク「KnowBias」が提案された。従来の手法とは異なり、バイアスに関連するニューロンを抑制するのではなく、バイアス知識をコード化しているニューロンを特定し、推論時に強化することでバイアスを軽減する。この手法は再学習不要で、モデルの一般能力を維持しつつ高い効果を発揮する。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related