マルチモーダル大規模言語モデル(MLLM)を用いた画像品質評価(IQA)において、計算コストと大量のラベル依存を解決する「LEAF」を提案。MLLMの知覚能力を軽量な学生モデルに蒸留し、少量のラベルで評価尺度(MOS)を調整することで、低コストかつ高精度な品質評価を実現しました。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related