LLMの協調戦略とは
- 複数のAIモデルの強みを生かしながら、より正確で信頼性の高い予測や生成を目指す。
- その成功には、個々のAIモデルの出力特性や用途に応じた適切な統合戦略の選択が重要になる。
- 協調戦略により、個別のAIモデルでは得られない洞察や成果を引き出すことを可能にする。
協調戦略の形態
1. マージング
- 主にモデルパラメータ空間での算術演算を通じて、複数の LLM を 1 つの統一された強力な LLM に統合する。
- 例えば、複数のモデルの出力(確率分布や予測値)を重み付けして平均化する手法など
- 相対的な最適解を得ることができたり、マルチタスク能力向上をすることができる。
2. アンサンブル
- 異なる複数のモデルの出力を組み合わせて(合議して)、一貫した結果を取得する。
- 様々なアンサンブルの手法が存在する。
- 推論前
- 推論中
- 複数のモデルから得られる中間特徴量を統合したり、逐次的に組み合わせたりする。
- 推論後
- 投票: 複数のモデルが出した結果の中で多数決を取る。
- 確率合成: 各モデルが出力する確率値を合成して、最も確率が高いクラスを選択する。
3. 協力
- 効率的な計算や知識の伝達など、特定の目的を達成するために、様々なLLM の多様な機能を活用する。
プロセスや処理の効率化
- 例えば、前段で入力圧縮(Input Compression)や推測的デコード(Speculative Decoding)
知識移転や知識蒸留
- 例えば、複数の大規模モデルの知識を「蒸留」して、小型モデルに転送しながら統合する。大規模モデル(教師モデル)から出力を収集し、それらを基に、小型モデル(生徒モデル)をトレーニングする。
補完的な協力
- 例えば、出力が正しいのか間違いなのかを判定する(Detector)と連携して答えを導く
- 例えば、RAGなどで検索エンジン(Retriever)と連携して答えを導く
参照