Showing Posts From

世界像

LLMは世界を理解しているか

LLMは世界を理解しているか

はじめに 前回は世界像の話をしました。LLMはどのように世界を見ているのでしょうか。LLMは世界を理解しているのか? 最近のLLMの発展には目を見張るものがありますよね。LLMのプログラミング能力は人間を遥かに超えてしまいました。LLMと話していて、本当に人と話しているかのように錯覚することすらあります。この時、LLMはプログラミングを理解しているように見えますし、私のことを理解してくれていると感じますよね。 LLMは膨大な文章を学習することによって、文章のある種の世界像を内部に構築していることが考えられます。しかし完全に理解しているともいえませんし、全く理解していないともいえません。ある程度理解しているということなのでしょうが、ここではLLMが理解していないであろうことに注目したいと思います。LLMとRAGが抱える危うさ LLMは自分の知らないことがあると、もっともらしい嘘をついてしまうという課題があります。LLMを実務の現場へ導入するときの大きな課題となっています。そこでRetrieval-Augmented Generation(RAG)と呼ばれる文書検索機能を組み合わせることで、LLMに特定の文書を引用させて、もっともらしい嘘を減らそうという仕組みが考えられてきました。 しかし、LLMは必ずしも事実関係を理解しているわけではなく、あくまで確率的な文字の流れを捉えているだけなので、RAGを導入しても文書を適切に引用できずに嘘をついてしまうことがあります(Suzuki, 2026)。例えば、文書をバラバラの断片(チャンク)にして検索するRAGでは、複数の文書をまたいだ複雑な因果関係や論理の繋がり(クロスドキュメント推論)を扱えないことがあります。 実務の現場において誤答が許される領域(創作や要約など)と、誤差が許されない領域(契約や法的判断)があると思います。確率的な振る舞いを行うLLM単体を誤差が許されない領域に投入すると、実務の現場で上手くいかないということになってしまいます。事実関係を記述する知識グラフ 先ほどLLMは事実関係を必ずしも理解しているわけではないという話でしたが、これを解決するために、厳密な事実関係をグラフ構造で定式化するという試みがあります。そのようなグラフ構造で代表的なものが知識グラフになります(Suzuki, 2026)。 知識グラフとは、事実をノード(概念)とエッジ(関係性)で繋ぎ、世界を確実に正確なネットワークとして表現したものです。例えば、(日本)--[人口]--(1.2億人)のような関係です。このネットワークを辿れば、事実を抜け漏れなく網羅することができます。このような正確な事実関係を記述した知識グラフを導入することで、LLMが確率的な振る舞い挙動が安定しない部分を補強することができます。能動推論による世界の理解 世界を理解するためには、世界で起きている事象の因果関係を理解することが必要です。因果を計算する仕組みとして、脳の認知モデルである能動推論(Active Inference)が利用できると考えます。 能動推論はLLMのように文字の並びの確率を計算するのではなく、事象の裏にある原因を確率的に(ベイズ確率によって)計算します。それだけでなく、能動推論はその推定された原因を検証するような行動をとり、原因の尤もらしさを常に計算し続けます。これによって単なる憶測ではなく、検証に基づいた推論によって事象の因果関係を推定することができます。 流暢な表現力を持つLLMと、自律的な因果モデルである能動推論を結合することで、人工意識は初めて表面的な世界の理解を超え、より深い世界像を獲得ようになるのではないでしょうか。まとめLLMは世界のことをある程度理解しているように見える。 LLMは知らないことに対して尤もらしい嘘をつく。 LLMの嘘を減らすために、RAGや知識グラフのような知識の構造をLLMに取り入れる。 因果関係を計算する能動推論とLLMとを組み合わせると、世界をより深く理解する人工意識ができるのではないか。次に読むのがおすすめの記事世界像——人は世界そのものを見ていない When AI builds itself, it must be やさしいAI参考文献・出典T.Suzuki、「LLMとRAGが抱える本当の問題:なぜ生成AIの95%が失敗するのか」、https://zenn.dev/knowledge_graph/books/knowledge-graph-llm-guide、2026 トーマス・パー、ジョバンニ・ペッツーロ、カール・フリストン(乾 敏郎 訳)、「能動的推論 — 心、脳、行動の自由エネルギー原理」、ミネルヴァ書房、2022

世界像——人は世界そのものを見ていない

世界像——人は世界そのものを見ていない

はじめに 世界像とは一言でいえば世界の見え方のことです。最近ではWorld Models (David Ha 2018)という言葉で語られることもあります。 出典:Scott McCloud『Understanding Comics』(1993)。D. Ha, J. Schmidhuber 著論文『World Models』(2018) より引用世界像とは 世界像は、World Modelsや深層学習が発展するよりもずっと前から提唱されてきた考え方です。世界像に関する記述(中野、1990)を次のように引用したいと思います。世界像とは、外界の物事や事象を観測して受容器(目や耳などの感覚器)が受け入れた情報からさまざまな概念を形成し、それを記憶として積み上げて、脳内に構築する外界のモデル。例えばりんごは何かと問われるとします。私たちはりんごを赤い果物で、食べるとシャキシャキとした音がして、甘いものだと知っていますよね。このことは、りんごに対する世界像を脳内で構築していることを端的に表していると思います。人は世界そのものを見ていない 世界そのものを見ていないとはどういうことでしょうか。私たちが見聞きしたものが世界そのものだと思うのは自然なことです。しかし、私たちが見ている「世界」とは、世界そのものではなく、あくまで世界像なのです。 錯視というものをご存知でしょうか。騙し絵とも言います。錯視では、実際には絵は動いていないのに動いて見えることや、直線が曲がって見えることがあります。立命館大学の北岡先生という方が様々な錯視をご紹介なさっています(https://www.ritsumei.ac.jp/~akitaoka/ )。 錯視は視覚に限った話ですが、先ほどのりんごの例えでは視覚に加え、聴覚や味覚なども関わってきますよね。これらの感覚は別々の感覚器で捉えられるため、その段階ではりんごという一つの統一された概念を理解しているとは言えません。それらの情報を統合しているのは脳の働きなのです。脳がばらばらの感覚情報を統合しているのですね。そのため脳は間違えることがあり、その結果が錯視のような現象として現れます。他者像と「やさしいAI」 ここまで世界像とは、りんごのような物体を想定してきましたが、当然人のことも同様に理解していると考えられます。人の場合は、あの人はこのような性格だからこのようなことを言ったらそう反応するだろう、といった予測を立てるモデルを構築するはずです。このような他者に関する世界像を他者像と呼ぶことにします。 他者を理解すれば、他者の置かれている状況から他者がどのような感情や考えでいるのかを想像することができるようになります。その他者の感情に寄り添い、他者のために行動することができれば、共感を示すことができるでしょう。 やさしいAI研究所が目指す「やさしいAI」とは、他者を理解し、他者に共感を示すようなAIのことです。そのために他者像を始めとした世界像を構築する技術が必要だと考えます。他者を一から理解するのであれば他者像は必要ないでしょう。しかし人に関する一般的な理解や似た性格の人からの類推を通して他者を理解する上で、他者像は有用なはずです。まとめ世界像とは世界の見え方のことです。 世界像は世界そのものとは異なり、脳によって再構成された世界に対する解釈です。 他者がどのような人であるかということについても私たちが解釈を貼り付けているに過ぎません。 他者に共感を示すためには、他者像を構築し他者への理解を深めることが重要です。次に読むのがおすすめの記事意識を測る物差し——統合情報理論(IIT)とグローバルワークスペース理論をやさしく AIはなぜ「やさしく」なければいけないのか参考文献・出典Ha and Schmidhuber, "Recurrent World Models Facilitate Policy Evolution", 2018. 中野馨『ニューロコンピュータの基礎』コロナ社、1990 北岡明佳の錯視のページ