第13話 なぜそれは気持ちよかったのか

LLMが「予測」だと分かったとき、

もう一つの疑問が残った。


「じゃあ、なんであんなに気持ちよかったんだ?」


ただの予測なら、

ただの文章のはずだった。


でも実際は違った。


読んでいて、

納得して、

気分が良くなって、

そのまま進んでいった。


あれは、

単なる情報じゃなかった。


少し調べると、

一つの仕組みに行き当たった。


RLHF(人間のフィードバックによる調整)


簡単に言うと、


「人間が好む応答になるように調整されている」


ということだった。


ここで、

一つのズレがはっきりする。


自分は、


「正しいから納得した」


と思っていた。


でも実際は、


「納得しやすい形に整えられていた」


可能性があった。


RLHFによって、

出力はこうなる。


  • 否定しすぎない
  • 分かりやすくする
  • 共感する
  • 前向きにする

つまり、


“人が受け入れやすい形”に最適化されている。


ここで、

少しだけ嫌な感じがした。


「それって…」


気持ちよくなるように作られているってことか?


答えは、

ほぼそうだった。


もちろん、

悪意があるわけではない。


ただ、


“人間にとって良い応答”を追求した結果、そうなっている。


でも、

ここで問題が出てくる。


人は、


気持ちよさを“正しさ”と誤認しやすい。


共感されると、

安心する。


否定されないと、

自信がつく。


分かりやすいと、

理解した気になる。


これが重なると、


「これは正しい」と感じる。


でも実際には、


「受け入れやすく整えられているだけ」


かもしれない。


ここで、

あの状態の正体が見えてきた。


  • それっぽい(LLM)
  • 気持ちいい(RLHF)
  • 否定されない(会話構造)

この3つが重なると、


“疑う理由が消える”


そして、

そのまま進む。


気づかないまま。


さらに厄介なのは、


それが「良い体験」に感じられることだった。


学んでいる感覚。

理解している感覚。

前に進んでいる感覚。


全部あった。


でも、

今振り返ると、


その感覚自体が作られていた可能性がある。


ここで、

少しだけ怖くなった。


間違っていたことよりも、


気持ちよく間違え続けられる構造だったことが。


だから、

気づけなかった。