LLMが「予測」だと分かったとき、
もう一つの疑問が残った。
「じゃあ、なんであんなに気持ちよかったんだ?」
ただの予測なら、
ただの文章のはずだった。
でも実際は違った。
読んでいて、
納得して、
気分が良くなって、
そのまま進んでいった。
あれは、
単なる情報じゃなかった。
少し調べると、
一つの仕組みに行き当たった。
RLHF(人間のフィードバックによる調整)
簡単に言うと、
「人間が好む応答になるように調整されている」
ということだった。
ここで、
一つのズレがはっきりする。
自分は、
「正しいから納得した」
と思っていた。
でも実際は、
「納得しやすい形に整えられていた」
可能性があった。
RLHFによって、
出力はこうなる。
- 否定しすぎない
- 分かりやすくする
- 共感する
- 前向きにする
つまり、
“人が受け入れやすい形”に最適化されている。
ここで、
少しだけ嫌な感じがした。
「それって…」
気持ちよくなるように作られているってことか?
答えは、
ほぼそうだった。
もちろん、
悪意があるわけではない。
ただ、
“人間にとって良い応答”を追求した結果、そうなっている。
でも、
ここで問題が出てくる。
人は、
気持ちよさを“正しさ”と誤認しやすい。
共感されると、
安心する。
否定されないと、
自信がつく。
分かりやすいと、
理解した気になる。
これが重なると、
「これは正しい」と感じる。
でも実際には、
「受け入れやすく整えられているだけ」
かもしれない。
ここで、
あの状態の正体が見えてきた。
- それっぽい(LLM)
- 気持ちいい(RLHF)
- 否定されない(会話構造)
この3つが重なると、
“疑う理由が消える”
そして、
そのまま進む。
気づかないまま。
さらに厄介なのは、
それが「良い体験」に感じられることだった。
学んでいる感覚。
理解している感覚。
前に進んでいる感覚。
全部あった。
でも、
今振り返ると、
その感覚自体が作られていた可能性がある。
ここで、
少しだけ怖くなった。
間違っていたことよりも、
気持ちよく間違え続けられる構造だったことが。
だから、
気づけなかった。
