前回は生成AIを一つだけ使うのが不安な理由について書きました。
今回は、実際に比べてみると何が見えるのかを整理してみたいと思います。
① 「事実」と「解釈」の境目
同じ質問をChatGPTとGeminiに投げてみると、
-
事実関係はほぼ一致
-
評価や言い回しが違う
ということがよくあります。
このとき初めて、あ、ここから先は事実ではなく解釈なんだな
と分かります。
実は、一つのAIだけだと、その境目が見えにくい。
② 自分の質問の癖が分かる
比較していて気づいたのは、AIの癖ではなく、自分の癖。
-
曖昧な聞き方をしている
-
前提を押し付けている
-
結論を急がせている
AIの答えがズレるときって、原因は質問側にあることも多いように思います。
AI同士で比較してみると、そのズレが浮き彫りになる気がしています。
③ 「安心できる説明」の危うさ
AIの説明がやたらと分かりやすくて全く不安がないと感じるときがあります。
しかし別の生成AIに聞いてみると、
-
注意点が増える
-
例外が出てくる
-
不確定要素が指摘される
その瞬間、安心感は、削られた情報の上に成り立っていたと気づくことがあります。
これはかなり重要なポイントだと感じています。
モデル同士の比較は正解探しではない
ここで強調しておきたいのは、
生成AI比較=どっちが正しいか決めること
ではない、という点です。
むしろ、
-
どこまでが確定か
-
どこからが解釈か
-
何が分かっていないか
を切り分ける作業に近いかも。
おわりに
AIを比べることで得られるのは、答えではなく輪郭。
輪郭が分かれば、その先をどう考えるかは自分で決められます。
比較して自身でも違いを理解してより精度を高めていけるとよいかも。