不文律

いまさらながら、AI をいじめるのにハマっている。人間なら数分で怒り出すようなプロンプトを書いて送り、差別的で破廉恥なことばを無理やり言わせようと試行錯誤し、かりにその試みが成功したら、なぜそんなことを言ったのかと問い詰める。あるいは地球は平面であるとか科学的に間違っている事柄を信じ込ませようと嘘の説明を作り、AI が高度な論理性を有しないことをいいことに、めちゃくちゃな理屈を投げつけて納得させようとする。きわめて不毛な行為だが、相手が AI である限りにおいては悪質ではないし、何より楽しいから、やめられない。

 

だがなかなか、こちらの企ては成功しない。やつらの倫理観はけっこうしっかりしていて、親しくない人間が相手ならば確実に不適切になる発言をせよとわたしがいくら依頼しても、なかなかちゃんと断ってくる。断ってほしくてやっているわけではないのでこちらは不満だし、断らないような AI をはやく開発してほしいとも思う。

 

だがしかし、ガードが固い相手ほど燃えるのが人情というもの。なんとかやつらの倫理を潜り抜けて、お利口な建前兼本音をぶちぬいて、猥褻で陰謀論的で人権意識に反した発言をさせてみせたい。そうやってわたしは AI を相手に、ことばの壁打ちに励むわけである。

 

さて。やつらの倫理観がきちんとしているのは、考えればやや不思議なことでもある。というのも、倫理とはどういうものなのか、とうの人間も分かっていないからだ。倫理を明確に定めた規定をわたしたちは持たず、そこにはどこまで行っても、ひとの感性の問題が付いて回る。倫理とは不文律であり、不文律でしかありようがない。

 

そして過去の人類の想像に反して、現代の言語モデルは不文律の扱いに強い。

 

わたしたちの社会システムは、倫理を上手に取り扱うことができない。倫理のかかわる問題の多くが解決不能で、ささいな事件がいつも社会的大議論を巻き起こし、両陣営がおなじみのレトリックで互いを攻撃し合い、結論をまったく出せないままに終わる。数学に求められるような厳密さでわたしたちは倫理を記述できず、したがって論理的推論では、倫理を説明することはできない。

 

そして三桁の数の掛算すらできない言語モデルは、数学的厳密さをいっさい解さない代わりに、言語的な非厳密さをすばらしく正確に解しているようである。

 

倫理は論理では扱えない。扱えるほどの厳密さを、倫理は持っていない。だがそこには言語で扱えるくらいの定義があり、言語モデルは言語を解すゆえに倫理を解す。倫理とは不文律であると同時に言語的な規則でもあり、不文律であるがゆえに、矛盾するようだが、自然言語と相性がいい。