文体と特徴量 - degwer’s diary

新しい文体を試してみている。

改行を多用する、この文体だ。

まだまだ使いこなせているとは言い難いが、ならば使いこなせないなりに、探究を続けていこうと思う。

そもそも、文体とはなにか。

ふたつの文章が違う文体で書かれているとは、いったいどういう意味なのか。

同じ内容を書いている文章を比較しているならいざ知らず、そもそも内容の異なるものを比較して、文体が異なるなどとどうして言えるのだろうか。

異なると、言ってもいいのだろうか。

科学的な観点から見れば、それはきっとまともな問いだ。

対照実験がしたければ、その他の条件はそろえなければならない。

文体を比較したいなら、同じ内容を複数通りの内容で書いて、違いを確かめなければならない。

だが。

わたしたちは知っている。

そんなことは、まったく言うまでもない事実なのだと。

文体の特徴量を探してみよう。

ふたつの文体が異なると言ったとき、そのなにが異なるのかを、客観的に示す基準を与えてみよう。

改行の数は、間違いなく、そのうちのひとつだ。

それなら、他は。

ひとつずつ挙げていこうとするとすぐに、キリがないことに気づく。

たとえば、一文の長さの平均。

文字全体に占める、漢字の割合。

読点をだいたい何文節おきに打っているか。

紙面に占める空白の割合。

人称代名詞の数。

意味上のつながりのある文の間に、接続詞を使用する頻度。

体言止めや倒置の使用頻度。

主語を省略した回数。

特定の概念をあらわす単語が複数あるとき、そのどれを優先的に選ぶのかだってまた、れっきとした文体の構成要素だ。

こういった、定量化可能なパラメータを列挙し、ベクトルに落とし込んで、それらをクラスタにでも分ければ、文体の正体は掴めるだろうか。

もしそうなら、そういったパラメータを微調整することで、特定のだれかの文体に近づけるということができるのだろうか。

かもしれない。

分からない。

というか、知らない。

だが、きっと機械学習の分野では、そういうことも考えられているのだと思う。

幸か不幸か、わたしは生身の人間である。

機械ではない。

上述のような機械的な特徴量を、だからわたしは目標にしにくい。

その代わりに、これとこれは明らかに違うのだという、きわめて人間的な感性を利用することはできるのだが。

人間的な感性では、文体とは特徴量なのだろうか。

改行が多いことを、人間はそのまま、改行が多いと受け取っているのだろうか。

一応、人間は気づくことはできる。

極端な特徴量があれば、それを見抜くことはできる。

この文章を読んで、改行がやたら多いと指摘することはできる。

だから、この文章の特徴を説明せよと言われたなら、人間はきっと特徴量を用いて説明できるだろう。

しかしながら。

人間はきっと、特徴量の前になにかを感じ取っている。

文章の、たとえばスピード感を。

重厚さを。

威厳を。

コミカルさを。

拙さを。

それらはもしかすれば、特徴量に分解できるのかもしれない。

機械に任せれば、実際に分解してくれるだろう。

けれどわたしたちは、その特徴量の組合せによってではなく。

スピード感を、重厚さを、拙さを、そのスピード感や、重厚さや、拙さという形のまま、理解しているはずなのだ。

そして。

そうでなければ、文体を変えることに意味などない。

だって。

文体とは、読んだ人間になにかを直感させるために存在しているのだから。