はいふり批評25 読者反応批評への機械学習の応用

聖書はそれを読むひとびとすべてとともに成長する

――グレゴリウス一世「ヨブ記講解」

以前読者反応批評を実施した時に「現代用の読者反応批評理論の構築も可能なのかもしれない」と書いていたが、以降その方法を考えてきた。

no-known.hatenablog.com

今回は新しい読者反応批評として考えついた方法を一つ試してみたいと思う。今回行うのは、流行りの機械学習の成果を読者反応批評に応用してみようというものである。

機械学習と読者反応批評

読者反応批評は作者や作品ではなく、読者に注目した批評理論だった。以前の批評ではあにこ便*1というサイトをざっくりと眺めて視聴者の反応の推移を見ていた。ところが、上記のような見方だと私の意識的・無意識的な取捨選択が入り込んでしまい、実際の結果を歪めてしまったり、重要な特徴に気づかない可能性が考えられる。しかし、それを解消するために一つ一つのコメントを精査するとなると、途方もない時間がかかってしまうだろう。

そこで、機械学習の成果を利用して大量のコメントの精査ができないかと私は考えた。機械学習とは、簡単に説明するとプログラムにたくさんデータを与えてパターンを学習させ、人間でないと困難だった処理(画像処理、言語処理)をやらせてしまおう、という話だ。

この分野の一つで「感情分析」というものがある。あるテキストを読み込ませて、そのテキストがポジティブなものか、ネガティブなものかを判断するというものだ。本来は製品の感想などに使用して、問題を素早く分するためのものだが、今回はこれをはいふりのコメントに利用してみたいと思う。

今回やりたいことについて

今回やりたいのは以下の2点である。

  1. あにこ便に投稿されたTV版はいふりのコメントに対する感情分析
  2. ポジティブ/ネガティブごとに頻出している単語の集計

 ポジティブ/ネガティブな意見のコメントに分けて頻出単語を見比べることで、両者が持っている、あるいは持っていた「期待の地平」を明らかにしたい。そうすることで、持っていた「期待の地平」によって作品の評価自体に違いが表れること、強いてはそれがはいふりの賛否両論につながっていることを観測したいと考えている。

では、上記の分析のために今回使ったツールを紹介する。批評には関係ないので興味がなければ読み飛ばしてほしい。

ツール名
Python 3.8.5
MeCab 0.996
asari 0.0.4

PythonMeCabとasariを動かすための言語として使った。とても使いやすいし、いろいろなことができて非常に便利。あにこ便からコメントを抽出する処理もこのPythonで作った。MeCab形態素解析エンジンであり、文章を単語分けするために使用した。

taku910.github.io

MeCabは単語を認識するのに辞書を用いるが、新語が多く収録され更新も頻繁に行われているというmecab-ipadic-NEologdを使わせてもらった。

asariは感情分析を行うツールとして使用した。実際に使ってみて体感7割くらい正しい判断が出来ていたので信用できると思う。日本語の感情分析のツールは少ないので貴重だ。

hironsan.hatenablog.com

上記のツールたちを使用してあにこ便のコメントを分析したが、今回コメント中に含まれているリプライ(特定のコメントに対する発言)については分析から除外した。これは作品に対する発言になっていないことが多いからである。それでは、分析した結果を見ていこう。

あにこ便のコメント分析

コメント数からの分析

詳細な分析結果を見る前に、はいふりに対するコメントはどの程度の数があったのかを確認しておこう。はいふりの場合、これだけでも得られる情報がある。以下のコメント数は2021年2月7日時点での調査結果である。

  はいふり カバネリ キズナイーバー マヨイガ
1話 497 780 162 332
2話 513 553 98 140
3話 558 476 89 282
4話 567 811 72 151
5話 1282 520 80 282
6話 1194 437 59 216
7話 727 353 114 217
8話 702 445 95 190
9話 851 752 229 167
10話 880 592 246 179
11話 948 544 70 153
12話 1185 1051 161 440

はいふりと一緒にコメント数を載せている「カバネリ」「キズナイーバー」「マヨイガ」はすべてはいふりと同時期*2に放送していた1クールのオリジナルアニメである。

まずはいふりのコメント数で顕著なのは5話のコメント数が4話から2倍以上に増えている点だろう。他のアニメではそのような伸びが見られないため、これは「あにこ便がこの時期突然有名になって閲覧者が増えたため」ではないことが分かる。つまり、この伸びは5話への反響の大きさを表しているのである。

5話といえば岬明乃が宗谷ましろの制止を振り切って武蔵へ向かっていく話であり、体感的にも批判が多かった話数だ。そのあたりの批判がなぜ起きたかについても、以前はいふり批評でまとめたことがある。

no-known.hatenablog.com

後の分析でも述べるが、この5話については艦長の行動に対して言及したコメントが多くなっている。つまり、コメント数の増加は視聴者の「期待の地平」と実際の作品との隔たり、すなわちヤウスの言う「地平の変化の要求」が発生した結果だと思われる。

これを詳細に見ていくために、今度はポジティブ/ネガティブごとに頻出単語を見ていこう。

コメント頻出単語からの分析

各話ごとにポジティブ/ネガティブのコメント頻出単語をまとめた結果が以下の表になる。頻出単語はトップ20まで出している。

f:id:no_known:20210211174552p:plain

f:id:no_known:20210211174605p:plain

特徴的だと思われるところは私で色を付けている。それぞれの場合で一番頻度が高いものに「*(アスタリスク)」があるが、これはMeCabで辞書に定義がなかった単語がこの文字に置き換えられてしまうために出ている。すべて分類できるのがベストだが、今回はしょうがないのでこのままにした。

それではコメント数が増加した5話の頻出単語を見てみよう。ここでは1~4話にはなかった単語がポジティブ/ネガティブ共にトップ20に上がってきている。それが「行動」と「自分」である。コメントを見たところ「自分」というのはほぼ岬明乃の代名詞として使用されていた。つまり、5話のコメントでは岬明乃の行動に言及するコメントがそれまでよりも増えていたということになる。

さらに、6話の単語には新しく「副長」が現れている。ここでは副長の方が正しいのか艦長の方が正しいのか、という点についてのコメントが多く見られた。私は以前の批評で「家族」に対しての価値観の違いから評価の二分が発生したと考えたが、どちらかと言えば「役職」や「責任」に対する価値観の違いから二分が発生しているように見える。

これは以前の批評をひっくり返す結果だが、それゆえに意味がある。今後、この「役職」「責任」という観点ではいふりを見るとさらなる発見ができるかもしれない。

ポジティブなコメントに見られる特徴

次に、ポジティブなコメントの特徴について見ていきたい。

一番に目につくのは、表の中で青色にした「ちゃん」という単語である。ポジティブ側では12話中11話で現れているが、ネガティブ側では2話しか現れない。

この「ちゃん」はもちろん「ミケちゃん」「シロちゃん」などの「ちゃん」が抜き出されたものである。つまり、ポジティブ側はキャラの識別ができているが、ネガティブ側はできていないように見える。

おそらく、はいふりという作品に関しては「面白い」「つまらない」と判断するトリガーに「名前を覚えられるかどうか(識別できるか)」が意外に大きく関わっているのではないかと考えられる。

元々、キャラクターとストーリーは切っても切れない関係だ。漫画を対象とした言説になるが、評論家の伊藤剛は著書「テヅカ・イズ・デッド ひらかれたマンガ表現論へ」の中で以下のように語っている。

実際のところ、マンガを「読む」際、完全にキャラクターだけを見つめる「読み」があるとも考えにくく、逆にキャラクターの魅力をまったく無視したストーリーテリングもまた非現実的であろう。

また、漫画原作者大塚英志も著書「キャラクター小説の作り方」でこう述べている。

キャラクターを作る上でのポイントはこの主人公の外見上、設定上の個性がドラマの根幹ときちんと結びついているか否かにあります。

つまり、キャラクターの識別がままならなければストーリーの理解も不完全にならざるを得ないということだ。

特にはいふりは岬明乃と宗谷ましろのキャラ設定がストーリーにかなり影響してくる作品である。2人の設定の違いから家族に対する認識、艦長に対する認識の違いが生まれ、ドラマが生まれてきている。はいふりはキャラの識別の度合いが、ストーリーの理解に直接影響する作品なのだ。

この点でキャラクターが多く覚えるのに苦労するはいふりは、かなり視聴者に厳しい設定になっている可能性がある。

ネガティブなコメントに見られる特徴

先ほどとは逆に、ネガティブなコメントの特徴を見ていこう。

ネガティブ側ではポジティブ側では一度も現れない単語がよく出ていた。前半の話で「敵」「シリアス」、後半の話で「感染」がそれである。

「敵」という言葉が使われているコメントを見ていくと「敵側の描写がなくてつまらない」といったものが多かった。1~3話の時点では明確な敵がいるか不明な状態であるが、その中でネガティブ側にのみ「敵」という言葉が多く出てきたことはネガティブ側は「明確な敵がいるべきである」という「期待の地平」を持っていることを表している。

次に「シリアス」という言葉が使われているコメントを見ていく。ここでは「ほのぼのにしたいのかシリアスにしたいのかわからない」というものが多かった。これも同様に解釈すると、ネガティブ側は「シリアスとほのぼのは作品として明瞭に分かれているべきである」という「期待の地平」を持っていることを表しているだろう。

「敵」「シリアス」というものに期待を持っていた人ははいふりに対して批判的になりやすい傾向があることが分かった。これはつまり、作品の出来そのものではなく、視聴者個人が持っていた「期待の地平」の影響で作品の面白さ、つまらなさは変わっている、ということである。

最後に「感染」という単語を確認する。ここでは「感染経路がどうなっているのか」「なぜ猫には感染しないのか」「なぜ感染後は海水で回復するのか」などのコメントがあった。これは総括すると作品のリアリティに対する批判といったところだろう。

アニメにおける「リアリティ」とは何なのか、という点について議論し始めるとおそらく批評が1本出来上がってしまうのでここでは行わない。ただ、ネガティブ側の「期待の地平」として「リアリティをより強く求める」という点はここに残しておきたいと思う。

おわりに

今回読者反応批評に機械学習を導入してみたが、予想以上に面白い結果が得られたように思われる。特にヤウスの言う「期待の地平」を視覚化でき、かつその違いによって作品の評価が変わることが分かったのは大きい。

さらには、その「期待の地平」は一種類ではなく、複数が絡み合って視聴者の反応を生み出している。「役職」「責任」「敵」「シリアス」「リアリティ」、今回はいふりを見ただけでもこれだけの「期待の地平」があった。特に後ろの3つははいふりの視聴者にとって賛否を分けるほどの重要な要素であったようだ。

上記の反応の結果は同時にはいふりという作品の特徴であると言えるだろう。それは以下のようにまとめることができる。

  • はいふりに表現される「役職」「責任」の表現は一般的ではない
  • はいふりはキャラ理解とストーリー理解の関連性が強い
  • はいふりには明確な敵がいない
  • はいふりはシリアスとほのぼのが同居している
  • はいふりはリアリティが高い作品ではない

ここで現れたはいふりの姿は、あくまで2016年時点での読者反応の結果である。地平の変化が起こり、後の時代に見るはいふりはこれとは異なる姿をしているだろう。この批評がはいふりという作品の歴史的断面を覗いた貴重な資料になることを祈りたい。

*1:http://anicobin.ldblog.jp

*2:2016年4月~6月