はじめまことの新文芸研究所

私が抱えている新文芸リストをもとに、新文芸を分析し記事にしていきます

第一回 自己紹介/ライトノベルのタイトルの長さとその時間変化についての統計分析


 はじめまして、と言ってもTwitterで私のことを知っている人の方がほとんどかもしれませんが、はじめまことです。種々の事情が重なりブログを開設すべき状況になったので、ブログを開設することになりました。一応自己紹介として、Twitterの垢とそこのプロフィールをコピペしておきます。

 Twitterhttps://twitter.com/kaz_lightnovel

ラノベに依存する大学生 新月お茶の会所属 共依存と重い女と幼馴染が好きなカプ厨で糖度至上主義者 推し作品50作:bookmeter.com/users/1152240/ キノの旅垢→ @kaz_KinoNoTabi

 とはいえ、作品の感想や購入に関してはTwitterで事足りている現状、あえてブログにする価値はあまり感じません。そこで、ブログ名の通り、現在製作中であり近々販売予定である新文芸に関するリストを使った統計・分析をこちらにて取り扱っていきたいと思います。もちろん読んだ本の感想や長めの所感など統計分析以外の記事についても適宜放流しようかとは思っていますが。

 

新文芸研究所について

 Twitterでの私の活動を日頃眺めている方はご存知かもしれませんが、私は新文芸を主とするレーベルについて、タイトル・著者名・巻数などの基本情報に加え、原作となるweb小説のURL・公開日・文字数・ポイント数・最終更新日や、コミカライズに関する情報をまとめたリストを作成しています。

 これは元々私が所属するサークルの会誌である『月猫通り2183』に掲載予定の企画のための資料だったのですが、一回限りでは勿体無い程度には手間がかかるデータ量になったため、定期的に分析をこちらに放流することになりました。しばらくは会誌の宣伝、ならびに合わせて販売を開始するこのデータリストの宣伝として、データリストおよびそれを用いた新文芸分析に関する記事を執筆していこうと思っています。

 

 新文芸研究所イメージ図

 

第一回 ライトノベルのタイトルの長さについての分析

 ということで、記念すべき第一回の分析は、ライトノベルのタイトルの長さについて。長くなったと言われるライトノベルのタイトルですが、サブタイを除けばそこまで変わっていないようにも思います。というわけで、どれくらいの文字数が主流なのか、ジャンルによって変化はあるのか、時間変化はあるのか、人気にどれくらい影響しているかなどを見ていこうと思います。

 分析した作品は3669作品。調査したレーベルは以下の通り。

ヒーロー文庫・プライムノベルス・MFブックスオーバーラップ文庫オーバーラップノベルスオーバーラップノベルスf・HJ文庫(2013年8月刊以降)・HJノベルス富士見書房ノベルス・カドカワBOOKS・TOブックス(2014年9月刊以降)・GCノベルズ・GCN文庫・アルファポリスアルファポリス文庫・アルファライト文庫スニーカー文庫(2013年10月刊以降)・ファンタジア文庫(2014年2月刊以降)・レジーナブックス・レジーナ文庫・エンターブレインの単行本・ファミ通文庫(大判)・ビーズログ文庫(大判)・MF文庫J(大判)・ファンタジア文庫(大判)・アリアンローズ・アイリスNEO

基本的にはサブタイを除いたタイトルを記入しており、またLEN関数を使用しているのでアルファベット表記のタイトルは体感と比べて長くなると思われます。調査対象についての詳しい条件や統計の取り方については後に販売するデータリストや会誌に記したのでこちらには書きません。買え。

 

 まずは全体。タイトル文字数の分布は下図の用になりました。最頻値は11文字。中央値は13文字。平均値は16文字ちょうど。11文字のところに大きな山がありますが、20文字に谷、23文字のところに小さな山があります。

 最頻値11文字は納得できる値です。作品数ではやはり男性向けの文庫が一番多くなりますし、文庫の背表紙に文字のサイズ最大で入る文字数もこれくらいでしょう。十年スパンでみればその辺の文字数が最も大きくなるでしょう。

 

 

 まずはジャンル別。調査したレーベルのうち、作品数が多かった男性向け文庫、男性向け大判、女性向け大判、中性大判の四つについてそれぞれ考えます。男性向け文庫は調査したレーベルが偏っている可能性はありますが、その他についてはおおよそ界隈の傾向を示していると言えるでしょう。

 各ジャンルの代表値はこのようになります。

  男性文庫 男性大判 女性大判 中性大判
平均値 15.9953952 15.8513011 16.9267564 16.0530822
中央値 13 14 15 13
最頻値 9 10 12 10

 いずれの値も女性大判が一番高くなっています。下の分布を見ても女性大判は山全体が右に動いているように見えるので、女性向け作品はタイトルが長くなりやすい傾向があるのでしょう。一方で、最大で52文字と小さくまとまっているのも女性大判の特徴です。

 また、男性文庫と男性大判では、平均値は文庫の方がやや高い一方、中央値や最頻値では大判の方が大きくなっています。分布を見てもわかる通り、文庫と比べて大判はグラフがなだらかになっており、文庫は最頻値付近に作品が集中しています。

 

 

 続いては、web発と非web発の傾向の違いについて。今回調査した作品は非web発作品のほとんどが男性向け文庫なので、男性向け文庫での傾向の違いを見ていきましょう。

  web発 非web発
平均値 17.2881356 14.9256662
中央値 14 13
最頻値 9 9

 代表値はこのようになります。中央値や最頻値はあまり変わりませんが、平均値に2文字以上の差がついています。

 分布は下のようになります。文庫と大判の比較と同様、非web発と比べてweb発の方が分布がなだらかなように見えますが、はっきり言ってよくわかりません。強いていうなら19-23文字の部分が差をつけていると考えられるでしょうか。とはいえ、web発は男性大判に、非web発は男性文庫に形が似ているように思います。

 

 続いては、時間変化。シリーズ開始年別に統計を取ります。代表値の変遷は下のようになりました。2011年以前はほとんど全てアルファポリスの作品であり、今のライトノベルのトレンドを反映しているとは言い切れないことに注意が必要ですが、それを踏まえても平均値・中央値共に年々上昇を続けています。やはりライトノベルのタイトルは年々長くなっていたようです。

 2012,16,20,23年の新シリーズの分布を載せておきます。明確に分布が左によっている2012を除いても、年々分布が右方向に拡張されていくのがわかります。「増え幅が大きい文字数帯」がどんどん右へずれていっています。年月と共に「タイトルの文字数として成立しているであろう文字数」が増加しています。

 

 最後に、タイトル文字数と人気との相関を見てましょう。ここでは、人気の指標として巻数と補正済みポイント数(カクヨムを22倍、アルファポリスを1/100)を考えます。

 というわけで、タイトル文字数と巻数・補正済みpt数との相関係数。どちらも絶対値0.1以下なのでまあほぼないと言ってしまって良い気はします。

巻数と -0.0757726
pt数と 0.06881336


 続いて、巻数とタイトル文字数の相関係数をweb発作品と非web発作品でそれぞれ計算させたもの。

web発 0.03655117
非web発 -0.1170035

 

 合わせて-0.076だったものが0.036と-0.117に分かれるとなると、ある程度の相関があると考えても良いかもしれないですね。

 となると、小説投稿サイト上ではタイトルの長さと人気に微弱な正の相関、書籍媒体上ではタイトルの長さと人気には微弱な負の創刊と捉えるべきでしょうか。

 最後に散布図。タイトル文字数と巻数の散布図に関しては格子点にしか点が配置されないため、一点に複数重なっている可能性があります。散布図を見る限りでは-0.07よりはだいぶ相関係数の絶対値の大きそうなグラフになっています。

 下はタイトル文字数と補正済みポイント数の散布図。横幅が広すぎて視認性にかけたので対数尺を取りました。底は10で取ったので、4が10000pt、5が100000pt、6が1000000ptです。こちらは相関係数通り、ほぼ相関のなさそうな形のグラフをしています。

 

 やろうとしていた企画が尽きたので、はじめまことの新文芸研究所、記念すべき第一回はここらへんで切り上げようと思います。とりあえずは『月猫通り2183』が発売される5月ごろまでは定期的にこのような分析企画を挙げていこうと思いますので、今後ともよろしくお願いします。


今回のまとめ

ライトノベルのタイトルの長さは平均16文字、中央値13文字、最頻値11文字

・女性向け作品は男性向け作品と比べ全体的に文字数が長い傾向にある

・非web発作品はweb発作品と比べ最頻値付近に鋭い分布になる(かも)

ライトノベルのタイトルは年々長くなっている

・小説投稿サイトではタイトルの長さは人気に微アド、書籍媒体では微ディスアド(?)