はじめまことの新文芸研究所

私が抱えている新文芸リストをもとに、新文芸を分析し記事にしていきます

第三回 web小説の書籍化ラインとその変遷についての分析

 前回のブログは大体会誌のコピペだったため販促にはなっても新規性はなかったしブログとしての価値もそこまで高くなかったように思うが、今回はちゃんと一回で情報が完結するそれなりに有用な情報をお届けできると信じている。

 

第1回はこちら

https://kaz-lightnovel.hatenablog.com/entry/2024/03/31/193435?_gl=1*3conj6*_gcl_au*MTE1Njg3MjYwNS4xNzExMjc4NTE5

 

 と言うわけで、今回のお題は書籍化ラインについて。ざっとなろうで10000pt程度かなという認識くらいはあると思うが、リアルタイムで変わっていく値でもあるため、なかなか定性的な分析は難しい値である。また、女性向け作品の台頭もあり、書籍化作品についても原作文字数についても低下しているイメージはあるだろう。今回の分析では、なろう全体を文字数やポイント数で分割して作品数の分布を調べて書籍化作品割合を調べたのち、その変化についても考察していく。

 さて、まずは大雑把に現在の書籍化作品全体の傾向をみていこう。

 書籍化作品の原作文字数の分布はこのようになる。横軸の文字数は常用対数をとった。全体の平均値は717,549文字、中央値は404,719文字である。それぞれ常用対数を取れば5.86、5.60程度となる。おおよそ10^5.1文字から10^5.8程度に固まっていることがわかるだろう。

 こちらは作品数が集中している2,000,000字までを50,000文字区切りでカウントしたもの。単巻完結と思われる10~20万字帯に多くの作品が分布しており、それより上は負の相関にある。このデータでは短編→長編→書籍化となった場合基本的に長編のデータを載せているので、10万字を切る作品は少ない。

 

 

 次に、ポイント数の概観について。前々回に引き続き補正済みポイント数(カクヨムは☆数×22、アルファポリスは総合評価/100)を用いる。

 まずは常用対数尺で分布をとってみるとなぜかめちゃめちゃ綺麗な分布になった。なんで?平均値は92532pt、中央値は53853ptである。それぞれ常用対数を取れば5.0と4.7程度になる。

 文字数同様作品数の多い250000ptまでを5000pt区切りで出してみるが、0-5000ptが意外にも一番多い結果となった。また、35000pt程度まではほぼ横ばいになっている。小説投稿サイトにおいてはポイント数と作品数これでは作品数の減少と比べてみるまで何もわからない。そちらはもう少し後でやるとして、0-30000pt程度までをグラフにしてみる。


 というわけで0ptから30000ptまで1000pt区切りでカウントしたグラフがこちら。ぶっちゃけ何も見えない。おそらく公募のせいで低ポイントの書籍化が増えてるのであろう。もう少し詳細な分析が必要そうである。

 

 というわけで、まずはジャンル別で文字数。上から順に男性文庫、男性大判、女性文庫、中性大判である。どのジャンルにどのレーベルが入ってるかは第一回のブログから変わってないのでそちらを参照されたし。

  男性文庫 男性大判 女性大判 中性大判
平均 681884.134 961165.807 373408.084 934781.824
中央 460978 569541 215403.5 572008.5

 相変わらず女性大判はわかりやすい。というか代表値からして違いすぎる。12-16万文字程度に作品が集中している。男性文庫は10万字弱程度から作品数が増え始め、男性大判や中性大判は10万字を超えたあたりから作品数が増え始める。女性大判以外は5.7から5.8あたりが最頻となっており、およそ50-70万字程度となる。

 

 次に、ジャンル別でポイント数。順番は変わっていない。

  男性文庫 男性大判 女性大判 中性大判
平均 93506.2344 110011.741 70986.8794 108141.777
中央 53716 61889.515 48019.06 62651

 全体のグラフと比べれば歪だが、どのジャンルも4.7〜4.8(5~60000pt)程度を中心とした綺麗な山になっている。特徴を挙げるとしたら男性文庫に3.6(5000pt)程度のところに山があることだろうか。というか全体的に男性文庫は低ポイントの書籍化が多い。新人賞作品にwebで連載されてた作品があったり作者のつながりで出したりするからだろうか。

 

 さて、この分析はここからが本番である。今回の分析内容は「書籍化ライン」であり、つまりは「この文字数・ポイント数の作品がどれくらいの確率で書籍化できるか」という話である。それを算出するためには、書籍化・非書籍化を問わない母数を算出しなければならない。

 というわけで、なろう全体の文字数とポイント数の分布を見てみよう。文字数は検索欄に一つ一つ数字を入れていけば出てくるし、ポイント数も一度総合ポイント数を絞って検索をかけた後にURLの数字を変えていけば出てくる。そういうわけでできたのが下の分布である。


 上が文字数、下がポイント数の分布。まずは文字数から見ていこう。

 文字数の分布の特色は、なんといっても10万字付近の山。基本的には指数関数的な分布になっているが、小説一冊分と言われる10万字前後にくっきりと山ができている。感動ものである。ただなかなか近似の関数を作るのが難しい。1時間くらい格闘して無理そうだったので諦めた。

 ポイント数に関しては、4.5程度まではおよそ線形に見える。それ以降はおよそ公比0.7の指数関数的な変化とすれば良いだろうか。そうしてできたのが下の青線のグラフ。なんだかんだでそれなりに良い近似ではなかろうか。式は

y=13500-2800*log10x(x<10^4.5)

y=2361547207*x^(-1.426675)(10^4.5<=x)

 

 基本的にポイントの補正は「あらゆる小説投稿サイトのポイント数は定数倍の補正を掛ければ同じ分布になる」という理念のもとに行っているので、この分布の形も他のサイトでも共通であるとする。

 

 さて、では比率を出していく。書籍化作品の分布をなろうの分布で割って折れ線グラフにするだけの簡単なお仕事である。10^-5から3程度まで変化しているため、縦軸も常用対数とした両対数グラフで示す。

 

 文字数・ポイント数双方に書籍化作品数との正の相関があるが、その実態はだいぶ異なる。

 文字数の方は、10万字で1/200程度、20万字で1/60程度、50万字で1/20程度、100万字で1/12程度、200万字で1/10程度、500万字で1/6、100万字で1/2程度となる。

 ポイント数の方は、5000ptで1/100、10000ptで1/50、20000ptで1/14、50000ptで2/5、100000ptで1/2を超え、200000ptでほぼ確実となる。

 実際には母数はなろうの方でしか測っていないのと全ての書籍化作品をカウントしているわけではないことから、割合としては定数倍が必要になる。この辺はめんどくさくなったので正確な補正を諦め、5.7と5.8の値が1.58程度で並んでいることからとりあえず2/3倍して計算する。

 形変わってないしわざわざグラフ化する必要もなかったかもしれない。5000ptで1/160程度、10000ptで1/80程度、20000ptで1/25程度、50000ptで1/4程度、100000ptで1/3を超え、およそ400000ptでほぼ確実に書籍化するところまで行く。カクヨムアルファポリスが混ざっていることを考えれば体感的にも納得できるだろう。なろうでも「謙虚堅実」や『異世界転移で女神様から祝福を!』あたりは40万pt前後である。また、十分に確率の高い部分では、30000ptあたりと50000ptあたりを境に書籍化割合が大きく伸びている。

 

 

 続いては、書籍化ラインの変遷について。書籍化ラインの変遷を見るときは、基本的にポイント数や文字数は時間と共に増加するということに気をつけなければならない。とりあえずは代表値の変遷を見てみよう。

 まずは文字数の平均値と中央値の変遷。エクセルで3本の棒グラフのうち一本だけ別軸にするのがめんどくさかったので代表値は棒グラフになっているがまあ問題はないだろう。ある程度作品数がある2013年以降は平均値はほぼ単調に減少、中央値も減少傾向にあり、2015から2017にかけて特に大きく減っていることがわかる。

 続いてはポイント数の変遷。こちらも減少傾向にはあるが、2017年以降は増減を繰り返しており、2017から2020までだけを見れば増加しているようにも見える。時間と共に増加するポイントを考えれば増えていると考えるべきだろう。もしかしたら2017以降再び増加傾向にある可能性もある。作品数の値が上のグラフと違うのはダイジェスト化等により文字数が取れずポイント数だけがとれた作品が存在することによる仕様である。

 

 分布の変遷も。まずは文字数の分布。上から順に13年,17年,20年,23年の分布である。全体的に左に寄っているが、10-12万字程度に高い壁があるようだ。やはり10万字を下回る書籍化は少ない。年代が進むごとに10万字の壁が高くなるのは女性向けの流行のせいだろう。10万字台を除いて考えてもやはり山の中心が左に寄っているのは確かである。

 

 続いてポイント数の変遷。やはり2017から2020年にかけて一時的に増加に転じている時期がある。また、10000pt以下の書籍化が増加しているのも特徴だろうか。

 

 さて、2017から2020にかけて文字数は減少しつつもポイント数が増加している原因として有力なのは、やはり女性向け作品の増加だろう。というわけで、女性大判・女性文庫を除いたリストで再計算をしてみる。

 

 こちらが女性向けレーベルの作品を除いた各年の文字数の代表値の変遷。平均値は各年10万から30万ほど、中央値は8万から20万字ほど増加している。また、2020年から21年にかけて作品数が減少しているのも特徴的だ。

 

 続いてこちらが女性向けレーベルの作品を除いたポイント数の増減。平均値は4000から18000pt、中央値は0から16000ptほど増加しており、特に2018,2021年の伸び幅が大きい。全体の傾向としては変わらないが、より変化が大きくなったように感じる。

 

 続いて女性向けレーベルを除いた文字数分布。予想通り、女性向け作品を除いたことで10-12万字程度の作品が一気に減少した。依然としてそこに山があることに変わりはないが、2023年でも一番大きな山は30万字程度にある。全体としてはやはり分布は左に寄っているが、女性向けを除いたことで変化は小さくなったと言えるだろう。

 

 こちらはポイント数の変遷。私の想像しているほどは10000pt以下の書籍化が減っていないように思う。むしろ2023年などは分布としては左に寄っているようにも見え、(中央値は少しだけ正に変化している。)2023年以外はそこまで大きく分布の形が変わっているということはなさそうである。

 

 代表値の変化で見ても、分布の変化を見ても、女性向け作品を抜いたからといって顕著に傾向が変化しているということは見えなかった。TOやカドカワBOOKSなどの中性レーベルが悪さをしている可能性もあるが、文字数が変化せずに書籍化ポイント帯だけが上昇したのはおよそ全体的な傾向だったと結論づけても良いだろう。女性向け作品が上昇したのもコロナ禍でのなろうの読者層の変化によるものだという話があるし、その流れで男性向けの書籍化作品にも人口が流入してポイントが増えたとかその程度の話なのかもしれない。

 

 さて、予定していた議論は大体できたし、そろそろブログのアップロード時刻なので今回の分析はここまでとさせていただく。最後にもう一度。月猫通り2183をよろしくお願いします。

 

今回のまとめ

文字数について

・全体では十万字程度の書籍化が多いが、女性向け作品を除くと50-70万字程度が書籍化作品の最頻となる。

・全体から見た書籍化作品の割合で考えると、10万字で1/200程度、50万字で1/20程度、200万字で1/10程度、500万字で1/6、100万字で1/2程度となる。

・書籍化ラインは2015年から2017年の間に大きく低下し、現在は平均値50万字、中央値30万字程度となっている

 

ポイント数について

・全体的には30000pt程度まで書籍化作品数はほぼ横ばいとなり、ジャンル別でもそこまで変化はない。

・全体から見た書籍化作品の割合では、5000ptで1/160程度、10000ptで1/80程度、20000ptで1/25程度、50000ptで1/4程度、100000ptで1/3を超え、およそ400000ptでほぼ確実に書籍化する。

・書籍化ラインは2017まで下降を続けていたが、2017から2020まで再び上昇した。現在も上昇を続けている可能性がある。