屑籠というかゴミ箱

主に家のサーバーの遍歴と使った製品のレビュー

なろう上位のタイトル長傾向確認(短歌を超えたその後)

2021年の傾向確認

なろう小説APIを試してみた - Qiita
において小説家になろうにおけるタイトル長の傾向分析があったものの2021年の状況がなかったのでなろうAPI試すついでに調べてみた。

基本的な方針としては

  • APIで全件のデータを取得する
  • APIからのデータ取得時点における総合ポイントの年間上位N位までを集計対象にして調査
  • 初回投稿を投稿年とする。タイトル変更はしらん(APIだと多分拾えない

といった感じですすめる。
なろう小説APIを試してみた - Qiita
↑の集計方法とはサンプルデータが違うので違う結果が出てくるかと思ったけどちゃんと同じ傾向だったのでこのまま進めた。
全件のデータ取得方法については以下を参考に実施
karupoimou.hatenablog.com

TOP100、500、1000、2000、10000で調べた
それにしても、なろうの小説件数が80万件を超えていて驚いた。(取得した1月末時点で86万件超)最近は短編が粗製乱造されているので件数の伸びも激しいのではないかと予想しているが100万件が早くて今年、遅くても再来年くらいには達成されそうな感じか

結論/感想

ほぼ前年通りの結果が見えたが、上位陣の傾向がこれまでと異なりタイトル長の増加に陰りがあり、飽和状態へ?

上位1000位までだと、前年減になっている。
上位陣はタイトル長を昨年よりも短くする傾向が現れているものの、全体的な傾向としてはまだ伸びている
2021年の傾向を受けて2022年は全体傾向としても減るのではないかと予想するが、さてどうなるだろうか(2022/02/12コメント)

結果

2004年あたりは上位10000だとサンプルが満たない可能性あるのでそのあたりはあるデータでチェックしたと思ってもらえれば。
縦軸の範囲も描画自動化してたので揃ってないな、とか各年のサンプル件数数えるの忘れたとか残件あるけど気が向いたらやる感じで

それにしてもサンプル件数増やすとグラフもなめらかになるの面白いな…

上位100位
Top100
top100
上位500位
Top500
Top500
上位1000位
Top1000
Top1000
上位2000位
Top2000
Top2000
上位10000位
Top10000
Top10000

補足(データ:平均タイトル長)

TOP100 TOP500 TOP1000 TOP2000 TOP10000
2004 6.83 7.341727 7.341727 7.341727 7.341727
2005 8.59 8.106000 7.874000 7.986947 7.986947
2006 10.20 9.632000 9.134000 8.450000 8.272634
2007 9.89 9.680000 9.540000 9.028000 8.392640
2008 10.33 10.584000 10.157000 9.701500 8.790788
2009 10.83 10.034000 10.392000 9.932000 9.022700
2010 10.11 10.198000 10.041000 10.203500 9.467900
2011 10.72 10.868000 10.817000 11.025000 10.382900
2012 13.10 12.752000 12.079000 11.715000 11.168500
2013 14.12 13.978000 13.978000 13.431000 12.047700
2014 16.95 16.678000 16.373000 15.677500 14.003500
2015 17.65 17.660000 17.306000 16.996500 15.471900
2016 23.10 20.192000 18.933000 18.438000 16.744100
2017 23.65 22.906000 21.825000 21.224500 18.418900
2018 28.66 28.098000 26.477000 24.726500 21.339200
2019 30.23 29.898000 27.899000 26.223000 23.803200
2020 48.42 40.210000 36.817000 32.918500 29.356800
2021 45.61 38.684000 35.746000 34.112500 33.554800

2004年、2005年は途中で値が変わらなくなっているのでデータ足りてなさそうね。
今度確認しておこう

それにしてもTOP100の2019~2020年の伸び方すごいな
タイトル長は100文字が最大値なので、平均でほぼ半分使うのが上位陣という10年前には考えられない事態になってる