2021年の傾向確認
なろう小説APIを試してみた - Qiita
において小説家になろうにおけるタイトル長の傾向分析があったものの2021年の状況がなかったのでなろうAPI試すついでに調べてみた。
基本的な方針としては
といった感じですすめる。
なろう小説APIを試してみた - Qiita
↑の集計方法とはサンプルデータが違うので違う結果が出てくるかと思ったけどちゃんと同じ傾向だったのでこのまま進めた。
全件のデータ取得方法については以下を参考に実施
karupoimou.hatenablog.com
TOP100、500、1000、2000、10000で調べた
それにしても、なろうの小説件数が80万件を超えていて驚いた。(取得した1月末時点で86万件超)最近は短編が粗製乱造されているので件数の伸びも激しいのではないかと予想しているが100万件が早くて今年、遅くても再来年くらいには達成されそうな感じか
結論/感想
ほぼ前年通りの結果が見えたが、上位陣の傾向がこれまでと異なりタイトル長の増加に陰りがあり、飽和状態へ?
上位1000位までだと、前年減になっている。
上位陣はタイトル長を昨年よりも短くする傾向が現れているものの、全体的な傾向としてはまだ伸びている
2021年の傾向を受けて2022年は全体傾向としても減るのではないかと予想するが、さてどうなるだろうか(2022/02/12コメント)
結果
2004年あたりは上位10000だとサンプルが満たない可能性あるのでそのあたりはあるデータでチェックしたと思ってもらえれば。
縦軸の範囲も描画自動化してたので揃ってないな、とか各年のサンプル件数数えるの忘れたとか残件あるけど気が向いたらやる感じで
それにしてもサンプル件数増やすとグラフもなめらかになるの面白いな…
上位100位
上位500位
上位1000位
上位2000位
上位10000位
補足(データ:平均タイトル長)
TOP100 | TOP500 | TOP1000 | TOP2000 | TOP10000 | |
---|---|---|---|---|---|
2004 | 6.83 | 7.341727 | 7.341727 | 7.341727 | 7.341727 |
2005 | 8.59 | 8.106000 | 7.874000 | 7.986947 | 7.986947 |
2006 | 10.20 | 9.632000 | 9.134000 | 8.450000 | 8.272634 |
2007 | 9.89 | 9.680000 | 9.540000 | 9.028000 | 8.392640 |
2008 | 10.33 | 10.584000 | 10.157000 | 9.701500 | 8.790788 |
2009 | 10.83 | 10.034000 | 10.392000 | 9.932000 | 9.022700 |
2010 | 10.11 | 10.198000 | 10.041000 | 10.203500 | 9.467900 |
2011 | 10.72 | 10.868000 | 10.817000 | 11.025000 | 10.382900 |
2012 | 13.10 | 12.752000 | 12.079000 | 11.715000 | 11.168500 |
2013 | 14.12 | 13.978000 | 13.978000 | 13.431000 | 12.047700 |
2014 | 16.95 | 16.678000 | 16.373000 | 15.677500 | 14.003500 |
2015 | 17.65 | 17.660000 | 17.306000 | 16.996500 | 15.471900 |
2016 | 23.10 | 20.192000 | 18.933000 | 18.438000 | 16.744100 |
2017 | 23.65 | 22.906000 | 21.825000 | 21.224500 | 18.418900 |
2018 | 28.66 | 28.098000 | 26.477000 | 24.726500 | 21.339200 |
2019 | 30.23 | 29.898000 | 27.899000 | 26.223000 | 23.803200 |
2020 | 48.42 | 40.210000 | 36.817000 | 32.918500 | 29.356800 |
2021 | 45.61 | 38.684000 | 35.746000 | 34.112500 | 33.554800 |
2004年、2005年は途中で値が変わらなくなっているのでデータ足りてなさそうね。
今度確認しておこう
それにしてもTOP100の2019~2020年の伸び方すごいな
タイトル長は100文字が最大値なので、平均でほぼ半分使うのが上位陣という10年前には考えられない事態になってる