スキップしてメイン コンテンツに移動

「書籍において全単語の90%は20ページ目までに出てくる」のか? その3 -品詞ごとの増加傾向-

 前々エントリの「書籍において全単語の90%は20ページ目までに出てくる」のか?で新出単語の増加のしかたを見たが、これはどの品詞でも同じように増えるのだろうか。品詞ごとに増加割合に違いがあって動詞や形容詞は早い段階で頭打ちになり、後半は名詞だけが増えるような状態になるのではないだろうかという気がした。もしそうなら書籍の前半数十ページに出てくる動詞や形容詞を完全に掌握することで、それ以後の読解を簡単にすることができるはずである。
 前のエントリと同じ小説の文章を使って調べてみた。
 結果、多少の違いはあるが、名詞も動詞も形容詞も副詞も小説全編に渡って新しいものが出続けることがわかった。副詞は比較的早いページでカバー率が上がりがちである。

品詞ごとのユニーク単語出現割合推移

細雪は副詞のみが先行してカバー率を上げる。
私本太平記は副詞に加え形容詞も早めにカバー率が上がる。
幼女戦記は10話あたりに新出の形容詞がたくさんあるようだ。
Re:ゼロから始める異世界生活も1章の終わりあたりに新出形容詞が多いようだ。100ページ目くらいまではどの品詞も同じようなペース。
読売新聞のサンプルデータは前半が事件、政治などのストレートニュース。社説などのコラムを挟んで文化面的な記事をくっつけてある。前半のストレートニュースは副詞が極端に少なく、中盤以降のコラムでは多用される。多くの記者のいろんな文体が混ざっているためグラフが素直な形になっていない。

コメント