スキップしてメイン コンテンツに移動

「書籍において全単語の90%は20ページ目までに出てくる」のか? その4 -小説間に共通して出現する単語の割合-

 1冊の本の何ページ目まで読めば見覚えのある単語ばかりになって以後楽に読むことができるのかという疑問から始めた検証だったが、ある1冊の本を読み終えたらまた別の本を紐解いた時に前の本で見知った単語ばかりになって楽に読めるのだろうか? それともそこにはまた別の知らない単語ばかりが並んでいて1から努力のやり直しになるのだろうか?
 それを調べるために小説の作品間で共通する単語はどれくらいあるかという基準で比べてみた。ついでに新聞と小説でどれくらい共通しているのかもみてみる。

比較元小説に比較先小説に存在する単語が含まれる割合

比較元\比較先 細雪 上巻 私本太平記 かんかん虫 幼女戦記 Re:ゼロ 読売新聞
細雪上巻 37% 34% 27% 35% 21%
私本太平記 第一巻 31% 31% 24% 30% 17%
かんかん虫は唄う 38% 42% 28% 36% 21%
幼女戦記 1-10話 33% 34% 30% 47% 30%
Re:ゼロから始める異世界生活 第一章 32% 34% 30% 36% 23%
読売新聞 Web版2017年7月14日 31% 30% 27% 37% 37%

 どの小説間でも共通する単語は20%〜50%である。1冊の単語をすべて理解したとしても別の本に臨むときは知らない単語に出くわす覚悟が必要そうである。
 書かれた時代が近い作品は共通する単語が増え、時代が異なる作品では共通する単語が若干少なめとなったがサンプル数が少ないので結論は出せない。
 新聞は新し目の2作品との間で共通する単語が若干多い。
 同一作者の作品間でどうなっているかを見るために吉川英治の「かんかん虫は唄う」を比較対象として追加した。同作者の「私本太平記」との間で共通する単語の割合は少し高めとなった。

コメント