作品の閲覧

「800字文学館」

「コーパス」って何

野瀬 隆平

 あるセミナーに参加して、新たな知識を一つ得た。
 国立国語研究所が主催する会で、日本語に係わる専門的な研究成果が、いくつか発表された。
 その中の一つが、「コーパス」に関するものだった。コーパスとはあまり聞きなれない言葉だが、本来は集大成・全集などを意味する英語である。しかし、言語を研究する人たちの間では、「言語分析や研究の基礎となる言語資料」のことを指すようだ。
 具体的には、書籍、雑誌、新聞、教科書など、あらゆる出版物で使われている一億以上もの膨大な言語資料を集めて、データ・ベース化したもの。正式には、「現代日本語書き言葉均衡コーパス」と呼ばれている。

 十文字以内の文字列を検索にかけると、その言葉が小説や雑誌などで実際にどのように使われているか、用例が数多く表示される。著作権の関係で、すべての作品が網羅されている訳ではないが、通常の辞書では到底のせきれない数である。

 例えば「すんでのところで」を検索してみると、33の用例が表示される。その中には、赤川次郎の『雨の夜、夜行列車に』に出てくるものとして、
 …悪運の強い奴だな。また、すんでのところで逃がしちまったらしい。…
があり、他にアガサ・クリスティの『第三の女』の日本語訳に出てくる用例なども表示される。
 もう一つの例、「あまつさえ」では、57の用例が表示される。加来耕三の
『関ヶ原勝敗の研究』で書かれているものとして、
…若衆を扇動し、あまつさえ徒党を組ませたのは許しがたいことである。…
が出てくる。

 この言語資料、通称「少納言」は、一般に公開されており、ネットで「少納言」と入れて検索すると簡単に見つかる。無料で利用できるので、文章を書く時に辞書と併用すれば大いに役立つ。
 書き言葉以外にも、現代の話し言葉を対象としたものや、『源氏物語』、『枕草子』といった平安時代の文学を取り込んだ「日本語歴史コーパス平安時代編」
もある。古典を学ぶ者にとっては、大いに役立つであろう。

作品の一覧へ戻る

作品の閲覧