「中納言」を活用したコーパス日本語研究入門
著 者:中俣尚己
出版社:ひつじ書房
ISBN13:978-4-8234-1059-8

コーパス検索アプリの充実した解説書

着実・丹念な研究の積み重ね、基本から応用まで

近藤泰弘 / 青山学院大学教授・日本語学
週刊読書人2021年8月6日号


 日本語研究に興味がある者ならば誰でも、ある単語や語法が日本語にあるかどうかを調べようと思うことがあるはずである。新聞・雑誌・文学作品・日常会話・方言などいろいろなものについての調査研究が必要になる。本書の冒頭でも「食べるべきでない」と「食べないべきだ」のどちらが使われるか、というような問題がとりあげてある。

 そのような目的のために、各種の資料を電子化したものを「コーパス」と呼ぶが、国立国語研究所では、そのような、現代語・古典語の各種コーパスを開発し、また〈中納言〉という名称の検索アプリを、各自のPCのウェブブラウザからネットを通して使える仕組みを広く提供している。

 そういうことで、〈中納言〉は今や、日本語研究者・日本語教育関係者から、翻訳などの業務で活用する人、また、日本語学で卒論を書く学部学生に至るまで、必要欠くべからざるツールになった感がある。しかし、非常に多機能である分、Google検索のように検索窓にただ単語を入れれば検索できるというような簡便さはなく、複雑な検索方法を前にして、いささかハードルが高いという評価がなくもない。

 著者の中俣尚己氏は、『日本語並列表現の体系』(ひつじ書房)『日本語教育のための文法コロケーションハンドブック』(くろしお出版)などで、コーパスを駆使した定評のある研究をしてきており、この〈中納言〉の解説者としてはまさにうってつけの人である。

 その期待に違わず、本書は、〈中納言〉の解説書としてまさに唯一無二のものに仕上がっている。第1部「検索してみよう」では、第1章コーパス概論、〈中納言〉の登録方法から始まり、「語彙素」「短単位・長単位」「前方・後方共起」といった〈中納言〉に特有の用語の説明がある3章までで、読者は基本的な〈中納言〉の利用方法を理解することができるだろう。4章でコーパスの形態論情報(品詞・活用形等)の詳しい利用、5章で前後の文脈によるコロケーションなどの応用検索の方法を学ぶ。「キーの条件を指定しない」の使い方は重要である。

 第2部「データを処理してみよう」は、データ処理の応用編で、6章から7章で、Excelと連動させてPivotテーブルを作ったり、インラインタグを付けて出力させて文脈を詳しく解析したりといったテクニックを解説する。このあたりから、普段、〈中納言〉を使い慣れている人も、ほほう、と思う部分が出てくるはずである。特に第8章の「レジスターの比較」部分は、本書のひとつのハイライトであり、単語の頻度を、調整頻度の指標であるpmw(100万語あたり頻度)で示す方法を示し、〈中納言〉で検索出力した、「現代日本語書き言葉均衡コーパス」(BCCWJ)から、Excelを使って簡単にpmwを計測して、言語の位相(レジスター)によって比較する方法を提示している。これは非常に応用度の高いものであり、ここだけでも本書を買う価値があると思う。

 第3部「研究してみよう」では、著者の研究課題である「コロケーション」や、「コロストラクション」研究で、著者の自家薬籠中の技術を惜しげも無く披露してくれる。日本語コーパス研究で「コロストラクション」(述語と構文の相関)の用語を使っているものは本書くらいではないか。このあたりのテクニックは、教えてもらわないとなかなか習得が難しい。11章は学生の卒論を使ったケーススタディ。12章は、〈中納言〉で選択できるコーパスの解説となっている。

 このように、本書は、ありそうでなかった〈中納言〉の解説書として非常に充実したものとなっており、〈中納言〉ユーザー必備のものであると言って過言ではない。著者の従来のコロケーションの著書にしても、本書にしても、必要なところに的確な企画を打ち込んできた感があるが、これは著者の目の付け所の良さを示している。と、同時に、着実・丹念な研究の積み重ねがなくては実現できないことである。両者を兼ね備えた、氏の今後の研究や著作にも目が離せないゆえんである。(こんどう・やすひろ=青山学院大学教授・日本語学)

★なかまた・なおき
=京都教育大学准教授・日本語学・日本語教育学。博士(言語文化学)。編著に『コーパスから始まる例文作り』など。本著に関するYouTubeチャンネルを持つ。一九八一年生。