学習者コーパス



日本語学習者会話データベース

  1. 内容:9日本語学習者とテスターの会話データ390件。学習者の属性情報とレベル判定付
  2. 入手方法:ウェブ上で利用。詳細はこちら!(要ユーザー登録)

KYコーパス(第二言語としての日本語学習者の話し言葉)

  1. 内容:90人分のOPIテープを文字化した言語資料である。90人の被験者を母語別に見ると、中国語、英語、韓国語がそれぞれ30人ずつであり、さらに、その30人のOPIの判定結果別の内訳は、それぞれ、初級5人、中級10人、上級10人、超級5人ずつある。
  2. 入手方法:利用申請書を郵送する。詳細はこちら
  3. タグ付きKYコーパス:ウェブ上でKYコーパスの学習者の発話部が検索できるこちら

CHILDES(The Child Language Exchange System)

  1. 内容:国際的な言語獲得研究のためのデータベースプロジェクトです。日本語幼児のデータもあります。解析用のツールも公開されています。
  2. 入手方法:ウェブページからダウンロード。詳細はこちらから
  3. 関連文章: 宮田Susanne 編 Brian MacWhinney 監修(2004)『今日から使える発話データベースCHILDES入門』ひつじ書房

C-JAS(Corpus of Japanese As a Second language)

  1. 日本で日本語を第二言語として学んでいる学習者の発話コーパス。主な特徴として,1)2つの異なった母語の特定の学習者を約3年間調査して収集したデータである,2)文法の習得を目的として収集された自然な会話データである,3)コーパス付属の検索システムを備え、オンラインで使用できる,4)統語的、文法的、発音などの誤用タグが付与されている
  2. 入手方法:ウェブページからアクセス。詳細はこちらから


日本語学習者作文コーパス(JCコーパス)

  1. 日本語学習者による日本語作文をアノテーション済みコーパスとして公開。ウェブインターフェイスによる検索環境も用意されている。作文データの総数は304件。
  2. 入手方法: ウェブブラウザで利用可能。詳細はこちらから

日本語学習者による日本語作文と,その母語訳との対訳データベース(作文対訳DB)

  1. 日本語学習者による日本語作文と作文執筆者本人による母語訳のデータベース。作文データの総数は1,565件。
  2. 入手方法:ウェブ上で利用者登録をし、IDとパスワードを発行してもらってからデータベースにアクセス。詳細は!こちらから!

日本・韓国・台湾の大学生による日本語意見文データベース

  1. 東京外国語大学伊集院郁子先生が構築したもの。日本語を母語とする大学生(134 名)と日本語を学ぶ大学生(台湾57 名、韓国 55 名)が日本語で執筆した意見文を収録したデータベース。
  2. 入手方法:ウェブ上でテキストファイルおよびPDFファイルとして閲覧。ダウンロードも可能。利用者登録不要。詳細は!こちらから!。本コーパスの収録データは、「日本語学習者作文コーパス(JCコーパス)からも検索可能。詳細はこちらから

日本語教育のためのタスク別書き言葉コーパス

  1. 大学生の日常における「書く」という言語活動に注目し、日本人大学生(30名)と留学生(韓国語母語話者30名、中国語母語話者30名)による、12のタスクの書き言葉の資料、計1080編(母語別各グループ360編ずつ)を集めたもの。「KYコーパス」の書き言葉版を目指して作られたこのコーパスは、客観的な評価基準に基づき各タスクの達成の可否を判定し、さらに、12のタスクの達成度により、学習者を上位群・中位群・下位群の3グループに分けている。
  2. 入手方法:書籍を購入すれば,CD-ROMが付属します。詳細は!こちらから!


トップページに戻る | 母語話者コーパス | ダウンロード | 管理者