国研『多言語母語の日本語学習者横断コーパス(I-JAS)』第一次データ公開!

5月9日、国立国語研究所のホームページに『多言語母語の日本語学習者横断コーパス(I-JAS; International corpus of Japanese As a Second language)』の第一次データが公開されました。
 
I-JAS今回公開されたデータは、12言語の異なる母語の海外における日本語学習者(180名)、国内の環境の異なる日本語学習者(30名)、合わせて210名、それに加えて、日本語母語話者のデータ15名、合計225名の発話スクリプトと音声および作文(任意参加)です。

また、データは、6種類12タスクで構成されています。発話については、4種類; ストーリーテリング(2タスク), 対話、ロールプレイ(2タスク)、絵描写の合計6タスク、作文については2種類;ストーリーライティング(2タスク)、作文(4タスク)の合計6タスクです。

同時に、各学習者の日本語能力レベルや学習者情報なども閲覧することができます。皆さまのご研究や興味に応じて、ぜひ、アクセスして使ってみてください。
URLは、「https://ninjal-sakoda.sakura.ne.jp/lsaj/」で、こちらの画面からI-JASの検索画面にお進みください。
I-JASの利用にあたっては、ユーザー登録およびコーパスの利用申請が必要です。
LSAJ(I-JAS、C-JASのHP)、I-JASの「検索画面」に入って頂くと、中納言のシステムで、ユーザー登録ができますので、申請の上、ご利用ください。
I-JASにログインして頂きましたら、検索画面上部にマニュアルも載せておりますので、どうぞご参照ください。
 ◆     ◇     ◆
私は海外調査、国内調査(教室環境&自然環境)とも参加しましたが、学習者との対話、ロールプレイ等を通して、さまざまな気づきがありました。海外調査では、各国の日本語教育事情を直接見たり、伺ったりすることができたことは貴重な体験でした。また、国内調査では、日本語学校の学習者と定住外国人に対する調査に参加しましたが、特に後者では地域性の違い、それぞれの「課題」に触れることができ、いろいろ考えさせられました。
1000コーパスは、まだまだ第一次公開の段階ですが、このコーパスがさまざまな形で活用されることを願ってやみません。
 参考:(ホームページからの引用)
本プロジェクトでは、日本を含む20の国と地域で、異なった12言語を母語とする日本語学習者1000人の話し言葉および書き言葉を収集することを目標に、横断的に調査・収集を行っています。 コーパスの名称は「多言語母語の日本語学習者横断コーパス」、略称は「I-JAS(International corpus of Japanese As a Second language)」です。 学習者には日本語能力テストを実施し、レベル判定を行っています。 そのため、レベル別、母語別、技能別、学習環境別にデータの比較が可能です。 オンラインで用例検索ができるコーパスを目指して準備を進めています。 発話調査の音声データも公開する予定です。
参考:
◆私が見たスペイン日本語教育事情~誕生5年目のスペイン日本語教師会を軸に~(2014.6.23)
◆インドネシアの日本語教育事情~さまざまな変化の中で~(2013.12.30)

◆オーストラリアで思ったこと・感じたこと~日本語教育を通して~(2013.9.2)

 

One Response

Write a Comment»
  1. わぁ~、すごいデーター公開ですね…自分がどう使いこなし、どう生かせるか、考えさせられますが、待ってましたです!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>