Back to Search
Start Over
ChaKi.NET liteの開発
- Source :
- 国立国語研究所論集. 25:75-88
- Publication Year :
- 2023
- Publisher :
- 国立国語研究所, 2023.
-
Abstract
- 九州大学<br />総和技研<br />Kyushu University<br />Sowa Research<br />現代において,コーパスは言語研究に欠かせない資源となっている。言語学の分野では検索・閲覧・集計インターフェイスを備えたコーパスの利用が多いが,情報学等の分野で作成されたコーパスには必ずしもインターフェイスが提供されるわけではない。類型論研究での活用が期待されるUniversal Dependencies(UD)ツリーバンクもそのようなコーパスの1つである。そこで本研究では,既存の高機能コーパスツールであるChaKi.NETを情報抽出用に特化し,新規ユーザにも利用しやすい軽量版であるChaKi.NET liteを開発した。ChaKi.NETは高機能であるがゆえに利用者にとっての学習コストが高かったが,ChaKi.NET liteではUDに合わせたインターフェイスを提供し,アノテーション機能を省くことで目的の機能を利用しやすくした。本稿ではChaKi.NET lite開発の背景と機能について紹介する。<br />Corpora are indispensable resources for contemporary linguistic research. While corpora used for linguistics research usually have an interface, those developed for informatics research tend to lack one. Universal Dependencies (UD) Treebank, which has proved useful for linguistic typology studies, also lacks an interface. In this study, we developed a lightweight corpus tool named ChaKi.NET lite for new users, specialized from the existing sophisticated ChaKi.NET for information extraction. While one takes a long time to learn to use ChaKi.NET, ChaKi.NET lite reduces the required learning time by omitting the annotation function and providing an interface tailored to UD. This paper introduces the background of the development of ChaKi.NET lite and the new functions that this corpus tool provides.<br />application/pdf
- Subjects :
- コーパスツール
Universal Dependencies(UD)
corpus tool
ChaKi.NET
Subjects
Details
- Language :
- Japanese
- ISSN :
- 21861358
- Volume :
- 25
- Database :
- OpenAIRE
- Journal :
- 国立国語研究所論集
- Accession number :
- edsair.jairo.........7dd02dc69afde5245e0b8a780f902071