Tatoeba
URL | https://tatoeba.org/ |
---|---|
言語 |
インターフェース: 25言語 翻訳データ322言語(2017年5月時点) |
タイプ | Open collaborative multilingual "sentence dictionary" |
運営者 | Trang Ho, Allan Simon |
設立者 | Trang Ho, Allan Simon |
営利性 | いいえ |
登録 | 任意 |
開始 | 2006年 |
現在の状態 | オンライン、ベータ版 |
ライセンス | CC BY 2.0 |
Tatoeba.org(日本語の「例えば」に由来)は、外国語学習者向けの例文を掲載しているオンライン共同データベースである。Tatoebaでは、一文丸ごとの翻訳に徹している点で、一般的な辞書とは異なる。Tatoebaのデータベースでは、起点言語と目標言語の関係は1対多を採用している[註 1]。掲載されている翻訳は、起点言語から直接翻訳したものと、中間言語を挟んだ間接翻訳があり、これらは色で識別できる[1]。
目的
[編集]Tatoebaプロジェクトの目的は、言語学習用アプリケーションを開発する人が利用できる、例文とその翻訳のデータベースを作ることである。これは、このプロジェクトでデータを作り、プログラマはアプリケーションのコーディングだけに注力できることを意味する。
Tatoebaプロジェクトで集積されたデータ群は、フリーライセンスのクリエイティブ・コモンズ・ライセンス 表示 2.0 フランス (CC BY 2.0 fr) で利用できる[2]。
コンテンツ
[編集]2017年5月時点で、Tatoebaコーパスは322言語・570万件に達している[3]。そのうち、上位21位までの言語が9割を占めている[4]。また、84の言語で1000件以上の翻訳データを有する[4]。10万件以上の翻訳データを有するのは13の言語である[4]。インターフェースは25言語に対応している。
Tatoebaは、2017年現在、15万件の英和対訳文を収録した田中コーパスのホームページとなっており、最新版はTatoebaで公開されている[5][6]。田中コーパスは日本の大学生により翻訳されており、2008年10月までの翻訳データはパブリックドメインで提供されていた[7]。
沿革
[編集]Tatoebaは、Trang Ho によって、2006年に開設された[7]。開設当時は、“Tang's Dictionary Project”という名前であり、SourceForge.netで運用されていた[7]。また、「ウィキペディアの形式です。但しユーザーが追加するのは記事ではなく、文です。 (Wikipedia type of thing, except people add sentences, not articles.)」という宣伝文句が掲載されていた[7]。古くはパブリックドメインだったが、2009年12月に現行のCC BYライセンスへと移行した[7]。
援助
[編集]2010年12月に、Mozilla Drumbeatから補助金を受け取っている[8][9]。また、Tatoebaのインフラストラクチャーに関する業務の内いくらかが、Google Summer of Codeの協賛を得ている[10]。
註釈
[編集]- ^ 例えば、“I love you.”に対する日本語訳として、「愛してる。」のみならず、「大好き。」「君が好きだ。」など、複数の翻訳例が掲載される。
出典
[編集]- ^ “Why are some translations in grey?”. FAQ. 2017年5月17日閲覧。
- ^ “Terms of Use”. Tatoeba. 2017年5月18日閲覧。
- ^ “メインページ”. Tatoeba. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月18日閲覧。
- ^ a b c “言語ごとの例文数”. Tatoeba. 2017年5月17日時点のオリジナルよりアーカイブ。2017年5月18日閲覧。
- ^ “Tanaka Corpus”. EDRDG Wiki. Electronic Dictionary Research and Development Group (3 February 2011). 20 March 2011閲覧。
- ^ Breen, Jim (2 March 2011). “WWWJDIC – Information”. WWWJDIC. Monash University. 20 March 2011閲覧。
- ^ a b c d e Charles Kelly (2012-03-31). “Language Study Materials on www.Manythings.org That Use the Tatoeba Project Corpus”. Bulletin of Aichi Institute of Technology (47): 77. NCID AA12337561.
- ^ Ho, Trang (17 January 2011). “Grant from Mozilla Drumbeat”. Tatoeba Project Blog. 20 March 2011閲覧。
- ^ Moltke, Henrik (30 December 2010). “Best Drumbeat Projects: Tatoeba – a free and open database of sentences”. Yoyodyne.cc. 20 March 2011閲覧。 “...the Mozilla Foundation wants to encourage and help the Tatoeba project by giving it a USD 2.5K Mozilla Drumbeat Grant.”
- ^ https://www.google-melange.com/gsoc/org2/google/gsoc2014/tatoeba