コンテンツにスキップ

Wikipedia:井戸端/subj/コンテンツ翻訳ツールの中で機械翻訳を使えないようにすることを提案します。

コンテンツ翻訳ツールの中で機械翻訳を使えないようにすることを提案します。

[編集]

以前にも同様の提案「Wikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案」があり、そのときは、翻訳文の質を向上させるために機械翻訳の文章そのままでは投稿できないように設定するということで議論が終わっているようです。

しかし、どうもその時の議論に参加された方には実際にコンテンツ翻訳ツールを使って記事を作られた経験のある方が少なかったように思います。

コンテンツ翻訳ツールは、「ベータ版」というにはいささかお粗末なものだと感じています。

ベータ版には「発見し尽くせなかった不具合を報告してもらい修正したりして」という文章があります。

しかし、コンテンツ翻訳ツールの現状は、そもそも不具合を発見する作業をきちんと行わない状態で公開していると感じさせる箇所があります。このように書くのは基本的な機能に不具合があるからです。一つ具体例を挙げます。

コンテンツ翻訳ツールには翻訳元の言語版のカテゴリーを翻訳後の言語版の対応するカテゴリーに自動的に変換する機能があります。しかし、それぞれの版でカテゴリーの仕方は違っており、直接対応するカテゴリーがないことも少なくありません。全くないときに、コンテンツ翻訳ツールは対応するカテゴリーがないことを示し、手動でカテゴリーを入力するように求めてきます。そこで、日本語版のカテゴリーを入力すると、コンテンツ翻訳ツールは実際に日本語版にあるカテゴリーかどうかをチェックして日本語版にあるカテゴリーだと、自動変換で追加されたカテゴリーと同様に画面上に表示されます。ここまでの機能は今のところ正常に機能しているようです。

ところが、翻訳を終了した時点で公開すると手動で登録したカテゴリーは投稿した記事に記載されていません。

私が、翻訳作成した記事でカテゴリーのないものがいくつかありますが、最初の方はこういう事情によるものです。最近は、最初からコンテンツ翻訳ツールが正常に動作しないことを見越して別にテキストエディタで追加するカテゴリーを用意しておき、公開後すぐに追加するようにしています。

以上の例は単にコンテンツ翻訳ツールがテストを十分に行っていない状態で公開されていることを示すために書いたものにすぎません。

私が、コンテンツ翻訳ツールの中で機械翻訳ができないようにしてほしいと要望している理由は、コンテンツ翻訳のバグが投稿フィルター#13を起動させているようだからです。投稿フィルター#13というのは、投稿している記事の文章量が少ないときに働くフィルターです。

本来、投稿している記事全体の分量に対して働くはずなのですが、この警告が例えば一番最初のパラフレーズに対して出ることなどもあり、どうもコンテンツ翻訳からフィルターへのデータの受け渡しのところに不具合があるようです。そして、この警告が出た記事はそのままでは公開することができません。

直接機械翻訳と関係なさそうな不具合なのに、どうして機械翻訳を使えなくすることを希望しているかというと、どうも機械翻訳がおかしなリンクを作ることが遠因になっているようだからです。

日本語版で「△△の」とあるときリンクは「△△」につけますが、英語では「△△の」までが一つの単語なのでこの範囲でリンクが付きます。また英語から日本語への語順の入れ替えで、英語版では一つのリンクであったものが翻訳後の文章で2つのリンクになることもあります。以上書いたような不具合は、ビジュアルエディタで修正することができるのですが、どうもこの際に何らかのごみが紛れ込んで編集フィルター#13が起動するようなのです。

私自身については、「逃げる」方法も大体把握できたので、「あ、またか」ということで対処しているのですが、この不具合を発生させないためには機械翻訳が生成した文章が少し位おかしな文章であってもそのまま公開してしまうというのが一番安全であるというのが実情です。

同じ機械翻訳を使うにしても、原文あるいは空欄にフラウザ上で別途GOOGEL翻訳をした文章を貼り付けた場合は、リンクを動かさないこともあってこのトラブルは生じないようです。

機械翻訳を使うことに変わりはないのですが、別途GOOGLE翻訳する方法だと、「いつトラブルが起きるか」と考えながらひやひやする必要がないので、落ち着いて翻訳文を推敲することができます。

以上が、コンテンツ翻訳ツールの中で機械翻訳できないようにすることを提案する理由です。

なお、ご存じと思いますが、英語版では機械翻訳を使うことができません。利用者数の多い英語版でテストされていないことが、このバグがいつまでも取れない遠因になっていると思います。といって、日本語版の利用者が犠牲になる必要はないと思います。

特に、コンテンツ翻訳ツールを使っていて、バグに当たった経験のある方のご意見を要望します。

よろしくご検討お願いします。--HaussmannSaintLazare会話2020年3月13日 (金) 10:50 (UTC)[返信]

提案者です。サブページ化をしていただきありがとうございます。

今回、私がこのような提案をした直接のきっかけを書いておきます。 そもそもの始まりは「コンテンツ翻訳ツール」の不具合点やその回避法についてどこかにノウハウが蓄積されているのではないかと思ってネット上(主にウィキプロジェクト関係)を探したことです。その中で見つけたのがこの文書です。この文書には「本ツールのもうひとつの狙いとして新規編集者を呼び込む意図もあり、まっさらな状態から新規ページを作成するよりも簡単に貢献できる方法を提供しています。」と書かれています。しかし、現在の状況は「簡単に貢献できる」というには程遠い状況であり、「新規編集者」を罠にはめている状況だと思います。あるいは、この文書は単に願望を書いただけのもので目くじらを立てることはないのかもしれません。しかし、どうもバグ取りに対する開発者の姿勢を考えると、このような文書をそのままの状態で放置していることが「無責任」であるという怒りを感じたものです。(もちろん、この怒りには、いままでにこのツールを使っていてさんざん嫌な思いをしたことも影響しています。)ただ、「怒り」をきっかけとしているものの、提案自体は妥当なものだと思っています。どうも、ウィキペディアでのコンテンツ翻訳についての議論を読むと、利用者の姿勢についての意見が多く、ツール自体がまだベータ版と呼べる段階になっておらず、そのことがトラブルの原因となっているといる観点が少ないように思います。よろしくご検討ください。今回この提案をするために調べてみるまで知らなかったのですが、コンテンツ翻訳ツールの中でGOOGLE翻訳を使えるようになったのは2019年のことなのですね。つまり、私の提案はその時点まで戻るということを提案していることになります。--2020年3月13日 (金) 17:14 (UTC)すみません署名を間違えました。--HaussmannSaintLazare会話) 2020年3月13日 (金) 17:17 (UTC)「例」の箇所を段下げしました。--HaussmannSaintLazare会話2020年3月13日 (金) 17:22 (UTC)[返信]