コンテンツにスキップ

Wikipedia:井戸端/subj/機械翻訳による無添削の記事投稿について

機械翻訳による無添削の記事投稿について

[編集]

最近、「新しいページ」で、新しく作られて投稿された記事をいくつか拝見していましたところ、外国語記事からの機械翻訳による、日本語として全く意味が通ってない記事が何件か見つけました。こういった記事について、例えばその記事を削除の対象としたり、常習的にやってる(ただ翻訳ツールに投げっぱなしで出てきたものをそのまま投稿する的な)ようなユーザーに対して、投稿のブロック等の制限をつけるなどというのはあり得ますか?(依然、まだウィキペディア全てのルールについて明るいわけではないので、すでに先行した事例があったら申し訳ないです。--Robert Swann de Schumann会話2021年5月2日 (日) 06:36 (UTC)[返信]

コメント @Robert Swann de Schumann:さん 丁度この件に関する議論提起を行おうと考えておりました者でございます。まず低品質な翻訳の投稿を複数回続ける利用者に対しては、他の一般利用者や場合によっては管理者さんから会話ページへ警告が行われ、その警告を無視して同様の投稿を続ける場合には投稿ブロック依頼が提出される傾向が見られます。たとえばこちらの方は非日本語母語話者でいらっしゃる模様であるのですが、全体的に日本語として成立していない記事を数回投稿された事を理由に一度ブロックされ、その後再び同様の投稿を繰り返してしまった事を理由として、問題の投稿から少し経った頃に突然無期限ブロックとされてしまっています(この事例に関しては私は故意性を見出す事はできなかった為に少々やり過ぎで、一度投稿ブロック議論を経た方が良かったのでは、とも薄々感じておりますが、あいにく現状を覆す程の言論は展開できそうにございません)。とはいえ管理者さん達も人間で、しかもこのサイトはボランティア(自発的な参加者という意味です。近頃は社会においてボランティアという言葉を履き違えてこれを名目に他者に何かを強いようとする事例が散見されます為、念のためです)制で(下線部追記: Eryk Kij会話2021年5月3日 (月) 06:42 (UTC)ある為、誰かが他人の投稿を必ず監視している状況を作り出す訳にもいかず、監視していたとしても個々人の裁量により処遇が変わるという事もございます。取り敢えず会話ページや投稿記録を確認して、他者からの指摘に関して返事を行わない、あるいはその場では反省の弁を述べても実際の行動に反省の内容が活かされていないといった場合にはWikipedia:コメント依頼Wikipedia:投稿ブロック依頼の利用を検討された方が良いかもしれません。全体が機械翻訳であると疑える記事に関してはWikipedia:削除の方針#ケース G: 他言語・翻訳についての問題がある場合にずばり機械翻訳に関する規定があり、履歴継承(この場合は他言語版のどの記事のどの版から翻訳が行われたかの説明の事。コンテンツ翻訳という機能を使った場合は表には記事名だけが表示されるものの、リンク先でどの版か分かるので履歴継承が行われた事になる模様)に問題がなければ、大抵の場合はWikipedia:削除依頼で作成した個別の依頼ページで先述の削除の方針のG-2の基準を指摘して、他の方々からも異論や改善の申し出が出されない、あるいは削除を担当する管理者さんが誰も改善を行う事がその時に見込めないと判断すれば実際に削除が行われます。[返信]
 さて、ここからは私がコメント 他の方々に質問 を行う番と致します(もし Robert Swann de Schumannさんに更に質問がおありでしたら、極力分かりやすくなる様に工夫してお答えしたいと考えております)。最初に少し触れました様に私もこの機械翻訳への対処に関する疑問点がございます。具体的にはどのメンテナンス用テンプレートで記事に問題がある事の指摘を行えば良いのか分からず困っています。ヒトロヴォの福音書(翻訳元: ru:Евангелие Хитрово)やシモン・フョードロヴィチ・ウシャコフ(翻訳元: ru:Ушаков, Симон Фёдорович)といったロシア語版から翻訳が行われて放置されたものがあるのですが、私は削除依頼へ出す事を躊躇しております。後述の理由ですぐには対処できないものの、私にはロシア語の近縁言語であるポーランド語の知識があり、Google翻訳でロシア語から英語もしくはポーランド語経由で重訳して細かいところを手元のロシア語-日本語辞書で確認すれば全く不可能ではないのです。しかし現在私は先日ある利用者(詳細は未確認ですが、この方は日本語版ウィキペディアだけでなく他のプロジェクトに跨って荒らしている人物と同一人物と見做され、現在はグローバルロックされています)から「他の利用者が機械翻訳を投稿してそのままになっているので何とかしてくれませんか」という旨の依頼を受けて改訳作業中であり、その対象の一つに関しては{{Notice}}を用いてこの様な告知をページの冒頭に書きました。実は以前はこの様な事例では{{工事中}}を用いていた(例: Special:Diff/83153603/next)のですが、これは設定期間が長いと不適切な運用と見做される模様です(先述の依頼の際に第三者から指摘を受け、同じ方により工事中テンプレートも除去されました)。そしてCategory:翻訳テンプレートで上述のロシア語からの翻訳記事に対して使えるものがないか探したのですが、既存のたとえば{{翻訳中途}}等を貼り付けて良いのか悩んでおります。今すぐには取り掛かりませんが、再来週あたりには取り掛かれそうなんです。あるいははっきり機械翻訳の疑いがあるものに特化したテンプレートを作成した方が良いのかなとも考え始めておりますがいかがでしょうか。--Eryk Kij会話2021年5月2日 (日) 11:57 (UTC)[返信]
報告 Eryk Kijさんがあげている2つの具体例について、テンプレートRough translationを貼りました[1][2]。翻訳に関する各種テンプレートについては「プロジェクト:翻訳#テンプレート」を参照して下さい。--Jgmo30会話2021年5月2日 (日) 23:03 (UTC)[返信]
返信 (Jgmo30さん宛) 諸々対処頂きありがとうございます。なるほど、2020年4月末になってその様なページが作成されていたのですね。メンテナンスを行う側としては非常に助かります。--Eryk Kij会話2021年5月3日 (月) 00:14 (UTC)[返信]
それでは取り敢えず各種メンテナンステンプレートを貼り付けてCategory:大ざっぱな翻訳などのカテゴリに置き、しばらく経ってもどなたからも改善を申し出る気配が見られない場合に削除依頼として参りましょうか、少なくとも私の場合は。ただこのカテゴリは今年の2月初めに作成されたばかりなので、もし先述の流れを方針化しようと考えた場合にはまずカテゴリの存在を周知させる事から始める必要がありそうですね。--Eryk Kij会話2021年5月3日 (月) 00:33 (UTC)[返信]
コメント 手順としてはちょっと違います。まず最初に行うチェックは「使える機械翻訳かどうか」の判定です。最近はDeepLが増えてきましたし、みらいとBingも結構多い。ExciteやBabylonを使用する方も少なくありませんし、百度やPapagoの翻訳結果を貼り付ける方もいますが、これらは全てケースBの削除対象です。また{{Rough translation}}の使い方から機械翻訳を分けた方がいいでしょう。これは「まぁ、意味は取れるけどこのままじゃまずいよね」レベルの記事が本来想定であったようなのです。機械翻訳丸写しには日本語版未導入の「en:Template:Machine translate」が適用対象なので(追記による補足:これは警告用ではなく機械翻訳でリンク先を紹介するものです--Open-box会話) 2021年5月3日 (月) 02:29 (UTC))、これは相当するものを作りましょう。Eryk Kijさんのケースではシモン・フョードロヴィチ・ウシャコフはGoogle翻訳ですがそろそろ時間切れかなと思わなくもないです。ヒトロヴォの福音書はどのみち削除依頼が必要ですから(加筆が出所不明の機械翻訳のため)、バッサリやった方がいいかと。Robert Swann de Schumannさんの「投稿のブロック等の制限」なのですが、これは「低品質の翻訳量産」自体が問題行為なので十分にあり得ますが(私が削除依頼や改稿で対応したことがあるものですとLTA:MAYAOLTA:ELLSLTA:TOKU(こちらは機械翻訳に埋もれましたが)はいずれも低品質翻訳の量産を伴うLTAです)、ここに対話拒否か多重アカウントが乗らないと依頼成立は難しいと思われます。とはいえ依頼を行わなければ非日本語話者で警告しても止まらないケースであってもなかなか対処されませんし、多重アカウントを運用するケースのように比較的止めやすいケースはあります。このあたりは管理者不足(管理者伝言板の機能不全、管理者「解任」の機能不全とそれによる選任緩和の障害)・「機械翻訳を経由せず」大規模な「Rough translation」を継続的に行う利用者の存在(これがあるので「少数で長大」な「低品質翻訳」でも止められません。被害としてはこちらも無視できないのですが)・コンテンツ翻訳の制限に強硬に反対する一部の利用者による合意不能(Wikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案はどんどん基準を甘くした上でそれでも反対とする初歩的な戦術で潰されました)といった問題がありますが、コンテンツ翻訳自体に手を付けなければ事実上解決不能でしょう。対処はどうしてもコンテンツ翻訳量産よりは後出しになりますから。現在の日本語版は、コンテンツ翻訳で貢献と称して自由に荒らせる遊び場にまで転落しているのです。--Open-box会話2021年5月3日 (月) 02:02 (UTC)[返信]
ヒトロヴォの福音書は削除依頼を出しました。Machine translateを利用するイメージとしては、「Rough translation」の「機械翻訳~」部分ににMachine translateの相当部分([[記事]](XX語版) [機械翻訳])を組み込んで機械翻訳の検証用にする手とRough translationを使用する際に各所の機械翻訳へのチェックを促すメッセージを出すBLPと同様の方法を考えました。安直に「機械翻訳疑い」ってテンプレートを作るのもありではあるのですが。--Open-box会話2021年5月3日 (月) 02:29 (UTC)[返信]
返信 (利用者:エリック・キィ宛) さん、 @Open-box:さん、さまざまな事例やルール等の提示等ありがとうございます!^_^

まだまだ全然その辺の特にテンプレート周りの事情に疎かったところなので、とりあえずはそうした規定等に目を通しながら、削除依頼等の手続きをしてみたいと思います。(>v< ;) (もしやではありますが、そう言った削除等の手続きもまだまだ初めてなので、今度はそっちの方で不手際とかなんかしてしまってご迷惑かけちゃうかもしれませんが、その時は申し訳ないです...。)--Robert Swann de Schumann会話2021年5月3日 (月) 05:54 (UTC)[返信]

返信 (Robert Swann de Schumannさん宛) どう致しまして。私は本格的にウィキプロジェクトに関わり始めてから7年以上経ちますが、未だにテンプレートや方針文書の細かい場所で把握していないものが恐らくあると思われますし、新しいテンプレートの導入などでこれから手続きの慣習が変化する事も十分想定されます。私から新しいものを提案する様な事も今後あるかもしれませんが、その際は他の方々本当に付いていける仕様であるかという点に関して注意を払って参りたいと存じます。--Eryk Kij会話2021年5月3日 (月) 06:42 (UTC)[返信]
返信 (Open-boxさん宛) 様々な事例を経験されてきた方の知見は参考となります。ありがとうございます。ヒトロヴォの福音書に関してはいきなり改訳に取り掛からないでおいて良かったです。削除依頼で外部サイトからの無断転載が含まれていた事まで把握致しましたが、どの様な方法で見つけられましたか?おおよその見当はついておりますが、一応伺っておきたいと存じます。
 Machine translatione(下線部訂正--Eryk Kij会話2021年5月4日 (火) 11:43 (UTC)の件に関しては、私がブレインストーミングで出した際に念頭にあったものと合致する「安直」な案以外の2つは少々イメージが掴みにくいので、お手数をお掛け致しますが改めて詳しく説明頂けないでしょうか。BLPと言いますと、こちらを表示する様な感じでしょうか。[返信]
 ところでOpen-boxさんは「期限」という言葉を述べられていますが、他者による問題のある翻訳が投稿されてからどれくらいの期間までが限度であるとお考えでしょうか。私の場合かなり甘いので半年くらい特定のメンテナンス用カテゴリに目印つきで投げ入れて頂ければ、翻訳元が対応できる言語版のものであれば無理のないペースで取り掛かれそうな気もするのですが……。--Eryk Kij会話2021年5月3日 (月) 06:42 (UTC)[返信]
まずヒトロヴォの福音書の転載ですが、機械翻訳であることは容易に判りますのでここは飛ばしまして、恐らく想定通りだと思われますが「他言語版を巡回して該当する記述の有無を探す(あれば版指定の準備)→キーワードと記事名をセットで検索しつつ、外部リンクを当たる→怪しかったら機械翻訳サイト各種をチェック→エンジン合致があればそれも添えて依頼提出」が翻訳に伴う転載チェック時の定番になっています。この方法は書籍からの転載には弱いのですが、機械翻訳転載は安直な外部サイト転載が多く100ページも見ればだいたい当たりは付くので・・・・・・。今回は数値が多く、最初の検索結果が該当したので楽でした。なお重大な欠点として「削除依頼のこと忘れて飛んだ先のページを普通に読み始める」「記事を書き始める」「図書館や書店や電子書籍で散財する」といった副作用がありますので必ずしも万人向きではないかと思われます。
安直な案以外ですが、BLPはその例と同じで「各所機械翻訳のチェックを促す」メッセージを出してはどうかと。テンプレートに表示する案は、テンプレートの機械翻訳の所にリンク(Googleだけでも役に立つかと)張ってみる=Rough translationで「機械翻訳疑い」を兼用する現行の運用を追認する案です。
期限は私は短めに捉えてまして削除依頼を考慮して2から3週間と考えています。というのも、低質すぎて即依頼が出て票がつくとこれぐらいの期間で「削除依頼をもって告知満了」的に削除されますので。依頼無し2週間+依頼審議3週間でも1月越えますし、衆目一致レベルの削除相当でも依頼無し2週間+依頼審議1週間で3週間ですから、依頼まで2週間でも即依頼と同じだけの期間は稼いでいるだろうと。またケースGの策定時に危惧したのですが、「改訳します」と手を上げるだけでその実現性に関わりなく審議ストップできてしまうのはまずいので、ケースGの適用停止条件は「改訳意思の表示」ではなく「有意な翻訳作業が行われていること」になっています。つまり時間をおいてから改訳するなら、削除後に新規に作成してくれてもいい=改訳までの間日本語になってないものが広がってしまうことを止めるって考え方ですね。裏技的には一回コメントアウト→改訳できたところから解除という方法もあります。これは翻訳を段階的に行う場合(一回他言語版を転記してから順次翻訳)と同じ方法ですね。また思い切って最低限だけ改訳して残りを削除する手もあります。こちらは抄訳とか冒頭訳と同じでスタブ化により日本語になっていないものを一旦除去する手です。
ついでに、記事作成後ある程度経過すると検索エンジンが拾うだけではなくWikipedia転載系のサイト(例:Weblio)が拾ってしまいます。だからといって、{{Rough translation}}にクローラー避け組み込むのはやり過ぎかなぁと思いますが(純粋に大雑把な翻訳を巻き込むため)、せめて各種情報テンプレートごと持って行って先方でも注意喚起がなされればなと思うと、翻訳に係わるテンプレートだけ貼るのも有用かなと考えます。--Open-box会話2021年5月3日 (月) 14:05 (UTC)[返信]
返信 (Open-boxさん宛) ご教示下さりありがとうございます。実は全く見当違いな事を考えておりました(てっきり日本語版に投稿されたものをロシア語に再翻訳してそれを検索にかけられたものかと……)。この機会に参考とさせて頂きます。そういえばウィキペディアからすぐそれと分かる機械翻訳で転載を行っているサイト、近頃いくつか思い当たりますね。
 テンプレートに関しては両立する限り全ての案を試してみて良いのではとなんとなく愚考します。あまり後先は考えずにen:Template:Machine translateはこちらへ移植しておく事と致しましょうか。使わなくなれば後で廃止を検討する、というのでも良いでしょう。ただBLP方式の場合は影響が大きいので採用を本気で検討する場合はまた改めて合意形成の場を設けた方がよろしいでしょうか。実際に導入する場合は極力簡潔かつ明解なデザインとしたいものです。現在のBLPは編集に慣れている者目線では明解に思えますが、慣れていない方目線で見ると少々ごちゃごちゃしている様に思えるかもしれませんし、これよりも更に良いものを目指したいです。
 Open-boxさんとしては削除依頼の期間も考慮された上で限度は短めに、とお考えである事を承知致しました。ここからはこれまでの話題から逸れる事になるかもしれませんが、私はこのサイトは良くも悪くもボランティア制である為、多くの人に記事に手を加えて直す機会があるという事を周知し、そのための手段として実際に自身が直している最中の現場を見せていくのも良いかな、という考え方でございます。大量に粗製乱造が行われると処理に困るのは事実ですが、協力し合って記事の作成や質の向上を図ろうというのがこのサイトの趣旨であるという理解です。少し前であれば自他問わず出来の悪い翻訳など衆目に晒してたまるか、一切合切人知れずあーしてこーしてどうにかなんとかしてやろうぞ容赦はせん、という感じであったのですが、このサイトがボランティアによって成り立っているという事を基盤に色々考えたり経験したりした結果、この様なスタンスとなりました。従ってできたばかりのCategory:大ざっぱな翻訳の存在も今のところ割と好意的に受け止めております。余談となりますが以前に複数の記事がまとめて削除依頼にかけられていた事があり、私はその際に名乗りを挙げるだけでなく進捗や他の方が改善に乗り出された旨の報告もこまめに行っておりましたが、丁度この時のやり方で良かったのですね。--Eryk Kij会話2021年5月4日 (火) 11:44 (UTC)[返信]