Wikipedia:井戸端/subj/機械翻訳の活用について
|
機械翻訳の活用について
[編集]井戸端でのこれまでの議論などを見ていると、機械翻訳を使って翻訳記事を作成することについて否定的な見方をしておられる方が少なくないように思います。
特に、高い語学力を持っていて、機械翻訳を使うまでもなく翻訳を行うことができる方にそのように考えている方が多いように思います。
しかし、機械翻訳の進歩・一般化により、以前とは少し状況が変わってきているように思われるので、高い語学力の方をお持ちのかたも交えて機器翻訳の活用についてお考えいただければと思います。
本題に入る前に、念のため、Wikipedia日本語版における機械翻訳のルール上のあつかいについて整理しておきます。
以前は、機械翻訳を用いて作成した文章をそのままWikipediaに投稿することは、機械翻訳を運営する事業者の権利を侵害することになるので違法でした。しかし、現在はウィキメディア財団と事業者との間の契約により、いくつかの機械翻訳については、他言語版の記事を翻訳して日本語版に投稿することができるようになっています。使用が認められているインターネット上の機械翻訳はWikipedia:翻訳のガイドラインによると、Google翻訳、ヤンデックス翻訳、有道翻訳、LingoCloudの4つです。
この他にコンテンツ翻訳ツール(mw:Content translation/ja)の中で、機械翻訳を使うことができます。コンテンツ翻訳ツールについては色々と批判があり、英語版では投稿数が少ない利用者は通常空間への投稿はできませんし、中で機械翻訳を使うことはできません。(ただし、DRAFT空間、利用者空間への投稿は可能ですしツールの外で機械翻訳を使うことは可能です。)
使ったことのない方はご存じないでしょうが、実のところコンテンツ翻訳ツールは色々なバグを解決できないでいる状態で、バグの報告場所であるmw:Talk:Content translationを見ればバグがいかに多いかわかります。私がコンテンツ翻訳を使って作成した記事のいくつか([1]など)にカテゴリーがないのもコンテンツ翻訳のバグによるものです。(ちなみに、phab:T212083によるとこのバグは以前より知られており2018年12月(!)から修正作業を行っていますが、いまだに解決できていません)
いささか説明が長くなりました。ここで、本題に戻ります。
私が皆さんにご検討いただきたいことは、非常に単純なことです。
それは、「翻訳記事はそれ以外の記事と同じように扱えばよい」という提案です。
以下説明します。
以前だと、出来が悪い翻訳記事について、翻訳元言語に関する知識のない利用者は「出来が悪い」ということは分かるものの、記事の修正をすることができず、自然、修正作業は翻訳元言語に関する知識がある一部の利用者に集中することになりました。
しかし、現在は、機械翻訳が進歩した結果、翻訳元言語の知識がなくても翻訳元の記事がはっきりさえしていれば、(そして修正者が十分な日本語の知識を持っていれば)修正者に翻訳元言語の知識がなくても元の記事と作られた翻訳記事のおかしいと思う箇所を比べて修正することが可能です。この状況は、ネット上の情報などを元にして最初から日本語で作成された出来が悪い記事とほとんど変わりません。
機械翻訳そのままで、日本語としてこなれていない記事についてもこのへんの事情に変わりはありません。
そこで、翻訳記事だからと言って特別の扱いをするのではなく、最初から日本語で書かれた記事と同じように扱えばいいというのが私が提案したいことです。
よろしくご検討ください。
--HaussmannSaintLazare(会話) 2020年5月20日 (水) 14:32 (UTC) (「修正者に翻訳元言語の知識がなくても」を追加しました。)--HaussmannSaintLazare(会話) 2020年5月20日 (水) 14:41 (UTC)
- コメント 機械翻訳そのままの記事については、別の問題点があります。読者にとって、その記事が存在する価値があるのかどうかという観点です。一般の読者も他言語のページを機械翻訳して読むことができます。つまり、機械翻訳そのままの記事ならば、日本語版に記事が存在しなくても、読者は読むことができるという事です。機械翻訳そのままの記事が存在する価値はあるのでしょうか?--aki42006(会話) 2020年5月20日 (水) 21:48 (UTC)
- コメント Aki42006さんのご指摘通り、他言語版のWikipediaをGoogle翻訳などを用いて日本語で読むことは一般の利用者にも可能です。日本語版に機械翻訳そのままの記事が存在する価値は私としても疑わざるを得ません。もちろん、日本語版に「とりあえず」記事を作ることでその後の活発な編集活動を期待することは出来るでしょう。多くの言語版に存在する記事が日本語版にはないような場合、特筆性について見逃していた可能性が高く、早急に記事を作成する必要が生じているケースもあるでしょう。ですが、たとえば機械翻訳を認めるガイドラインなどが作成されて他言語版の機械翻訳記事が乱立すれば、やはり関心を集めない記事は質の悪いまま放置され――これは現状、機械翻訳を抜きにしてもある問題のような気もしますが――それに拍車をかける不安があります。Wikipedia日本語版には非日本語話者、全く日本語を書けない・話せない利用者もいます。最近も新規記事で他言語版を拠点に活動する利用者が機械翻訳した記事を見ましたが、そもそも記事名の付け方から問題があり、本文中の説明も理解しがたく、骨が折れすぎて修正作業を断念するようなものでした。機械翻訳の技術が向上しているのは確かですが、Wikipediaの記事として読むに耐える自然な翻訳が可能になったかと言えば話は別なように感じます。HaussmannSaintLazareさんのご意見ですが、(こちらの理解不足で申し訳ないのですが)「翻訳記事はそれ以外の記事と同じように扱えばよい」というご提案は概ね同意できます。私の理解ですが、たとえば翻訳記事には語尾や主語の置き方にWikipediaにおける日本語表記に馴染まないものがありますが、そういったものの修正は翻訳元の言語に明るくなくても出来る。また、明らかな誤訳についてもやはり翻訳元の言語に明るくなくても出来るだろう、といったところでしょうか。「翻訳記事だからと言って特別の扱いをすべきでは無い」というご意見がこういうことであれば、賛同いたします。しかし、「翻訳」が「機械翻訳」を前提とするならば上記の理由で消極的です。もちろん、翻訳作業の一助として機械翻訳を用いることにはなんら問題ないと思いますが、繰り返しになりますが日本語版に機械翻訳そのままの記事が存在する価値は疑わざるを得ません。--しんぎんぐきゃっと(会話) 2020年5月20日 (水) 22:36 (UTC)
- コメント 結論部分で「翻訳記事だからと言って特別の扱い」と機械翻訳と翻訳記事のすり替えを行っています。現在日本語版では「翻訳記事」と「日本語版独自の記事」の区別はありません。翻訳元、特に英語版を丸呑みするという点では翻訳記事に甘いとすら言えます。ですから結論部分に関しては現状と同じか翻訳記事に多少厳しくなるのであって提案する意味がありません。他の部分では機械翻訳の自由化を求めていますが、これについては過去の議論(Wikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案)にある通り、「機械翻訳で読める」=「機械翻訳そのままでの記事作成解禁」とする主張には説得力がありません。これは、機械翻訳でよいのであれば日本語版を読む必要が無い、日本語化されていない機械翻訳を乱造して日本語版を破綻させることを正当化できる理由はない、機械翻訳やるなら少なくとも日本語化する校正の労を省くべきではない(他者に労苦を押しつけ自分は初版に名前を残したいだけでは?)、そしてなにより機械翻訳そのままで良いとするのは、機械翻訳の精度はいまなお低いことを無視している=実際には読めている気分になっているだけ(精度が高い、そのまま読めるとするのは、定型部分が多いことが原因です。今のところGoogle翻訳、みらい翻訳、DeepLのような比較的利用されている機械翻訳でも、定型を外れるとまだまだろくなもんじゃありません)であって、肝心の日本語力が足りないんです。そして、実際に機械翻訳の容認で問題を起こす中心は日本語を解さず訳文の検討ができない他言語版利用者であり、発生する現象は今でも見られる「日本語になっていない記事」の乱造です。低品質な記事を乱造し、修正可能な利用者に作業を押しつけ(なお修正作業を誠実に行うと訳の点検と再訳になるので、機械翻訳による記事が存在している方が労力は大きくなります)、結果訂正が追いつかない記事を多数残る状況を発生させることは「記事の集合」としての日本語版に対する明白な破壊行為ですから、校正も検証もせず機械翻訳で記事をばらまくことは決して正当化されません。将来的に精度が向上するんだからとする方もおられますが、それこそ「何も考えずに適用しても問題が多発しないほど」精度が向上してから提案してねってことなんです。なお、機械翻訳の校正は「データ量の変化」「データの変化」は少ないのですが「結果としての訳文の変化」は多いので、%足切りが上手く働かない原因であったりもします。--Open-box(会話) 2020年5月21日 (木) 01:48 (UTC)
- コメント 下記の英語の文を日本語にGoogle翻訳で変更してみました。理解できますか?--YOUJI(会話) 2020年5月21日 (木) 05:52 (UTC)
- 英語:Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) is the strain of coronavirus that causes coronavirus disease 2019 (COVID-19), a respiratory illness. Colloquially known as coronavirus, it was previously referred to by its provisional name 2019 novel coronavirus (2019-nCoV).As described by the National Institutes of Health, it is the successor to SARS-CoV-1.SARS-CoV-2 is a positive-sense single-stranded RNA virus.It is contagious in humans, and the World Health Organization (WHO) has designated the ongoing pandemic of COVID-19 a Public Health Emergency of International Concern.
- 日本語:重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)は、呼吸器疾患であるコロナウイルス疾患2019(COVID-19)を引き起こすコロナウイルスの株です。通称コロナウイルスとして知られ、以前は仮称2019小説コロナウイルス(2019-nCoV)で呼ばれていました。国立衛生研究所によると、SARS-CoV-1.SARS-CoV-2の後継です。ポジティブセンス一本鎖RNAウイルス。ヒトに感染する可能性があり、世界保健機関(WHO)は、COVID-19の進行中のパンデミックを国際懸念の公衆衛生緊急事態に指定しています。
- 一口に機械翻訳と言っても色々あって、少なくとも上の例文に関しては「みらい翻訳」だとかなりマシですよ。--157.147.154.197 2020年5月21日 (木) 11:44 (UTC)
- コメント 私もOpen-boxさんと同様、HaussmannSaintLazareさんの御提言では機械翻訳と翻訳記事が混同されている印象を受けました。入念な翻訳・編集工程を経て制作された翻訳記事と機械翻訳のみで自動生成された(まともな日本語として読めるかどうかも怪しいような)低水準の文章とを同列に扱うべきではありません。技術的にも、基本的に機械翻訳は入力した原文を自然言語テキスト処理プログラムに通して訳文を出力することしかできません。これはつまり、原文に明示されていない文意を汲み取る仕組みがないため、定型的な文はそこそこの品質で訳出できても、行間を読んだり、訳文の作成や推敲に予備知識や専門知識(時に出典の読み込み)が必要となるような内容の文章は機械翻訳が不能(あるいは不適)であることを意味します。また、原文に紛れ込んでいる可能性のある誤り(語法・文法的には間違いがなかったとしても内容的に誤謬のあるもの)を検出するのも困難です。人間が丁寧に翻訳すれば、これらの課題は一定程度クリアできます。なお、日本語の参考文献が十分にあるテーマについては、他言語からの翻訳に頼るよりも、初めから日本語で考えて執筆した方が優れた記事が書けるであろうことは言うまでもありません(これまで少なくない翻訳記事を手掛けてきた私も、最近はこのことを再認識・評価しています)。このように翻訳記事の執筆時における機械翻訳の使用には依然として課題が山積しているため、HaussmannSaintLazareさんの御提案内容は、あえて変更するべき理由がないと考えます。--Doraemonplus(会話) 2020年5月21日 (木) 08:00 (UTC)
- コメント 機械翻訳が進歩した結果、翻訳元言語の知識がなくても翻訳元の記事がはっきりさえしていれば、(そして修正者が十分な日本語の知識を持っていれば)修正者に翻訳元言語の知識がなくても元の記事と作られた翻訳記事のおかしいと思う箇所を比べて修正することが可能です(太字部分を引用)について。他の方が翻訳記事と機械翻訳を混同されていることを指摘しているので翻訳記事→機械翻訳と解釈します。さて 翻訳元の記事がはっきりさえしていれば というのは他言語版をあてにして翻訳してしまうと他言語版で誤った情報があった場合日本語版も誤った情報を載せてしまうということでしょうか。もしこの解釈なら私も理解できます。そりゃあ、他言語版が間違っているのにそれを訳した日本語版が合っているなんて逆にそれは誤訳です。ですがそれはすなわち出典を見ずに独自解釈をすることにつながります。これは逐語訳をする方によく見られます(機械翻訳もだいたい逐語訳です。DeepLは多少意訳っぽいですが)。私もかつてはこの英語版さえあてにしてその箇所に出典をつけさえすればいいという立場でした。でも記事の編集を続けていくと英語版にもあからさまな間違いが存在することもあることに気づくと思います。英語版(または他の言語版)が絶対に正しいと過信することはいけません。著作権侵害に巻き込まれることもあったようです。機械翻訳を使用した執筆では出典まで目に通す人はそこまでいないと思います。楽だから。しかもその場合Wikipedia:検証可能性は考えられていないでしょう(出典まで確認できるのなら機械翻訳なんて使わないはず)。以上から私の意見をまとめますと、機械翻訳の活用が活発になるとそれは他言語版が合っている上で使用していることになりWikipediaで非常に大事な検証可能性を考えないようになる(=出典を確認しなくなる)ため機械翻訳に頼りきるのは反対。ただ参考程度ならいいかなという感じです。ここからはYOUJIさんが持ってきてくださった文について。全文読んでいませんがnovelが小説と訳している時点で機械翻訳が使えないことを示しています。novelは目新しいという意味もふつうにあるのにnovel coronavirusを新型コロナウイルスと訳せないのはちょっと驚きです。--洗糄(会話) 2020年5月21日 (木) 11:01 (UTC)
- 返信 (洗糄さん宛) 私の提案はどちらかというと「翻訳元言語の知識がない」場合の話が中心なので、YOUJIさんが示しておられる文例についての議論に深入りするのはよくないように思います。何か文例を探すことにします。--HaussmannSaintLazare(会話) 2020年5月23日 (土) 03:33 (UTC)
私の提案に関心をお持ちいただきありがとうございます。
皆さんのご意見を読んでいると、提案の中で「機械翻訳」と「翻訳記事」を混同しているというご意見の方が何人もおられます。
「翻訳記事」という言葉を何か所かで使っているので、ここでは洗糄さんが太字で引用された「機械翻訳が進歩した結果、翻訳元言語の知識がなくても翻訳元の記事がはっきりさえしていれば、(そして修正者が十分な日本語の知識を持っていれば)修正者に翻訳元言語の知識がなくても元の記事と作られた翻訳記事のおかしいと思う箇所を比べて修正することが可能です」について説明します。(洗糄さんご指摘の通り、この箇所は私の提案のポイントです。)
「混同している」と書いておられる方はこの文章の「翻訳記事」を「機械翻訳を使って作成された翻訳記事」に限定して考えておられるように思うのですが、私はそういうつもりで書いているわけではなく単に「おかしな箇所がある翻訳記事」の意味で使っています。 引用箇所の説明をする前に、自分自身がコンテンツ翻訳ツールと機械翻訳を使って翻訳記事を作成するときの手順を書きます。少し長くなるので引用の形にしておきます。
まず、最初にコンテンツ翻訳ツールにある「Google翻訳」の機能を使って、日本語の原文を作ります。ざっと見ていくと大体どこかおかしな日本語になっているので、まずはそこを修正します。とりあえず、「読める」状態になったところで、文章の意味を考えながら読んでいき、どうも意味が通じないなと思う箇所があるときは、そこの箇所の意味を把握する努力をします。このときに、翻訳元の記事を英語に機械翻訳した文章を読んで文意を把握することもあります。英語訳を参考にするのはGoogle翻訳の提供元がアメリカの会社であるせいか、日本語訳では意味が通じないと思った箇所でも英語訳では意味が通じることがあるためです。このような作業を繰り返いした後、大体いいかなと思った時点で「公開」します。
実際には、修正作業が不十分で他の方から何度か指摘を受けているわけですが、そのことは「混同」の説明とは別の話なのでここではこれ以上書きません。
さて、なぜ長々と「翻訳記事の作り方」について書いたかというと、機械翻訳を使った翻訳記事作成作業の大部分が「修正」作業だからです。
そして、その過程で使っているのは日本語の知識であり翻訳元言語の知識ではありません。(英語訳を補助に使うので英語の知識を少し使いますが、せいぜい中学1年生レベルのものです。補足すると、英語版から翻訳するときでも機械翻訳を使っています。それは、私の英語力が「その程度」だからです。)
これは、他の方が作成した翻訳記事であっても同じことだというのが洗糄さんが太字で引用された箇所の趣旨です。
提案のタイトルに「機械翻訳の活用」とあるので、翻訳記事作成を勧めているととらえる方があるかもしれません。しかし、私が活用を勧めているのは「翻訳記事の修正」です。そのことを念頭に置いて、もう一度私の提案を読み返していただけるとありがたく思います。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 14:16 (UTC)(「翻訳記事作成の方法」に加筆しました。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 14:19 (UTC))(「補足すると」以下加筆しました。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 14:31 (UTC))
- コメント 全く逆です。「混同」を指摘した方は、「翻訳記事」は「機械翻訳を使って作成された翻訳記事」に限定されないと考えています。「機械翻訳を使わないで作成された翻訳記事」も翻訳記事です。両者をすり替えないでいただきたい。私の経験上、大本が機械翻訳頼みの粗製記事は、HaussmannSaintLazareさんがおっしゃるところの「修正」という名の、ちょっとした文章校正程度では品質の改善に限界があることが多いと思います。YOUJIさんが持ってきてくださった機械翻訳の訳文例については「修正」でどこまで推敲できるとお考えですか。一度、粗製濫造記事を修正する側の身にもなって、機械翻訳の有効な活用法について考えてみてください。--Doraemonplus(会話) 2020年5月21日 (木) 14:53 (UTC)
- 返信 (Doraemonplusさん宛) 私の勘違いをご指摘いただきありがとうございます。ただ、そこのところは私の説明のポイントではありません。私がこの提案で主張しているのは、Doraemonplusさんのように「这位用户不懂或很难理解中文。」と利用者ページに書いておられる方でも、機械翻訳を使えば私が今作業している中国本土のホットスポットイベント一覧のような記事の修正作業に参加できるということです。実際に修正作業に参加するかどうかは、つまりのところその記事に書かれていることに興味があるかどうかなのでDoraemonplusさんに「是非ご参加ください」と書くつもりはありません。ところで、「粗製濫造記事を修正する」と書いておられますが、どのような記事でしょうか。面白そうな記事なら私も修正作業に参加したいのでお教えください。このページの話からは脱線するので、利用者‐会話:HaussmannSaintLazareにお書きいただけると嬉しいです。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 16:16 (UTC)(表現を修正しました。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 16:20 (UTC))
- 追伸 順番が逆なのでしょうが、Doraemonplusさんご指摘のYOUJIさん作成の翻訳文を読んでみました。「小説コロナウイルス」には驚きました(後述)が、そのほかはだいたいフンフンという感じです。さすがにこれを「書く」というのはダメと思いますが、自分でGoogle翻訳をして「読む」分には「ま、いいか」というところです。というのは、最近コロナウイルス関係の日本語版の記事を読んでいてある程度の知識があるからです。「小説」については「nCoV」の「n」が「novel」で「新しい」ということを初めて知りました。これを書いていて「Time flies like an arrow」の「光陰矢の如し」ではない訳文のことを思い出したのですが、ご存じですか。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 16:39 (UTC)
- コメント まさに中国本土のホットスポットイベント一覧のような記事が粗製乱造的といえます。タイトルからして違和感があります。ホットスポットと聞いて、こちらのことかと思いましたよ。正しくは「中国本土のインターネット上で話題沸騰となった事件の一覧」といったところでしょうが、「ホットスポットイベント」では、日本語として普通その意味にはとれません。本文も全般的に意味不明です。助詞も接続詞も文節も正しく表現できておらず、また文体も整っておらず、用語・用字法も的外れ、そのうえ直訳調と来たもので、筆舌に尽くしがたい滅茶苦茶な文章になっています(あまりに酷いので、まともに読んで推敲する気さえ起きませんね)。もしもあの文章を読んで「だいたいフンフンという感じです」とおっしゃるとしたら、もはやその方の日本語能力を疑わざるを得ません。第三者の編集者が原文を一切参照せずに、機械翻訳ベースの誤訳満載の文章を下地にして、この記事の「修正」を試みるのは不可能に近いと思います。そもそも当該一覧記事の内容の百科事典的適性と特筆性も疑わしいですがね(詳細はWikipedia:削除依頼/中国本土のホットスポットイベント一覧に譲る)。--Doraemonplus(会話) 2020年5月22日 (金) 00:13 (UTC)
- 追伸 順番が逆なのでしょうが、Doraemonplusさんご指摘のYOUJIさん作成の翻訳文を読んでみました。「小説コロナウイルス」には驚きました(後述)が、そのほかはだいたいフンフンという感じです。さすがにこれを「書く」というのはダメと思いますが、自分でGoogle翻訳をして「読む」分には「ま、いいか」というところです。というのは、最近コロナウイルス関係の日本語版の記事を読んでいてある程度の知識があるからです。「小説」については「nCoV」の「n」が「novel」で「新しい」ということを初めて知りました。これを書いていて「Time flies like an arrow」の「光陰矢の如し」ではない訳文のことを思い出したのですが、ご存じですか。--HaussmannSaintLazare(会話) 2020年5月21日 (木) 16:39 (UTC)
- コメント 翻訳記事の修正に活用すべきとありますがそれは逆に誤訳を生む可能性もあります。翻訳記事の修正ということは人が翻訳した文章の修正でしょう。そこに英語無知の方が機械翻訳で「機械翻訳はこう翻訳してるからこっちに修正」なんて言い始めたら合っている文章が誤った文章になります。正直私の翻訳に対するカギは翻訳した人物がちゃんと出典まで目を通しているか?です。機械翻訳を使用する人物が出典まで目を通すとは私には思えません。だって楽だから。機械翻訳の使用理由ってだいたい「楽だから」なんです。私はこの「楽だから」という考え自体wikipediaには向いていないと考えています。もし執筆者が自分は楽していると思っても出典を確認している人は楽はしていないと思います。文献に該当する部分があるかを探す、この作業は機械翻訳をしている方にはない作業です。その点で何度も言いますが出典を見ない時点で機械翻訳はアウト、機械翻訳するならちょっと参考程度で、という考えは曲げません。
- あとHaussmannSaintLazareさんがおっしゃる "英語の知識は中1程度のもの" という発言は翻訳している方にとってはかなり常識外れな発言だと思います。せめて高1ぐらいはあってほしいです。関係代名詞とか受動態とか分詞構文も分からないようなら翻訳にチャレンジはやめていただきたいです。--洗糄(会話) 2020年5月21日 (木) 22:09 (UTC)
この話題においては、英語に長けた方々が集っていらっしゃるとご拝見致しました。
そこで最近気がかりになったことがあるのですが、英単語のtimeと日本語の対訳を正確につかんでいらっしゃらないようにお見受けする方を見かけました。語学に関してお詳しいようですので、この場を借りてコメントさせていただきます。
日本語では「時刻」と「時間」は同じではありません。しっかりと区別して使われているのですが、これに異論をはさまれる執筆者がいらっしゃいます。そのために公正中立な視点で記事が更新できなくなっています。くわしくは当方の最近の投稿履歴をごらんくださいませ。コメントをお待ちしております。Sakura67(会話) 2022年8月17日 (水) 16:49 (UTC)
コメント私のノートページにHaussmannSaintLazareさんから議論への参加のお誘いがあり議論に参加させていただきましたが、みなさんの議論を見てだいたいの流れが分かりました。
まず中国本土のホットスポットイベント一覧には(あまり悪く言いたくはないですが)、正直驚かされました。「中国大陆网络热点事件列表」をどう訳せば「中国本土のホットスポットイベント一覧」になるのでしょうか。「网络wǎngluò」は網状のもの、ここではインターネットのことを指すのはそれこそ機械翻訳でもすぐに分かるでしょう。試しにGoogle翻訳で「中国大陆网络热点事件列表」を日本語に変換すると「中国本土でのインターネットホットスポットイベントのリスト」と出ました。英語に変換すると「List of Internet Hotspot Events in Mainland China」。それをさらに日本語に変換しても「中国本土でのインターネットホットスポットイベントのリスト」です。なぜか「インターネット」という一番重要な部分がごっそり抜けています。率直に申し上げて中国本土のホットスポットイベント一覧の記事が機械翻訳を活用した記事作成の実例にはなりえません。
細かなことを申し上げれば、「热点rèdiǎn」について。「ホットスポット」とも訳せますが、「热点话题」であれば「注目の話題」、「东京晴空搭为旅游的热点」であれば「東京スカイツリーは観光名所になった」と、それぞれ適切な訳をしなければなりません。試しに「东京晴空搭为旅游的热点」をGoogle翻訳で日本語に変換すると「東京の空は観光のホットスポットです」となりました。英語に変換すると「Tokyo skies are hot spots for tourism」、それを日本語変換すると結局「東京の空は観光のホットスポットです」でした。やはり機械翻訳の技術向上とWikipediaの記事として読むに耐えるかはまた全くの別の話なわけです。「中国大陆网络热点事件列表」には「中国本土のインターネットで話題になった出来事の一覧」くらいの訳がいいでしょう。
さて、ここからは洗糄さんのご指摘とも重複するところがあると思いますが、他の言語版が絶対に正しいとは限らないということ。さらに元の言語版で価値が認められている記事か、見極められるかどうかということについて指摘させていただきます。私は日本在住で、ある程度の中国語は理解しますが中国のインターネットにはまったくもって疎いです。ですから、中国のインターネット事情がいかなるものかは分からないのですが(そもそもアクセスが難しい)、中国語版において「中国大陆网络热点事件列表」という記事は存在意義があるのでしょうか。いえ、存在意義の有無を判断できますか?私の知る限り日本語版に「日本のインターネットで話題になった出来事」という記事はありません。あったとすれば膨大な記事になって日々編集合戦になりそうなものです。「中国大陆网络热点事件列表」は見る限りそこまで膨大な記事ではないですが、日本語版であれば「要出典」のオンパレードです(そもそも「中国大陆网络热点」という大きな話題を扱っていながらこのくらいの記事に収まっていること自体が当該記事が中国語版でさして重要視されていないことを表しているような気もします)。
以前あまり考えずに中国語版の記述を日本語版に移したところ、出典がないとのご指摘をいただき全て削除された経験があります。ならばと出典を探そうとしましたが、どこを探しても中国語版の記述を検証できる情報はありませんでした。これだけの経験を踏まえて中国語版の質が低いと言うのは短絡的ですが、洗糄さんのご指摘のように「他の言語版が絶対に正しいとは限らないということ」、どころか圧倒的に質が低いことも想定しなければなりません。他の言語版でも記事の存続理由がいまいちで、かつ質の低い記事を大量に日本語版に移入することは日本語版全体の質を落とすことです。このあたりはOpen-boxさんも指摘されてる通りです。HaussmannSaintLazareさんの提案はやはり「機械翻訳を積極的に使っていこう」というものに写ります。もしそれが中国本土のホットスポットイベント一覧のような記事の乱立に繋がるならご提案には反対させていただきます。--しんぎんぐきゃっと(会話) 2020年5月22日 (金) 02:04 (UTC)
- 私の知る限り日本語版に「日本のインターネットで話題になった出来事」という記事はありません。と書きましたが、インターネット現象の一覧という記事があるようですね。記述がずいぶんと古いようにも見受けましたが……--しんぎんぐきゃっと(会話) 2020年5月22日 (金) 08:57 (UTC)
- コメント しんぎんぐきゃっとさんのコメントに関連して、私の利用者会話ページにもコメントの投稿がありましたので、参考のためにリンクを貼っておきます。--Doraemonplus(会話) 2020年5月23日 (土) 08:04 (UTC)
コメント これはもう一目見てWikipedia:井戸端/subj/コンテンツ翻訳ツールにおける日本語への機械翻訳をツール側で禁止する提案のFerrovia della Mendolaが名前を変えて戻ってきたものだと思いましたが、実際にHaussmannSaintLazareさんにはFerrovia della Mendolaと同じくLTA:SUZUの疑いでブロック依頼が提出されています。--219.102.85.242 2020年5月22日 (金) 15:49 (UTC)
「知らない言語」の文例として、朝鮮語とタガログ語について原文、日本語へのGoogle翻訳、英語へのGoogle翻訳を示します。「どちらも知っている」という方は、何か名前だけ知っている言語をお示しいただければ作成します。出典は[2]と[3]です。
(朝鮮語原文)SARS-CoV-2(영어: Severe acute respiratory syndrome coronavirus 2)[3][5] 또는 이전 이름 2019년 신종 코로나바이러스(영어: 2019 novel coronavirus, 2019-nCoV)[6][7][8]또는 COVID-19는 유전적 배열(DNA sequencing)상 전도(傳導) 기능(Positive sense)[9][내용주 1] 단일 가닥 RNA(single-stranded RNA) 코로나바이러스로서[10], 인간에게 전염성이 있고 코로나바이러스감염증-19의 원인이다[4].
(GOOGLE翻訳による日本語訳)SARS-CoV-2 (英:Severe acute respiratory syndrome coronavirus 2)[3] [5]または以前の名前 2019年新型コロナウイルス(英:2019 novel coronavirus、2019-nCoV)[6] [7] [8]またはCOVID-19は、遺伝的配列(DNA sequencing)上伝導(傳導)機能(Positive sense)[9] [内容注1]一本鎖RNA(single-stranded RNA)コロナウイルスとして[10]は、人間に伝染性、コロナウイルス感染症-19の原因である[4] 。
(GOOGLE翻訳による英語訳)SARS-CoV-2 ( English : Severe acute respiratory syndrome coronavirus 2 ) [3] [5] or former name 2019 new coronavirus ( English : 2019 novel coronavirus , 2019-nCoV ) [6] [7] [8] or COVID-19 is genetic array ( DNA sequencing ) phase conductivity (傳導) function (Positive sense) [9] [Description Note 1] as a single-stranded RNA (single-stranded RNA) coronavirus [10] and are infectious to human It is the cause of coronavirus infection [19 ] .
(タガログ語原文)Ang SARS-CoV-2 (mula sa Ingles: Severe acute respiratory syndrome coronavirus 2),[1][2] na dating kilala bilang 2019 novel coronavirus, 2019-nCoV at Wuhan virus,[3][4] ay isang positive-sense single-stranded RNA virus.[5][6][7] Ito ay nakakahawa sa tao at ang sanhi ng sakit na coronavirus (COVID-19).[8]
(GOOGLE翻訳による日本語訳)SARS-CoVの-2 (から英語:重症急性呼吸器症候群コロナウイルス2)、[1] [2]は、以前として知られている2019年新規コロナウイルス、2019-nCoVと武漢ウイルス、[3] [4]であるポジ一本鎖RNAウイルスを感知する。[5] [6] [7]ヒトへの伝染性が高く、コロナウイルス(COVID-19)を引き起こします。[8]
(GOOGLE翻訳による英語訳)The SARS-CoV-2 (from English : Severe acute respiratory syndrome coronavirus 2 ), [1] [2] formerly known as 2019 novel coronavirus , 2019-nCoV and Wuhan virus , [3] [4] is a positive- sense single-stranded RNA virus . [5] [6] [7] It is highly contagious to humans and causes coronavirus (COVID-19). [8]
--HaussmannSaintLazare(会話) 2020年5月23日 (土) 03:58 (UTC)
- コメント HaussmannSaintLazareさんは、フランスの鉄道路線であるセルネー-セウエン線の記事をフランス語版からの翻訳で立項した際、日本語版で廃止状態の{{Infobox Ligne ferroviaire}}(フランス語版からの移入)を、日本語版で対応する項目がないという理由で、スタイルの破壊を一切修正しないまま復活させています。記事はおろかテンプレートまで巻き込んだ翻訳元の丸写しと機械翻訳であり、記事破壊抑制のため一度は当方がコメントアウトしましたが、当人により「テンプレートを修正する能力がない」にもかかわらず使用した改悪状態に戻されています。確かに廃止議論を経てないことで私の対話ページに連絡があったとはいえ、なぜ廃止状態にあったのかも考えず、復活事由としては不当です。Infoboxでよくある「翻訳用」テンプレートが「翻訳に便利」「英語版との互換性」という編集者の個人的理由で多数使われていますが、結果として機械翻訳記事の濫造と日本語テンプレートへの否定意見も多く見られ、翻訳ありきのテンプレートの運用に疑問を感じています。セルネー-セウエン線の記事とこれまでのテンプレート扱いの前例からして、HaussmannSaintLazareさんの望まれる機械翻訳による修正投稿への活用には賛成しません。
- コンテンツ翻訳は、翻訳に自信のない初心者が気軽に使うための手軽な道具ではなく、Wikipediaの翻訳の方針を熟知した上級者向けのツールと認識すべきです。初版から無理して翻訳元の版に合わせる必要もないですし、言語版に関係なく初版から完璧な記事は滅多にありません。翻訳はあくまで手段としてあくまで日本語版の記事を書くべきであり、自分の書ける範囲内から日本語版記事として検証な可能な出典を付けて育てた方が有益です。--MAYA08(会話) 2020年5月25日 (月) 08:30 (UTC)
報告 この議題の提案者はWikipedia:投稿ブロック依頼/HaussmannSaintLazareでの審議の結果、LTA:SUZUとして無期限ブロックされました。--Linus MK(会話) 2020年6月4日 (木) 14:40 (UTC)