コンテンツにスキップ

Wikipedia:井戸端/subj/Google Books日本語版ってどの程度使える物でしょうか

Google Books日本語版ってどの程度使える物でしょうか

[編集]

利用者‐会話:Takabeg#Google Booksについてからの派生となります。Google Booksが、その内容を収録している範囲にあっては、問題なく(もちろん著作権等の他種の問題は別として)使用できることは確かなのでしょうが、プレビューが使えなかったり、スニペットだけだったりすることも多いので(著作権者ともめたこともありましたし)、改名のように数が問題となる場合これに依存することは危険だと思います(補強する材料にはなると思います)。
ただ、これに関して日本語版Wikipediaとしてこれは便利だ! とかこれについてはダメだろう……となるところはどのようなものがあるのか、この際お聞きしようと思ってこの説を作りました。よろしくお願いします。--open-box 2012年2月8日 (水) 08:04 (UTC)[返信]

実質的には使い物にならないと思います。日本の出版物は原則的には除外されていて[1]収録数、収録範囲ともに英仏ほかとは比べ物にならないですし、メタデータの扱いについての指摘[2]もあり、保護期間切れのものなどもあるとしても、OCR上の困難もあります。たとえば「新書」でみるとこんな感じ。用例調査として用いるなら、最近の言葉ならグーグルで上手に調べて数桁の差がでるかどうか見る、古い用例でいいなら近代デジタルライブラリー、学術や報道で使われるようなものなら、ciniiやjournal@rchiveか(全文検索もできます)、NDLの雑誌記事検索あたりを見るのがよいと思います。--Ks aka 98 2012年2月8日 (水) 18:35 (UTC)[返信]
Ks aka 98さんのご意見を読む限りでは、こちらの想定よりもまだ弱いのでしょうか……。運良く収録されている物を利用するぐらいは行けると考えていたのですがって、OCR結果は笑えてきました。いや、これは困りましたね。上手くスキャンされていないものは、『こりゃだめだ』と無意識のうちに除外していたようです。--open-box 2012年2月8日 (水) 22:39 (UTC)[返信]

質問者は、ノート:ヘド・ターコルー#改名提案で、私が「ノーマルのグーグル検索 」を批判し、「グーグルブック検索は数段マシですが」と言ったことに対して、過度の反応を示したようで、利用者‐会話:Open-boxでも書いたことを繰り返すことになりますが、ノーマルのGoogle検索にはインターネットの様々なものがヒットするのであてになりません、Google booksも様々な問題をはらんでいます。Google Booksの検索結果をmax値には、やはり様々なものがヒットしてしまいます。これはGoogleがノーマルのGoogle検索の結果をおりこんでいるからです。ただし、Google Booksの検索結果のminimum値には、そうしたものが引っかかってきませんので、少なくともWikipedia:信頼できる情報源以外のものを排除してくれます。つまり、Google検索は非常にリスクが高く、Google Booksのmax値はノーマルGoogleと同様にリスクが高く、Google Booksの検索結果のminimum値はそれらよりは優れているものの、日本語の書籍を対象にした場合、網羅的ではない欠点があると言えます。Takabeg 2012年2月8日 (水) 20:21 (UTC)[返信]

ぶっちゃけて言ってしまえば、私は検索サイトの件数は現在一切使用しません。信頼できる第三者であれば1件で十分だからです。--6144会話2012年4月1日 (日) 14:28 (UTC)[返信]