コンテンツにスキップ

Wikipedia:井戸端/subj/WP:NCにおけるJIS X 0208規定の撤廃について

WP:NCにおけるJIS X 0208規定の撤廃について

[編集]

Wikipedia:記事名の付け方においては、「一般の記事名で使用できる文字」について「JIS X 0201のラテン文字類」および「罫線素片・私用領域の文字(いわゆる外字)を除いたJIS X 0208で規定されている文字」となっています。この規定が定められた当時はUnicodeに対応していないWindows 98/MeMac OS 9といった古いOSや、フィーチャーフォン(俗にいうガラケー)が多数使用されていたゆえにこのように定められたものと思われます。しかし2020年現在前者はとうの昔にサポートを終了し、利用者もほとんどいないと思われます。後者もその数を近年大きく減らしています。したがってこの規定を撤廃し、Unicode文字を通常の記事名に使用できるようにする時期が来ていると考えますが、いかがでしょうか?--Schwei2会話2020年5月8日 (金) 11:56 (UTC)[返信]

賛成 基本的に賛成です。草なぎ剛(草彅剛)、朴ロ美(朴璐美)のような混ぜ書き、高梨沙羅(髙梨沙羅)、種崎敦美(種﨑敦美)、吉田恵輔(𠮷田恵輔)、BOOWY(BOØWY)のような代え字を避けることが可能になります。ただ、完全撤廃すると妥当性があれば絵文字でも何でもありになります。😀(スマイル)は出る環境が多いと思いますが、たとえば🦧️(オランウータン)はやや古いスマホでは出ないかもしれません。いまのところ芸名やグループ名に絵文字が入った方は知らないですが。--Monaneko会話2020年5月8日 (金) 13:36 (UTC)[返信]
グループ名に絵文字(というよりJIS X 0208外の文字)が入っている例としてはかつみ・さゆり(かつみ♥さゆり)などがあります。--Schwei2会話2020年5月8日 (金) 14:06 (UTC)[返信]
h偽新聞でも表記ゆれが起き始めているようです。例えば「『新しい地図』が基金設立 コロナ対策に3千万円を拠出」では、「草剛」表記で、「『新しい地図』基金、医療従事者らを支援 3千万円拠出、寄付も募集」では、「草なぎ剛」表記が使われています。大手メディアは、正しい文字が表示さえない環境に対する配慮が通常のウェブサイトよりも高いと思いますが、それでも「彅」表記が許容され始めているのだということだと思います。もはや、このような配慮は単なるお節介の意味を出ないものとなっていることから概ね同意いたします。
一方で、Monanekoさんが仰っている通り、一部の新しい文字については文字コードが割り当てられている一方でフォントが用意されていないがゆえに、文字が表示できないという事例もあります。皆さんの環境はわかりませんが、私の環境では、ビャンビャン麺の冒頭部が正しく表示されず、パソコンのブラウザで見ると四角い箱のようなものが表示され、iPhoneでは文字があることすらわからなくなっています。
ビャンビャン麺𰻞𰻞麺、ビャンビャンめん、中国語: 𰻞𰻞)は中国陝西省で一般的な幅広の
中国版ウィキペディアでは、新しく割り当てられた文字コードを使った記事名に移動している(𰻝𰻝面)ことから、iPhoneで見ると「」という記事と同じ記事として表示されています。そのため、使用できる文字を拡大するのであれば、文字が割り当てられてからX年が経過している、主要なフォントがサポートしているなどの条件に従って、使える文字の一覧のようなものを策定して、その中で記事名を付けるといった対応が必要だと思います。 片割れ靴下会話2020年5月8日 (金) 14:04 (UTC)[返信]
利用者‐会話:片割れ靴下#Wikipedia:井戸端/subj/WP:NCにおけるJIS_X_0208規定の撤廃についての件でを踏まえて修正しました。 片割れ靴下会話2020年6月8日 (月) 19:19 (UTC)[返信]
漢字の場合、原則としてCJK統合漢字および同拡張A、およびCJK互換漢字のうち実際には統合漢字として扱われる12字(﨎、﨏、﨑、﨓、﨔、﨟、﨡、﨣、﨤、﨧、﨨、﨩)は使用してよいでしょう。拡張Bも含めてよいと思いますが、基本多言語面でないことからWikipedia:井戸端/subj/Unicodeの基本多言語面にない文字をタイトルに含むページの作成解禁に向けての議論次第です。--Schwei2会話2020年5月8日 (金) 14:09 (UTC)[返信]
非漢字の基準は難しいですが(そもそも記号類を記事名に使用するのは推奨されることなのか?)、絵文字が収録される以前のUnicodeであるUnicode 5.2あたりまでの文字であれば何の問題もなく使用可能でしょう。--Schwei2会話2020年5月8日 (金) 14:21 (UTC)[返信]
記号や絵文字は芸名、グループ名であれば十分あり得るかなと。いま絵文字が使えないことで支障はないので、個別の議論で妥当性のない記事名をつけないようにするのではなく、包括的に一般的ではない記号や外国の文字を排除するような縛りを付けるならJIS X 0213の範囲の漢字(JIS X 0213漢字一覧の1面JIS X 0213漢字一覧の2面)および非漢字でも十分かもしれません。ただし、一部基本多言語面に含まれない漢字が一部含まれているので解禁が条件になります(解禁されないならJIS X 0213範囲かつ基本多言語面内で)。また、これだと彅、璐、﨑、Ø、♥は入りますが、髙、𠮷は入らないですね。--Monaneko会話2020年5月8日 (金) 16:09 (UTC)[返信]
個人的にはUnicodeの文字であればどのような文字であっても(互換文字や制御文字などは除く)記事名として適切であれば使用して構わないとは思います。「フォントを用意すればいい」といえばそれまでですし、世界的にもこのような規定があるのは日本語版のみでしょう(少なくとも同じ漢字圏である中国語版・韓国語版にはこのような規定はありません)。ビャンビャン麺にしたって中国語版で「𰻝𰻝面」なわけですからWikipedia全体としては問題ないのでしょう(ただ、「𰻞」という文字は一般的な日本語話者には馴染みがないので、この記事に関しては改名は反対です)。--Schwei2会話2020年5月8日 (金) 16:29 (UTC)[返信]
  • どうもこの手の議論にはユニコードと環境について深刻な誤解があるようでして、ユニコードに対応していることは「フォント」を持っていると言うことではありません。特にこの場合の問題点は、Schwei2さんの意見に裏付けが全くないんですよ。なんとなく、みんな対応してるんじゃないの? ガラケーが原因じゃないの? 旧いOSなんてもういいんじゃいの? 多数じゃないからもういらないんじゃないの? という思い込みで進めることはできません。この議論、過去にもあったのですが(直近は2017年のこれです。Wikipedia‐ノート:記事名の付け方/過去ログ15)この検証フェイズを飛ばしていることと、少数を無視していることから失敗しています。他言語版が配慮していないことは理由にはなりません。それは他言語版の見落としであり、これに合わせることはできません。文字を使いたいから少数を切り捨てることが許容されるかという深刻な問題に対抗するのに「使いたいから」だけでは足りないのです。なお今のところ難しいだろうと判断するのは、mw:Compatibilityを見る限り、 Chrome 1+、IE 6+、Firefox 3+、Safari 3+、Opera 15+、Mobile Safari 5.0+ (iOS 4+)、Android 2.0+、WebOS < 1.5、PlayStation、Symbian-based browsers、NetFront-based browser、Opera Mini、Nokia's Ovi Browser、MeeGo's browser、Google Glass、UC Mini (speed mode on)がGradeC=Basicに残っていまして、単に少数(GradeX)に配慮するよりも強い要請となっているからです。[1]からある程度環境が見えますが、いまだにWindows98が0.2%残っていたり、IE6すらまだ0.1%出てくる。この環境下でWikipediaとして切ることは難があります。この問題は{{小文字}}的な解決ができるといいのですが(対応している場合に記事名を置き換える)。--Open-box会話2020年5月8日 (金) 18:33 (UTC)[返信]
    • リンク先を見る限りではStartup Module内には確かにIE6が残っているものの、実際にはIE6とIE7のサポートは打ち切られているようです。0.1〜2%の環境への配慮よりは、現にJIS X 0208外の文字を記事名にする需要があるわけですからそちらを重要視すべきでしょう。--Schwei2会話2020年5月9日 (土) 00:32 (UTC)[返信]
    • それはMediaWikiの対応の話であって、Wikipediaの話ではないように思います。MediaWikiであれば社内イントラネットで使われる場合もあるので古い環境での対応も必要に思いますがインターネットであれば配慮する必要はないと思います。あと古いブラウザがサポートしていないHTML5やCSS3を使ってる時点で動作保証していないような。そもそもそれらブラウザでマトモにWikipediaって見えるのでしょうか。--Monaneko会話2020年5月9日 (土) 00:53 (UTC)[返信]
    • もう一つ、このサイトはHTTPS必須で暗号方式がTLS1.2とTLS1.3しか対応していないため[2]、TLS1.1までしか対応していない環境からのアクセスができません。Transport_Layer_Security#ウェブブラウザを見ると、Windows 7以降のブラウザでなければそもそもアクセス出来ないと思います。サイト自体が古い環境を切り捨てている以上配慮の意味はないと思います。--Monaneko会話2020年5月9日 (土) 02:25 (UTC)[返信]
      • ついでに手元にある環境で試しました。いずれもJIS X 0208外文字です。PlayStation4はJIS非漢字の一部が表示されず(表示されるもの:㊿、されないもの:⤴)、第4水準漢字もCJK統合漢字 拡張Bに割り当てられている一部漢字は表示されませんでした(表示されるもの:𠮷、𠀋、表示されないもの:𠂉、𠂢)。絵文字は表示されず。手元のAndroid 7.1.1の入ったタブレット(NEC製)はCJK統合漢字 拡張Bの全ては網羅していないものの、第4水準文字は網羅しているようです。絵文字はEmoji ver.4までなら表示されるようです。--Monaneko会話2020年5月9日 (土) 02:25 (UTC)[返信]
      • 前回この提案が潰れたのは、検証どころか反例が突きつけられたからです。ここから逃げ続けてもいつまでも解決できません。実は、Windows 8.1ですら問題があり、Windows 7と合わせて実はまだセキュリティサポート中(合計5.6%)って時点で、あと3年ほどはBMPの全面実装はできませんから、その間に集めるってのはありでしょう。それが、Monanekoさんの後段の「マトモにWikipediaって見えるのでしょうか」の疑問に対する回答を集めることにも繋がります。
TLS1.2だとXPまでは対応パッチ出てます(IE8を残したのは恐らくこれです。Safari 3とかOpera 15が残ってるのは意味不明ですが)。
せっかくなのでこちらもチェックしました。割と知られているのですが、PSP、PS3はアクセスできません(TLSの問題が2015年から知られていますが5年間放置されているので改善の見込みはほぼなさそうです)。iOS12、オランウータンはダメです。LGのAndoroid 9.0タブレット、表示に問題はありません。Vista IE9、TLS1.2有効でも接続できず。
今のところ欲しいのは、WindowsXP IE8(TLS1.2をサポートする最も古いIE、ただし標準で対応しない)、Firefox、Chrome(TLS問題が発生した当時IE8代替とされていたブラウザ群、OperaはChromeベースなので略)、Android4.4(TLS1.2をサポートする最も古いAndroid)、iOS5(TLS1.2をサポートする最も古いiOS、初代iPadがこれ)。OS X Mavericks~OS X El Capitan(TLS1.2をサポートするMacOSで販売時期が最も古い)、ニンテンドー3DS、Wii U(TLS1.2をサポートするゲーム機、裏技になるがSwitchも含めるべきか?)。このあたりが共通で表示できるもの(アクセスできなければバージョンを上げていく)が限界になると思われます。--Open-box会話2020年5月9日 (土) 04:23 (UTC)[返信]
文字が表示できない環境への配慮としては、記事名を代替表記にするよりは、本文中に文字の解説を入れた方がよいと思われます。また検索時の入力が多少困難になるためJIS X 0208内の文字を使用したリダイレクトの設置は必須でしょう(現にその逆のリダイレクトは多数設置されています)。--Schwei2会話2020年5月9日 (土) 04:39 (UTC)[返信]
残念ながら正→代替のリダイレクトは機能しますが、代替→正のリダイレクトは機能しません。というよりもですね、機能するならそもそも制限はいらないんです。だから「記事名を代替表記にするよりは、本文中に文字の解説を入れた方がよい」ができず、「記事名」だけ厳しいんです。表示が優先的な問題であれば記事本文にも制限が掛かるのですが(ビャンビャン麺はこのケースで、zhの様に画像を使う手もありました)、表記ガイドではそこまで縛らずに来ているので、今更かたかな・ひらがなに置き換えていくのも難ですしね(オフライン版を出力してもらう手はあるので記事名ほど深刻ではありません)。実際代替→正が文字ではなくコード表記や版であればあるいは? ってところはあるんですが、それはそれで普通に使う利用者に悪影響がありそうです。--Open-box会話2020年5月9日 (土) 05:07 (UTC)[返信]
すみません。「代替→正のリダイレクトが機能しない」というのがどういう現象を指しているかわかりません。たとえば、BOØWYが代替のBOOWYになっているものをBOØWYを本文にしてBOOWYをリダイレクトにした場合に非対応環境では記事名が表示されない以外にどういった不具合が起きるのでしょうか?--Monaneko会話2020年5月9日 (土) 05:21 (UTC)[返信]
記事の閲覧時よりも、一部の環境で見れない文字を使った記事へのリダイレクト作成時に問題が発生するものと思われます。記事名とリダイレクトで使える文字の範囲が違っており、リダイレクトのほうが広い範囲の文字を使えるようになっている場合、「代替」での記事作成時に記事名の制限(現状はJIS X 0208内の文字)のチェックが可能です。しかし、その逆はチェックが極めて困難になります。リダイレクトに使える文字範囲の拡張はWikipedia:井戸端/subj/Unicodeの文字をリダイレクトとして作成できるかでも議論中ですが、「リダイレクトで使える文字の一部は、記事名には使えない」ことに変わりはありません。--茶でもすするか会話2020年5月9日 (土) 06:08 (UTC)[返信]
補足しますと、リダイレクト先の日本語アドレスを解決できない状況も想定されます。これはただの夢なんですが、ガジェットで代替と正を置換できないかって期待するんですよね。記事名の制約の所に正の記事名を置いてそれを拾って代替表示と差し替え、制約の方は代替表示としてXXがありますみたいに紹介する内容に変わるってできれば、ビャンビャン麺すら使えるんじゃないかなって考えるんです。--Open-box会話2020年5月9日 (土) 06:14 (UTC)[返信]
なるほど、編集時に壊れた文字で投稿されることを気にしているんですね。マイナーな環境での編集が可能であることを考慮すべきか否かは考えの違いもあると思いますので置いておきます。リダイレクト先の日本語アドレスが解決できないについては杞憂に思われます。リダイレクト元の記事名を指定した際、サーバが302 Foundなどを返して本来の記事にリダイレクトさせる処理をしていると思いましたが、リダイレクトさせずにデータを表示して、JavaScriptでアドレスバーを書き換えているようです。JavaScriptを無効化するとアドレスが変わらなくなります(内部リンク外部リンクで試しました)。JavaScriptがおかしな処理をしてアドレスバーに正しいURLが表示されない可能性はありますが、そこまで対応しなくてもいいのではないかと思います。--Monaneko会話2020年5月9日 (土) 07:37 (UTC)[返信]
情報 Grade Cはそもそも(MediaWikiにおける)JavaScriptが無効になっています。したがって、上記のJavaScriptによる書き換えも起こらなければ、ガジェットもJavaScriptを使えません(ガジェットのCSSが使えるかどうかは未確認ですが、少なくともOpen-boxさんが述べた処理は不可能でしょう)。Grade AならばJavaScriptが使えますが、ここではGrade Aのブラウザが要点ではないと思います。--ネイ会話2020年5月9日 (土) 07:58 (UTC)[返信]
  • 情報 下記にMediaWikiにおけるブラウザへのサポートに関する情報を提供いたします。
    • IE6とIE7のサポート打ち切りの経緯はphab:T232563にありますが、提案者は「IE6とIE7がウィキメディア系サイトへのリクエストの0.1%と0.07%しか占めていない」ことを理由に挙げており、議論ではTLS1.2必須のためそもそもアクセスできないことも理由として挙げられています。
    • IE8のサポート打ち切りは現在phab:T248061にて議論中ですが、この議論では(ウィキメディア全体への)アクセス数が提出されています。今年3月15日から4月15日までの間、リクエスト数の合計が約188億回でうちIE8からのアクセスが1750万回(約0.1%)となっています。編集数については今年1月においてIE8から編集画面が開かれた回数が273回で、投稿が試みられた回数が5回となっています。Android 2.xのサポート打ち切りもphab:T249788にて議論中でアクセス数が理由となっています。(いずれも、サポート打ち切りにより使えるようになる機能があったり、CSSが軽くなったりします)
    • ニンテンドー3DS、Wii Uが使用するNetFront Browser NXmw:Compatibility#Browser support matrixではサポート対象外となっています。要は、「使用できる可能性もありますが、使用できなくても文句は言えない」状態です。
  • 以上です。--ネイ会話2020年5月9日 (土) 05:59 (UTC)[返信]
ありがとうございました。IE8打ち切りならIE9も打ち切りになりそうですね。今のまま打ち切りを進めるなら、3年後にBMPを解放できそうな気はしますが、iOSやAndroidで解放が止まったらそこはそれと言うことで。--Open-box会話2020年5月9日 (土) 06:14 (UTC)[返信]

IE8(Windows XP)やiOS、Androidであれば少なくともBMP範囲であれば使えるはずです。今後3年間もJISX0208範囲内に留めておくのはやりすぎ感は否めません。--Schwei2会話2020年5月9日 (土) 06:37 (UTC)[返信]

BMP解放とCJK等の一部に限定しての解放を取り違えてはいけません。XPどころか8.1でもBMPは扱いきれません。これは既知の問題であり、反論するには相応の証拠が必要です。この提案はシステムに触れることになるので、思い込みではなくちゃんと確認取ってまとめる必要があります。「できるはずだ」と主張してもそれでは根拠になりません。だからこそ、他の方が確認作業をやっているんですよ。ここまでの例ですと、MonanekoさんのAndroid 7.1.1の例からX0213になる可能性がある気はします。--Open-box会話2020年5月9日 (土) 07:02 (UTC)[返信]
あとなんでもありにした場合に考えられる問題としては、閲覧・編集がバグる以外にはこんな感じの制御コードを駆使したおかしな記事を作ることが可能になるということでしょうか(BMPの範囲内で記述していますが、Chromeは一部表示できないようです)。こういう類の記事名は妥当ではないものとして使われることはないでしょうが、フィルターで自動的にブロックしているのであれば管理上面倒になる可能性はあります。--Monaneko会話2020年5月9日 (土) 07:56 (UTC)[返信]
  • (コメント)私は2006年に項目名がJIS X 0208外であったことを理由にいくつかのキリル文字、例えばҺフ (キリル文字)に、Ѵイジツァに移動させましたが、これこれこれを経て、文字名で記事にするのが困難であることから文字そのものの記事についてはJIS X 0208縛りの例外とされたようです。あまりこのような例外は望ましくないので、記事名の制約はできるだけ大きくとってほしいです。…しかし、マイナーなブラウザの対応も忘れてはいけません。ここによると、メジャーなものを除いてwebOS1.5以上(<1.5になってるのは誤記か?)、Symbian OSのブラウザ、NetFront BrowserOpera Minien:Ovi (Nokia)のブラウザ、MeeGoのブラウザ、Google GlassUC Mini(スピードモード)が挙げられています(日本語圏ではほぼ使われないと思われるものも混ざってますが…)。--6144会話2020年5月9日 (土) 09:30 (UTC)[返信]

情報 Android 4.4.2、Google Chrome 81 で表示の確認をしてみました。漢字については以下の通りです。「彅」「璐」「髙」「﨑」については正しく表示されます。CJK統合漢字拡張AにあるものはUnicode 13.0で追加された10文字を除き表示されますが、CJK統合漢字拡張B(「𠮷」など)にあるものは表示されません。

絵文字についてはコード順で🛋(U+1F6CB)以降は全て縦長の四角形に化けます。それ以前は大半は表示できますが⌨(U+2328)など一部の絵文字は化けます。Unicode6.0の携帯電話の絵文字の一覧にあるものはすべて表示されますが、0⃣(U+0030 + U+20E3)や🇯🇵(U+1F1EF + U+1F1F5)といった結合文字(?)については2文字のように表示されます。なお、このコメントはAndroid端末ではなくPCから投稿しています。--本日晴天会話2020年5月9日 (土) 10:31 (UTC)[返信]

 追記 CJK互換漢字についてはU+FA2Fまでは表示されます。U+FA30からU+FA6Fについては「爫」(U+FA49)・「艹」(U+FA5D)・「艹」(U+FA5E)・「辶」(U+FA66)の4文字だけが表示されず、残りは表示されます。「恵」(U+FA6B)と「舘」(U+FA6D)は表示されますが、「𤋮」(U+FA6C)は表示されません。U+FA7DからU+FAD9については表示される文字とされない文字が混在します(この範囲についてはWindows 10、Google Chrome 81のPC環境でもいくつか化けます)。
CJK統合漢字 (8D00-9FFF)についてはAndroid 4.4.2でU+9FA5まで、Windows 10でU+9FD5まで表示されますが、それ以降はだめです。--本日晴天会話2020年5月9日 (土) 13:03 (UTC)[返信]
 追記 JIS X 0212についてはJIS X 0212コード表(全コード)をAndroid 4.4.2で閲覧したところ、「Ǐ」(U+01D0)・「Ǒ」(U+01D1)・「Ǔ」(U+01D3)・「Ǚ」(U+01D9)・「Ǖ」(U+01D5)の5文字は表示されませんでした。残りは漢字も含めて表示されます。JIS X 0213についてはJIS X 0213漢字一覧の2面の1区と94区をAndroid 4.4.2で閲覧したところ、UnicodeでBMP内のものは表示されますがBMP外のものは表示されませんでした。--本日晴天会話2020年5月10日 (日) 08:32 (UTC)[返信]

情報 iOS13.4.1のSafariにて絵文字は正常ですが、CJK互換漢字U+FA70以降が四角形の中にXに文字化けします。CJK統合漢字拡張Aは表示されますがBはだめです。絵文字は問題ないと思われます。iOS12.4.6、AのUnicode 13.0で追加分が表示できません。互換漢字FA2EとFもだめです。統合漢字、数え間違えていなければCJK統合漢字 (8D00-9FFF)の末尾付近で9文字が表示されません。絵文字、携帯電話の絵文字の一覧は問題なし、Emoji一覧は後半を中心に相当数が欠けます(画面が小さいので数えきれません)。--Open-box会話2020年5月9日 (土) 11:53 (UTC)[返信]

提案 皆様ご検証ありがとうございます。「髙」はJIS X 0212や同0213の対象外ですが、IBM拡張漢字に入っているため多くの日本語環境で表示されるものと思われます。それでは、現在一般的な日本語環境で表示ができる「JIS X 0212・JIS X 0213・IBM拡張漢字のいずれかに収録されている文字(そのうち﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩以外のCJK互換漢字を除く)」を使用可能にするというのはどうでしょうか。--Schwei2会話2020年5月9日 (土) 12:08 (UTC)[返信]

コメント その提案だとCJK統合漢字 拡張B(U+2xxxx)にあるJIS X 0213の漢字が含まれますが大丈夫でしょうか?また保守的に行くならば非漢字について、カ゚(U+30ab U+309a)のような2つの文字コードで定義されているものについても除外したほうがいいかもしれません。Wikipedia:井戸端/subj/Unicodeの文字をリダイレクトとして作成できるかを見て思いましたが、異字体セレクタの使用は禁止を明示したほうがいいと思います。U+2665は非漢字に含まれていますが異字体セレクタでテキストスタイルと絵文字スタイルが定義されているため、♥︎(テキストスタイル)と♥️(絵文字スタイル)で違う扱いになります。疑問点をあげただけですのでJIS X 0213かつCJK統合漢字 拡張B、Unicodeでは複数文字であらわすJIS X 0213非漢字については特に反対意見がないようでしたら賛成に回ります。--Monaneko会話2020年5月10日 (日) 06:16 (UTC)[返信]
拡張Bの漢字に関してはWikipedia:井戸端/subj/Unicodeの基本多言語面にない文字をタイトルに含むページの作成解禁に向けての議論次第といった所ではありますが、技術的制約が無ければ含めるべきだと考えます。カ゚(U+30ab U+309a)などはJIS X 0213の範囲内であることを考えると本来含まれるべきだと考えますが、環境によっては未だに「カ゜」のような表示になってしまいます。「どうせ分離することもあるならば許容した方が良い」「どうせ分離するならば初めから分けた表記で良い」と二つの考えが存在しうるので難しい状態です。異体字セレクタは制御文字などと同様、禁止した方がよいでしょう。--Schwei2会話) 2020年5月10日 (日) 08:02 (UTC) 微修正 Schwei2会話2020年5月10日 (日) 08:05 (UTC)[返信]
JIS X 0213で規定されている漢字の中には、Android4.4.4のブラウザ(Chrome81.0)では表示されない「𠀋」(「丈」の右上に点がついた文字、U+2000B、1面14区02点)などが含まれますね。これまでのご意見をまとめますと、一般の記事名で使用できる文字は、
  • JIS X 0201のラテン文字類。
  • 罫線素片・私用領域の文字(いわゆる外字)・異体字セレクタを除いたJIS X 0208で規定JIS X 0212・JIS X 0213・IBM拡張漢字のいずれかに収録されている文字、かつUnicode基本多言語面に配置されている文字
のような感じになりますでしょうか。--茶でもすするか会話) 2020年5月10日 (日) 08:10 (UTC)一部修正。--茶でもすするか会話2020年5月10日 (日) 08:18 (UTC)[返信]
当面はそれが無難でしょうかね。--Schwei2会話2020年5月11日 (月) 07:08 (UTC)[返信]

流れを読まずにすみません。『ビャンビャン麺』の漢字表記?ですが前2文字が表示されません(■■麺みたいになります)。Android版Firefox最新版、OSバージョンは8.1.0のG03(au)です。--2001:268:C05F:8921:C837:D43A:DD0F:2290 2020年5月11日 (月) 13:17 (UTC)[返信]

「𰻞(ビャン)」は今年に入ってUnicodeに収録されたばかりの文字です。対応環境はまだ少ないでしょう。--Schwei2会話2020年5月11日 (月) 14:20 (UTC)[返信]

情報 JIS X 0213非漢字の対応状況を調べてみるべく、JIS X 0213非漢字一覧を元にAndroid4.4.4のブラウザ(Chrome81.0)で表示可能な文字を以下にまとめました。

これを見る限り、記事名には使わない文字も多いとはいえ非漢字については「JIS X 0213掲載の文字」という条件でも危ういのではないかと思われます。また、もしJIS X 0208規定の撤廃をするのであればWikipedia:表記ガイド#使用可能な文字の内容も見直しの上、非漢字についての情報も加えたほうが良いかもしれません。--茶でもすするか会話) 2020年5月17日 (日) 11:32 (UTC)一部の文字が表示されていたため修正 --茶でもすするか会話2020年5月17日 (日) 22:08 (UTC)[返信]
※レイアウトに不具合・重なっている部分を見つけたため、一部修正させていただきました。また、量が多いので折り畳みができるようにさせていただきました。--Mario1257会話2020年5月18日 (月) 15:55 (UTC)[返信]

他の方の検証結果が出てきたので折りたたみを標準とし、更新版を作りました。--Open-box会話2020年5月20日 (水) 09:58 (UTC)[返信]
見た限り、記事名に使わない文字の方が多いと思われます。²や³などはISO 8859-1にもあるのですが、それでも表示されないのでしょうか?--Schwei2会話2020年5月17日 (日) 13:45 (UTC)[返信]
あれ、Schwei2さんのコメントの²や³はちゃんと表示できていますね。JIS X 0213非漢字一覧の表には表示されませんでしたが、上記の表を改めてAndroid4.4.4のブラウザで確認しましたところ、以下の文字は表示できていましたので修正いたします。
  • ς (0x83d7)
  • ² (0x854b)
  • ³ (0x854c)
  • ͡ (0x8671)
  • ̏ (0x867c)
それでも、5年以上前にリリースされたOSバージョンとは言え、表示できなかった文字が予想外に多かったことに驚いた次第です。もし、記事名における日本語表示を最大限に配慮するならば、デスクトップOSやモバイルOS端末だけでなく、ゲーム機などの組み込み機器搭載ブラウザの表示状況も確認した方が良いものと思われます。--茶でもすするか会話2020年5月17日 (日) 22:08 (UTC)[返信]

議論から1週間経過したため、本日から上記の条件(JIS X 0201のラテン文字類+罫線素片等を除くJIS X 0212・JIS X 0213・IBM拡張漢字のいずれか、かつBMP面に配置されている文字)に緩和しようと思っていたのですが、どうしましょう?しかし98/Meならともかく、Android4.4でも表示されない文字が多いとは…(おそらく初期のAndroidではフォント容量を節約するために文字を減らしていたのでしょうけど)--Schwei2会話2020年5月18日 (月) 05:09 (UTC)[返信]

情報 Android 6より、日本語の標準フォントがモトヤフォントからNoto Sans CJKに変更されました。これにより、CJK統合漢字 拡張Bのうち、JIS X 0213に含まれる文字、および茶でもすするかさんが表示できないとした非漢字も表示されるようになっています。--Likibp会話2020年5月18日 (月) 15:35 (UTC)[返信]
コメント 参考 Android4.2.2,Chrome71のタブレット端末を所有しているので、上記表を参考に確認しました。その結果、表示されないのは紫色になっているのに加え、♫(0x81f9)のみでした。--Mario1257会話2020年5月18日 (月) 15:55 (UTC)[返信]
  • Android4.0.4における最終版のFirefoxで確認したところ、紫枠以外でも
    ⤴⤵◉〽﹆﹅゠
    が非対応でした。--お好み焼き星人会話2020年5月19日 (火) 16:27 (UTC)[返信]
  • 情報 PlayStation4で確認しました。--Monaneko会話) 2020年5月20日 (水) 01:03 (UTC) --一部修正Monaneko会話2020年5月20日 (水) 01:08 (UTC)[返信]
    • 上記表の紫網掛け以外で表示されないもの:⊄⊅∉≅⤴⤵゠◐◑⁇⁈ḾḿǸɱʋɾɬɮɹʈɖɳɽʂʐɻɭɟɲʝʎɰʁʕʔɦʘǂɓɗʄɠɨʉɘɞɐɯʊɤɒʍɥʢʡɕʑɺɧˈˌˑ0x8680のうち̈以外、0x8690のうち̃❶以外
    • 上記表の紫網掛け内で表示されるもの:〳〴〵〻ゟ⊖⦅⦆≃♮∓ℏ㏋ゕゖ〠☂☃ヷヸヹヺ⅕㉑㉒㉓㉔㉕㉖㉗㉘㉙㉚㉛㉜㉝㉞㉟㊱㊲㊳㊴㊵㊶㊷㊸㊹㊺㊻㊼㊽㊾㊿Ǎ⓫⓬⓭⓮⓯⓰⓱⓲⓳⓴ⅺⅻ㋐㋑㋒㋓㋔㋕㋖㋗㋘㋙㋚㋛㋜㋝㋞㋟㋠㋡㋢㋣㋺㋩㋥㋭㋬
    • 上記表の紫網掛け内で表示されないもの:⊊⊋⌅⌆∦≢≶≷⦿℧⧺⧻か゚き゚く゚け゚こ゚カ゚キ゚ク゚ケ゚コ゚セ゚ツ゚ト゚⓵⓶⓷⓸⓹⓺⓻⓼⓽⓾☖☗▱ㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇷ゚ㇺㇻㇼㇽㇾㇿ⎾⎿⏀⏁⏂⏃⏄⏅⏆⏇⏈⏉⏊⏋⏌⋚⋛⌘␣⏎◒◓Ɠ˥˦˧˨˩˩˥˥˩、‿̌ ̂0x8680のもの、⁑⁂
コメント 参考 いくつかのOSの検証が穴だらけってのが困りますね(多分問題ないでしょうが、実は誰もOS XやWindows 7で確認していない問題が。iOSも私がやってるiOS12はあるんですが古いのがない)。今のうちにできることは文字表の整備と言語化です。例えばここまでの話でも、パ行以外の半濁音、ヵとヶ(カタカナ限定)・ッ・ア行・ヤ行以外の小書き、丸で囲んだカタカナ、21以上の白丸数字、11以上の黒丸数字、二重丸数字は使用不可になります。単に「JIS X 0201のラテン文字類+罫線素片等を除くJIS X 0212・JIS X 0213・IBM拡張漢字のいずれか、かつBMP面に配置されている文字」だけでは理解が及ばないので、こういった言語化は必要になるでしょう。
iOS12.4.6、IE11(Windwos Server 2012 R2)上記の表示に問題ありません。表を更新しました。--Open-box会話2020年5月20日 (水) 09:58 (UTC)[返信]
情報 Windows Vista SP2, IE9の環境でJIS X 0213の文字が表示できるかを[3]のページで確認しました(長年使っておらず、TLS1.2非対応のためウィキペディア日本語版のページが表示できなかったので、前掲サイトで確認)。フォントが不揃いになることを無視すればJIS X 0213のすべての文字が表示できましたので、WindowsにおいてはVista以降のOSならば表示に特段の問題はないものと思われます。
これがWindowsXP SP3, IE8の環境では、「㐂」(喜→七七七)「㓛」(功の右側が刀)など、JIS第3水準の漢字で表示できなかった文字が多数あった他、非漢字につきましても多数の表示できなかった文字がありました(表示できなかった文字は、Open-boxさんが2020年5月20日09:58 (UTC)の編集で更新した紫網掛けの中にすべて含まれています)。
MacOSXでは、MacOSX 10.11.6, Chrome81.0でJIS X 0213のすべての文字が表示できたことを確認しました。MacOSX 10.3, Firefox2.0で確認した結果は、Android4.4で表示できなかった非漢字に加え、トランプ記号、ローマ数字、丸数字などの丸囲み文字、「㍉」(ミリ)などの組文字も表示されないか文字化けしました。ただし、さすがに古すぎるOSのためここまで考慮する必要性は薄いでしょう。--茶でもすするか会話2020年5月24日 (日) 01:17 (UTC)[返信]

議論が停滞してしまいましたが、公式な方針に「○○で表示できる基準の文字」とするのはやや苦しい気がします。やはり前述の「JIS X 0201のラテン文字類+罫線素片等を除くJIS X 0212・JIS X 0213・IBM拡張漢字のいずれか、かつBMP面に配置されている文字(カ゚などの二文字で表す文字を除く)」とするのが良いと思われますがどうでしょう?--Schwei2会話2020年6月1日 (月) 07:18 (UTC)[返信]

依然に表明しましたが一応賛成を示しておきます。表示してクラッシュしないのであれば、多少の文字化けは許容しても差し支えないと考えています。そもそもミドルエンドのスマホだと記事が大きすぎてフリーズすることが多々あるので、あまりパソコン以外の環境には優しくないサイトと思っています。--Monaneko会話2020年6月3日 (水) 11:19 (UTC)[返信]
では、議論開始から1ヶ月となる6月8日頃にWikipedia:記事名の付け方を書き換えようと思います。--Schwei2会話2020年6月4日 (木) 07:06 (UTC)[返信]
反映後、申し訳ございませんが、(Schwei2さんが2020年5月9日 (土) 12:08 (UTC) に提案した案にはあった)「﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩以外のCJK互換漢字を除く」という条件も追加お願いします。Mediawikiの仕様により、CJK互換漢字ブロックにあるCJK統合漢字12文字以外のCJK互換漢字を含む記事名を作成しようとしても、正規化によりCJK統合漢字に分解された記事名しか作成できないためです。(実例)。なお記事名に異体字セレクタを含む文字の使用は不可である方針となったため、蛇足となりますが、CJK互換漢字用Standardized Variantを使用することにより、これを回避できることを付け加えておきます。参考1参考2--Likibp会話2020年6月8日 (月) 14:20 (UTC)[返信]

Wikipedia:記事名の付け方に反映しました。--Schwei2会話2020年6月8日 (月) 04:41 (UTC)[返信]

今更っちゃあ今更ですが、この議論は井戸端じゃなくWikipedia:記事名の付け方のノートでやるべきだったと思いますよ・・・以前は無かったJIS X 0213について書かれているのを見て、どんな議論されたのかと最初にあちらのノートを見に行きましたもの。--KAMUI会話2020年6月8日 (月) 11:44 (UTC)[返信]
jawp全体に影響すること、既に近い議論があったことから井戸端かと思いました。今後は気をつけます。--Schwei2会話2020年6月8日 (月) 12:24 (UTC)[返信]
  • コメント ガイドライン改訂による記事改名や削除等の手続きが行われていますが、改訂内容の告知が大変不足しているように思いました(私も最初、どこがどのように変更されたのか履歴を見るまで気付きませんでした)。先ほどガイドラインのページに、{{Notice}}で暫定的に告知を加えましたが、議論を追えていないためまだ詳しい変更点は書けていません。議論に参加されていた方、よろしければ改訂内容を要約・ご説明いただければと思います。--Y-route会話2020年6月18日 (木) 05:49 (UTC)[返信]
    • 返信 既に告知に詳細記載されていらっしゃいますが一応返信します。大まかな変化点としては、JIS第一水準漢字と第二水準漢字に加えてJIS第三水準漢字と第四水準漢字が使えるようになりました。加えてJIS第一~第四漢字に収録されていないIBM拡張文字についても使えるようになっています(よく使われる漢字として一例をあげるなら「はしご高」:)。ただし、一部第四水準漢字がUnicodeの基本多言語面(U+0000~U+FFFF)に含まれず、技術的な問題回避のためMediaWiki:Titleblacklistで登録されているので除外(一例をあげるなら「土よし」𠮷。現時点では記事の作成を試みても一般ユーザーの権限では記事作成はできません)。CJK互換漢字で正規化されていない文字(﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩)以外はシステムの制約で自動的に置き換えられてしまうので除外(たとえばを記事名に使用しようとしても「」になってしまう)。Unicodeでは合成漢字として扱われている文字(例えばカ゚)も合成に問題が発生する可能性がある(カだけ表示されて゜が文字化け等)ので除外されています。非漢字も多く追加されており(よく使われそうな文字としては♥)、一部古い環境では表示に問題があるという情報もありますが(コンダクタンスの単位モーや「マスクあり〼」という用法のあるマス記号)、記事名に使われる可能性はあまり高くないと思いますし、仮に使われても表示されないだけで処理に問題が発生する可能性は低いと思われます。--Monaneko会話2020年6月19日 (金) 03:11 (UTC)[返信]
  • コメント 可読性を考慮すると、JIS X 0208で定義されていない漢字を使うのは別の漢字に置き換えられない場合のみというルールでも良かったと思います。Takagu会話2020年7月16日 (木) 09:21 (UTC)[返信]
  • コメント 今更なんですが、小書きカナってア行、ヤ行、ツしか解禁できないはずですが、それ以外も含めちゃいました? 明らかになっているダメ文字を無視して実装してしまいましたか?--Open-box会話2020年8月10日 (月) 13:06 (UTC)[返信]
    • (コメント)確かに、マイナーな捨て仮名で化けることは多いようです。--6144会話2020年8月10日 (月) 23:59 (UTC)[返信]
    • コメント 現行ルール上使えるのは「ぁぃぅぇぉっゃゅょゎゕゖ」「ァィゥェォッャュョヮヵヶ」以外に「ㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿ」ですね。「ㇷ゚」はJIS X 0213非漢字に含まれますが「Unicodeの結合文字列」に該当するので使えません。ちなみに「ゕゖㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿㇷ゚」は表示されない環境が報告されていました。個人的には記事を破壊したり端末がクラッシュするなど重大な問題が起きないのであれば別にいいと思いますが--Monaneko会話2020年8月11日 (火) 02:27 (UTC)[返信]
      • コメント ダメ文字の本質は、以前のX0208と同じで到達できない問題ですね(表示だけなら本文が崩れても以前から無視されています)。 「見えない」はWikipediaとしては深刻だというのが根底にあるのでしょう。一応、過去のデータは上に表を作っていましたが、これ列挙するのもそれはそれで表示されない文字の羅列になる問題が。実は今の表示できない文字の指定にも「カ゚」にはこの問題がありますね。文章難しいなら「画像」で何とかする手はあるのですが。--Open-box会話2020年8月11日 (火) 09:56 (UTC)[返信]
        • コメント 確かに、Monaneko氏の例示された文字は、少なくともひと昔前のPCでは表示に難のあった文字だと思います。そうなるとモバイル端末などの機器内蔵ブラウザが数年以上遅れて制限を引きずっていることは充分に考えられると思いますし、実際に表示されない環境が報告されているという話があるのでしたら、それらの解禁はいったん見送ったほうが無難なのではないかと個人的には思います。特に小文字のたぐいはフォントサイズのタグなんかでも代用できますし、記事タイトルに関してもタイトル表示だけ変えるテンプレートがあれば対応できると思いますから、そう解禁を急ぐ必要は無い部類だと思います。--Gwano会話2020年8月12日 (水) 08:15 (UTC)[返信]

Wikipedia‐ノート:記事名の付け方#記事名に使用できる文字の再調整にて提案を行いました。--Open-box会話2020年8月12日 (水) 13:24 (UTC)[返信]