コンテンツにスキップ

タグクラウド

出典: フリー百科事典『ウィキペディア(Wikipedia)』
IBM Word Cloud Generatorビルド32を使用して、完全なgzipされたリストアーカイブで作成されたFoundation-lワードクラウド(アーカイブおよびすべてのヘッダーと本文内の引用テキストからの重複メールなし)。 [1]
Web 2.0に関連する用語を含むタグクラウド

タグ・クラウド (tag cloud、 ワードクラウド 、またはビジュアルデザインの重み付きリスト )はタグの視覚的記述を指す。テキストデータの斬新な視覚表現であり、通常はWebサイトでキーワードメタデータ(タグ)を描写したり、自由形式のテキストを視覚化するが、通常タグは単一の単語であり、各タグの重要性はフォントサイズまたは色で示される[2]。 この形式は、最も重要な用語をすばやく認識して、その相対的な重要度を判断するのに役立つが Webサイトのナビゲーション支援として使用される場合、用語はタグに関連付けられたアイテムにハイパーリンクされる。

歴史

[編集]
ハイジパリ:1991年11月14日付、ジルドゥルーズとフェリックスガタリによるドイツ語版「A Thousand Plateaus」の最初のカバードラフト

ビジュアルデザインの言語ではタグクラウド(またはワードクラウド)は一種の「重み付けリスト」であり、地理マップで一般的に使用され、相対的な書体サイズに関して都市の相対的なサイズを表す。英語のキーワードの重み付きリストの初期の印刷例は Douglas CouplandMicroserfs (1995)の「潜在意識ファイル」。 ドイツの外観は1992年に発生[3]

「タグクラウド」という用語の特定の視覚形式と一般的な使用は Webサイトを記述するキーワードメタデータの頻度分布を視覚化するために主に使用される、初期のWeb 2.0 Webサイトおよびブログの広範な機能として、21世紀の最初の10年にコンテンツ、およびナビゲーション支援として顕著になっていく。

有名なウェブサイトの最初のタグクラウドは、2004年にFlickrの共同設立者でありインタラクションデザイナーのスチュワート・バターフィールドによって作成された写真共有サイトFlickrにあった。この実装はJim FlanaganのSearch Referral Zeitgeist、[4] Webサイトのリファラーの視覚化に基づいていた。タグクラウドも、ほぼ同時期にDel.icio.usTechnoratiによって普及した。

タグクラウドメソッドの過飽和とWebナビゲーションツールとしての有用性に関するあいまいさによりこれらの早期採用者の間で使用量が著しく減少する[5] (Flickrは、2006年の「ベストプラクティス」Webby賞の5単語の受け入れスピーチで、ウェブ開発コミュニティに「謝罪」、「タグクラウドについてごめんなさい」と述べている。 ) [6]

ソフトウェア開発の第2世代は、テキストデータの基本的な視覚化方法として、タグクラウドの幅広い用途を発見。 これに関連して、タグクラウドのいくつかの拡張が提案されるが 例としてパラレルタグクラウド、 [7] SparkClouds、 [8]およびプレフィックスタグクラウドがある[9]Adobe Flexで記述されたWord Cloud Explorerは、タグクラウドとテキスト分析のための多数のインタラクティブ機能を組み合わせている[10]

タイプ

[編集]
世界各国の人口を示すデータクラウド。 wordcloudパッケージを使用してRで作成。 国の人口からのデータ。 中国とインドの比例サイズは半分に分割されていることに注意してください。

ソーシャルソフトウェアは主に3つのタイプのタグクラウドアプリケーションがあり、外観ではなくその意味によって区別される。最初のタイプには各アイテムの頻度のタグがあるが2番目のタイプにはすべてのアイテムとユーザーにわたって頻度が集計されるグローバルタグクラウドがあり、3番目のタイプでは、クラウドにはカテゴリが含まれ、サイズはサブカテゴリの数を示している。

周波数

[編集]

最初のタイプではサイズはタグが単一のアイテムに適用された回数を表している[11]。これは民主的に 「投票」されたアイテムに関するメタデータを表示する手段として、また正確な結果が望ましくない場合に便利である。

2番目のより一般的に使用されるタイプで [要出典] サイズは各タグの人気度の表示として、タグが適用されたアイテムの数を表している。

意義

[編集]

頻度の代わりにサイズを使用し、背景コーパスと比較して(たとえば、Wikipediaのすべてのテキストと比較して)単語と単語の共起の重要性を表すことができる[12]。 このアプローチはスタンドアロンでは使用でないが、ドキュメントの頻度を予想される分布と比較することに依存している。

分類

[編集]

3番目のタイプでは、タグはコンテンツアイテムの分類方法として使用される。タグはクラウドで表され、大きなタグはそのカテゴリのコンテンツアイテムの量を表している。

タグクラウドの代わりにタグクラスターを構築するアプローチがいくつかあり、例えば  文書内でタグの共起を適用など[13]

より一般的にはワードクラウドまたはデータクラウドの場合と同じ視覚技術を使用して、非タグデータを表示できる 。

キーワードクラウドという用語が特定のWebサイトに関連するキーワードのグループを指す検索エンジンマーケティング (SEM)用語として使用される場合があるが 近年タグクラウドは、Webページの検索エンジン最適化における役割と、情報システム内のコンテンツを効率的にナビゲートする際のユーザーのサポートにより人気を集めており[14]、ナビゲーションツールとしてのタグクラウドは、検索エンジンスパイダーがクロールするときに[15] Webサイトのリソースをより接続しやすくしている。これにより、サイトの検索エンジンのランクが向上する可能性があるが ユーザーインターフェイスの観点からは、検索結果を要約するためによく使用され、特定の情報システムでコンテンツをより迅速な検索をサポート[16]

外観

[編集]
株価の動きを示すデータクラウド。 色は正または負の変化を示し、フォントサイズは変化率を示します。

タグクラウドは通常、インラインHTML要素を使用して表され、タグは、アルファベット順に、ランダムな順序で、重さなどでソートできる。フォントサイズ、フォントの色、強度、太さなどに加えて、さらに視覚的なプロパティが操作される場合があるが[17]、最も一般的なのは行ごとの順次レイアウトでアルファベット順に並べ替えられた長方形のタグ配置で、 最適なレイアウトの決定は予想されるユーザーの目標に基づいて決定する必要があり、タグを意味的にクラスター化して、類似のタグが互いに近くに表示されるようにする[18] [19]か、 単語を配置するためにtSNEなどの埋め込み手法を使用することを好む人もいる。 エッジを追加して、タグの共起を強調し、相互作用を視覚化でき 目的がタグのクラスター化であるかどうかにかかわらず、 ヒューリスティックを使用してタグクラウドのサイズを縮小できる。

タグクラウドの視覚的分類は、タグの順序規則(例:アルファベット順、重要度別、コンテキスト別、ランダム、表示品質順)、クラウド全体の形状(例:四角形、円、マップの境界線)、形状タグの境界(長方形、または文字本体)、タグの回転(なし、無料、制限あり)、タグの垂直方向の配置(活版印刷のベースラインに固定、無料)で Web上のタグクラウドは、美観のモデリングと制御、タグの2次元レイアウトの構築の問題に対処する必要があり、これらはすべて揮発性ブラウザープラットフォームで短時間で実行する必要がある。Webで使用されるタグクラウドは、ロボットで読み取り可能にするために、グラフィックスではなくHTMLである必要があり、ブラウザーで利用可能なフォントを使用してクライアント側で構築され、長方形のボックスに収まる必要がある[20]

データクラウド

[編集]

データクラウドまたはクラウドデータは、フォントサイズや色を使用して数値を示すデータ表示法[21]で タグクラウド[22]似ているが、単語数の代わりに、人口や株価などのデータを表示する。

テキストクラウド

[編集]
2002年のブッシュ大統領による一般教書演説と2011年のオバマ大統領による演説演説を比較したテキストクラウド。 [23]
科学関連の単語を含むマラヤーラム語テキストクラウド

テキストクラウドまたはワードクラウドは、特定のテキスト内の単語の頻度を重み付きリストとして視覚化したもの[24]。 この手法は最近、政治演説の話題の内容を視覚化するために広く使用されている [23] [25]

コロケートクラウド

[編集]

テキストクラウドの原則を拡張するコロケートクラウドは、ドキュメントまたはコーパスに対しより集中的なビューを提供。 ドキュメント全体を要約する代わりにこのクラウドは特定の単語の使用状況を調べるが結果のクラウドには検索ワードと組み合わせて使用されることが多いワードが含まれ、これらのコロケートは、頻度(サイズ)とコロコロ強度(輝度)を表示するようにフォーマットされている。これにより、言語を参照および探索するためのインタラクティブな方法が提供される[26]

知覚

[編集]

タグクラウドは、いくつかのユーザビリティ研究で調査対象となっており、以下の要約は、ローマンらによって与えられた研究結果の概要に基づいている: [17]

  • タグサイズ:大きいタグは小さいタグよりもユーザーの注意を引き付け(たとえば、  文字数、位置、隣接タグ)
  • スキャン:ユーザーはタグクラウドを読み取るのではなくスキャン
  • センタリング:クラウドの中央にあるタグは、境界線に近いタグよりもユーザーの注目を集める( レイアウトの影響を受ける )
  • 位置:左上の象限は、他の象限よりもユーザーの注意を引く(西部の読書習慣)
  • 調査:タグクラウドは、特定のタグを検索する際に最適でないサポートを提供(タグに非常に大きなフォントサイズがない場合)

フェリックス等[27]。 数値をフォントのサイズにマッピングする従来のタグクラウドや、色や円や棒などの追加形状を使用する代替デザインと、人間の読み取りパフォーマンスの違いを、また単語の配置がパフォーマンスにどのように影響するかを比較。

  • 数値を読み取るときにフォントサイズの代わりに追加のバーまたは円を使用すると、精度が向上
  • ただし、追加のマークが使用されていない場合、ユーザーは特定の単語をすばやく見つけることができる
  • パフォーマンスはタスクに依存。単語を見つけるなどの単純なタスクは、デザインの選択によって大きな影響を受けるが、タグクラウドのトピックを識別するなどのタスクへの影響ははるかに小さくなる

作成

[編集]
ビュール数でソートされたウィキペディアの上位1000の重要な記事から構築されたワードル。 [28] Wordleギャラリーで入手できます。 [29]

原則として、タグクラウド内のタグのフォントサイズは、その発生率によって決まる。ウェブログなどのカテゴリの単語雲の場合、頻度は、たとえば、カテゴリに割り当てられているウェブログエントリの数に対応。 周波数が小さい場合は、1から最大フォントサイズまで、フォントサイズを直接指定できる。 値が大きい場合は、スケーリングを行う必要があります。 線形正規化では、重み記述子のFを介して1のサイズスケールにマッピングされそしてまで利用可能な重みの範囲を指定していく。

ために ;他に
  • :フォントサイズを表示
  • :最大フォントサイズ
  • : カウント
  • :分カウント
  • :最大カウント

記述子ごとのインデックス付きアイテムの数は通常、 べき法則 に従って分布しているため、値の範囲が広い場合、 対数表現は意味がある[30]

タグクラウドの実装には、一般的な単語、数字、句読点などの役に立たないタグのテキスト解析とフィルタリングも含まれる。

一部のオンラインプレゼンテーションプログラムを使用して、ユーザー入力でタグクラウドが生成可能[31][32][33]

広告やユーモラスな結果のために、人為的またはランダムに重み付けされたタグクラウドを作成するWebサイトもある。

関連項目

[編集]

脚注

[編集]
  1. ^ Word-Cloud Generator (archive)
  2. ^ Martin Halvey and Mark T. Keane, An Assessment of Tag Presentation Techniques Archived 2017-05-14 at the Wayback Machine., poster presentation at WWW 2007, 2007
  3. ^ Gilles Deleuze, Felix Guattari (1992). Tausend Plateaus. Kapitalismus und Schizophrenie. ISBN 978-3-88396-094-4 
  4. ^ A copy of Jim Flanagan's Search Referral Zeitgeist was available at archive.org but has since been blocked. In the comments of a blog entry Archived 2006-04-26 at the Wayback Machine., a user identified as Steve Minutillo attribute the idea to Jim Flanagan, stating that Flanagan's site had such displays in 2002.
  5. ^ Tag Clouds R.I.P.?”. Readwriteweb.com (2011年3月30日). 2012年3月19日時点のオリジナルよりアーカイブ。2011年3月22日閲覧。
  6. ^ Welcome to the Webby Awards”. Webbyawards.com (2011年10月28日). 2006年7月3日時点のオリジナルよりアーカイブ。2013年7月27日閲覧。
  7. ^ Collins, C., Viegas, F. and Wattenberg, M., Parallel Tag Clouds to Explore and Analyze Faceted Text Corpora. Proceedings of the IEEE Symposium on Visual Analytics Science and Technology (VAST 2009), pp. 91–98, IEEE, 2009.
  8. ^ Lee, B., Riche, N., Karlson, A., and Carpendale, S., SparkClouds: Visualizing Trends in Tag Clouds Archived 2013-09-28 at the Wayback Machine.. IEEE Transactions on Visualization and Computer Graphics, vol. 16, no. 6, pp. 1182–1189, 2010.
  9. ^ Burch, M., Lohmann, S., Pompe, D., Weiskopf, D., Prefix Tag Clouds Archived 2013-09-27 at the Wayback Machine.. Proceedings of the 17th International Conference on Information Visualisation (IV 2013), pp. 45-50, IEEE, 2013.
  10. ^ Lohmann. “Word Cloud Explorer”. wordclouds.visualdataweb.org. 2014年2月23日時点のオリジナルよりアーカイブ。2014年2月7日閲覧。
  11. ^ Bielenberg, K. and Zacher, M., Groups in Social Software: Utilizing Tagging to Integrate Individual Contexts for Social Navigation Archived 2007-10-08 at the Wayback Machine., Masters Thesis submitted to the Program of Digital Media, Universität Bremen (2006)
  12. ^ Schubert, Erich; Spitz, Andreas; Weiler, Michael; Geiß, Johanna; Gertz, Michael (11 August 2017). "Semantic Word Clouds with Background Corpus Normalization and t-distributed Stochastic Neighbor Embedding". arXiv:1708.03569 [cs.IR]。
  13. ^ Knautz, K., Soubusta, S., & Stock, W.G. (2010). Tag clusters as information retrieval interfaces Archived 2011-07-17 at the Wayback Machine.. Proceedings of the 43rd Annual Hawaii International Conference on System Sciences (HICSS-43), January 5–8, 2010. IEEE Computer Society Press (10 pages).
  14. ^ Helic, D.; Trattner, C.; Strohmaier, M.; Andrews, K. (2011). “Are Tag Clouds Useful for Navigation? A Network-Theoretic Analysis”. International Journal of Social Computing and Cyber-Physical Systems 1 (1): 33–55. doi:10.1504/IJSCCPS.2011.043603. http://www.markusstrohmaier.info/documents/2011_JoSCCPS-socialcom2010_extended.pdf. 
  15. ^ Trattner, C.:Linking Related Content in Web Encyclopedias with search query tag clouds Archived 2012-06-15 at the Wayback Machine.. IADIS International Journal on WWW/Internet, Volume 9, Issue 2, 2011
  16. ^ Tratter, C., Lin, Y., Parra, D., Yue, Z., Brusilovsky, P.: Evaluating Tag-Based Information Access in Image Collections Archived 2012-06-15 at the Wayback Machine.. In Proceedings of the 23rd ACM Conference on Hypertext and Social Media (HT 2012). ACM, New York, NY, USA, 2012
  17. ^ a b Lohmann, S., Ziegler, J., Tetzlaff, L. Comparison of Tag Cloud Layouts: Task-Related Performance and Visual Exploration Archived 2009-10-07 at the Wayback Machine., T. Gross et al. (Eds.): INTERACT 2009, Part I, LNCS 5726, pp. 392–404, 2009.
  18. ^ Hassan-Montero, Y., Herrero-Solana, V. Improving Tag-Clouds as Visual Information Retrieval Interfaces Archived 2006-08-13 at the Wayback Machine.. InSciT 2006: Mérida, Spain. October 25–28, 2006.
  19. ^ Salonen, J. 2007. Self-organising map based tag clouds – Creating spatially meaningful representations of tagging data Archived 2008-12-24 at the Wayback Machine.. Proceedings of the 1st OPAALS conference, 26–27 November 2007, Rome, Italy.
  20. ^ Marszałkowski, J., Mokwa, D., Drozdowski, M., Rusiecki, L., Narożny, H. Fast algorithms for online construction of web tag clouds, Engineering Applications of Artificial Intelligence 64, pp. 378–390, 2017.
  21. ^ Apel. “ManyEyes Visualization and Commentary: World Population Data Cloud.”. 2007年10月29日時点のオリジナルよりアーカイブ。2007年8月26日閲覧。
  22. ^ Wattenberg. “ManyEyes Visualization: Ad cloud”. 2008年2月14日時点のオリジナルよりアーカイブ。2007年3月12日閲覧。
  23. ^ a b Steinbock. “TagCrowd visualization: State of the Union”. 2011年4月11日時点のオリジナルよりアーカイブ。2011年3月5日閲覧。
  24. ^ Lamantia. “Text Clouds: A New Form of Tag Cloud?”. 2008年9月10日時点のオリジナルよりアーカイブ。2008年9月11日閲覧。
  25. ^ Mehta. “US Presidential Speeches Tag Cloud”. 2007年10月19日時点のオリジナルよりアーカイブ。2008年9月11日閲覧。
  26. ^ Collocate cloud”. 2008年12月5日閲覧。
  27. ^ Felix, Cristian; Franconeri, Steven; Bertini, Enrico (Jan 2018). “Taking Word Clouds Apart: An Empirical Investigation of the Design Space for Keyword Summaries.”. IEEE Transactions on Visualization and Computer Graphics 24 (1): 657–666. doi:10.1109/TVCG.2017.2746018. PMID 28866593. 
  28. ^ Monthly wiki page Hits for en.wikipedia”. Wikistics.falsikon.de (2009年8月31日). 2013年4月19日時点のオリジナルよりアーカイブ。2013年7月27日閲覧。
  29. ^ WikipediaTop1000VitalArticleHits”. Wordle. 2013年9月27日時点のオリジナルよりアーカイブ。2013年7月27日閲覧。
  30. ^ Kentbyte: Tag Cloud Font Distribution Algorithm. June 2005”. Echochamberproject.com. 2013年10月2日時点のオリジナルよりアーカイブ。2013年7月27日閲覧。
  31. ^ Create live Word Clouds” (英語). Mentimeter. 2018年11月7日閲覧。
  32. ^ WordCloud Generator”. 2024年1月4日閲覧。
  33. ^ Live Word Cloud Generator”. 2024年1月4日閲覧。

外部リンク

[編集]