セマンティック・ウェブ
ウェブページの意味を扱うことを可能とする標準やツール群の開発によってワールド・ワイド・ウェブの利便性を向上させるプロジェクト
From Wikipedia, the free encyclopedia
セマンティック・ウェブ(英: Semantic Web)は W3C のティム・バーナーズ=リーによって提唱された、ウェブページの意味を扱うことを可能とする標準やツール群の開発によってワールド・ワイド・ウェブの利便性を向上させるプロジェクト。セマンティック・ウェブの目的はウェブページの閲覧という行為に、データの交換の側面に加えて意味の疎通を付け加えることにある。
現在のワールド・ワイド・ウェブ上のコンテンツは主にHTMLで記述されている。HTMLでは文書構造を伝えることは可能だが、個々の単語の意味をはじめとする詳細な意味を伝えることはできない。これに対し、セマンティック・ウェブはXMLによって記述した文書にRDFやOWLを用いてタグを付け加える。この、データの意味を記述したタグが文書の含む意味を形式化し、コンピュータによる自動的な情報の収集や分析へのアプローチが可能となると期待されている。オントロジーを扱う階層まではW3Cにより標準化されているが、それ以上の階層の開発は難しいため、実現と標準化には長期間掛かると予想されている。また、既存のWebサイトに対するメタデータ付与の作業が必要であるため、Web全域への普及に関しても長期間掛かると予想されている。
セマンティックウェブはXML、XML Schema、RDF、RDF Schema、OWLなどの標準およびツール群から構成されている。「OWL ウェブ・オントロジー言語概要」[1]はセマンティックウェブにおけるこれら標準およびツール群の機能・関連について述べている。
近年では、Google検索のリッチスニペットなどの応用例が存在する[2]。
その後の展開として、セマンティック・ウェブの実装の重心は、オントロジーによる厳密な推論の層を一挙に普及させる方向だけではなく、異なるデータをウェブ上で公開・接続・再利用するための実務的な枠組みへ広がった。レビュー論文では、この分野の主要概念は初期のオントロジー中心段階から、次いでLinked Data、さらに知識グラフへと少なくとも二度重心を移してきたと整理されている[3]。日本語の解説でも、Linked Data はWeb技術でデータを公開・共有するためのベストプラクティスであり、IRI、HTTP、RDF、SPARQL などによってデータを相互参照可能にするものと説明されている[4]。
応用面では、Linked Data は政府、生命科学、博物館、図書館などでのデータ公開・統合手段として普及し、企業では知識グラフやSchema.orgが意味検索やスマートなデータ処理を支える例として挙げられている[5]。また、Google検索は構造化データをページ内容やウェブ上の情報理解に利用しており、形式としては JSON-LD を推奨している[6]。このため、セマンティック・ウェブは単一の完成形としてのみ理解するより、Linked Data、構造化データ、知識グラフなどの形で段階的に実用化された技術群として捉えるほうが、現在の利用実態には近い[3][5]。