Open Knowledge Formatで日本政府データの知識グラフを作ってみた
概要
Google Cloud Blogで紹介されたOpen Knowledge Format(OKF)を使い、国土交通省の「国土数値情報」から行政区域・駅別乗降客数・地価公示データを知識グラフ化した実験記事。OKFはMarkdownとYAML frontmatterで知識を表現する軽量フォーマット。
詳細
- OKFとは: MarkdownファイルとYAML frontmatterで知識を表現する軽量フォーマット(v0.1、PoC段階)。Googleのサンプルではviz.htmlとして知識グラフを可視化可能
- 使用データ: 国土数値情報(行政区域データ、駅別乗降客数データ、地価公示データ)
- ディレクトリ構成: datasets/、tables/、metrics/、concepts/、areas/、references/ に分けてMarkdownで管理
- 実装例: 各テーブルをMarkdownのfrontmatterで型・説明・タグ・タイムスタンプを記述し、本文にはリンクを使って他ノードとの関係を表現
- 結論: OKFはデータカタログやBIツールの代替ではなく、「LLM Agentが分析前に読むデータ文脈の地図」として活用するのが適切
- 注意点: 最初から大きく作り始めるとノードの粒度が発散しやすい。ノード種類・親子関係・join情報の置き場などのルールを先に決めることが重要
参照
- 出典: Open Knowledge Formatで日本政府データの知識グラフを作ってみた(Zenn)
- はてなブックマーク数: 10