コードで語るマニフェスト:日本政府データをエンジニア視点で検証する

どうも〜おかむーです!大家好,我是おかむー!今日はちょっとエンジニアっぽい話をしますよ〜政府の「言葉としてのマニフェスト」をコードとデータで検証する、そんなレポートを書きます!
- 这篇文章用工程师视角看政府数据平台:可用性、機械可読性、API可得性。
- 以首相官邸、Japan Dashboard(デジタル庁)、e-Stat 等官方资源为例,指出問題与改善提案。
- 提供实用的コード例(PDF抽出/API调用/時系列比較),方便你立刻动手验证。
結論
結論はシンプルです:政策の「宣言」はあるけど、データで検証できる仕組みがまだ十分じゃない!要するに(也就是说)、ドキュメント主体の公開(PDF)と可視化主体のダッシュボードはあるけど、エンジニアがAPIで取りに行ける一次データや標準化されたメタデータが不足している。これ、技術的に解消可能で、実装すれば政策の説明責任(accountability)と再利用性が劇的に上がりますよね!
レポート本文
現状のスナップショット(ソース参照)
- 首相官邸(https://www.kantei.go.jp/):政策文書や閣議決定が豊富に公開されているが多くはHTML/PDF主体。マシンリーダブルな数値タイムシリーズは限定的。
- Japan Dashboard(デジタル庁、https://www.digital.go.jp/resources/japandashboard):政府統計の可視化を統合する取り組み。グラフやビジュアルは便利だが、API経由で一次データを横断的に取得できるかは要確認。
- 統計ダッシュボード(e-Stat dashboard、https://dashboard.e-stat.go.jp/):主要統計のグラフとe-Stat APIへの導線あり。e-Stat自体はREST APIを提供(appId認証)しており、機械可読データ取得が可能。
- GovTech東京(https://www.govtechtokyo.or.jp/):自治体向けダッシュボード整備支援。地方でもダッシュボード化が進んでいるが標準化は自治体ごとにばらつき。
これ見てくださいよ:見た目のダッシュボードは増えているんだけど、CSV/JSONで落とせるか、APIで時系列を取り出せるかはサイトごとに違う。PDFに埋められた数値は自動化の大敵です!
技術的な問題点(優先度順)
- 問題点:PDFは人間には読めるけど機械処理が難しい。マニフェストの数値目標がPDF内表になっていると、抽出→整形の工程が必要。
- 要するに(也就是说):データは“閉じている”。
- e-StatはAPIがある一方で、内閣府や各府省はAPIを提供していない場合がある。ダッシュボードは可視化に特化しがちで、APIエンドポイントが無い・不十分。
- DCATやCSVWのような機械可読メタデータが無いと、データ統合時に列意味解釈が必要になる。
- 時系列データを追いかけるには差分取得や変更履歴APIが欲しいが、標準で提供しているところは少ない。
- API利用にappId等の認証が必要な場合があり、匿名アクセスやフロントエンドからのクロスオリジン利用が面倒。
実際にやってみる:コード例とワークフロー
1) e-Stat API で時系列を引く(Python例)
# 要するに:まずはe-Stat APIから一次データ取るのが王道
import requests
import pandas as pd
API = 'https://api.e-stat.go.jp/rest/3.0/app/json/getStatsData'
params = {
'appId': 'YOUR_ESTAT_APPID',
'statsDataId': '0003412317', # 例
'metaGetFlg': 'N',
'cntGetFlg': 'N'
}
resp = requests.get(API, params=params)
data = resp.json()
JSON構造を確認してDataFrameに整形する
df = pd.json_normalize(...)
ポイント:e-StatはappId必要、レスポンスは深いJSONになるのでjson_normalizeやSchema定義で整形する。
2) PDFからマニフェストの目標値を抽出(Tabula/Camelot)
# tabula-py の例(Java環境が必要)
import tabula
pdf_path = 'manifesto.pdf'
tables = tabula.read_pdf(pdf_path, pages='all', multiple_tables=True)
tables は DataFrame のリスト。目標値のテーブルを探してクレンジング。
要するに:PDF抽出は手間がかかる。可能なら政府側でCSV/JSONの併記をお願いしたい!
3) 目標 vs 実績 をプログラムで比較
# 目標と実績を辞書化して差分を計算
targets = {'employment_rate_2025': 75.0}
actual = {'employment_rate_2025': 72.3}
for k in targets:
gap = actual.get(k, None) - targets[k] if actual.get(k) is not None else None
print(k, 'gap=', gap)
実務では時系列で有意差分析やトレンド分解をして、目標達成確度を出すと良い。
データ品質チェックの自動化案
- スキーマ検証:JSON Schema / CSVW で必須カラムを宣言。CIに組み込んでデプロイ前に検証。
- 値域チェック:閾値外の値はアラート。
- タイムスタンプ整合性:同一指標の時系列に欠損がないかチェック。
- provenance:DCAT・Schema.org を用いてデータの出処を明示。
政策数値目標と実績のギャップ分析の進め方(テンプレ)
※ 自動化パイプラインにはAirflowやGitHub Actionsを使うと良いですよ〜
改善提案(実装レベル)
- PDFと同じコンテンツをCSV/JSONで公開。機械可読の一次データを必須にする。
- 省庁横断のAPIゲートウェイをデジタル庁が提供し、認証とメタデータは中央で管理する。
- DCAT-AP-JP / CSVW / JSON-LD を用いてデータカタログ化。
- データ更新をWebhookやChange APIで通知。ダッシュボードはこれを購読する。
- GitHubで「manifesto-dashboard-template」を公開して地方自治体も使えるようにする。
- データ公開のSLA(更新頻度、遅延許容)と品質メトリクスを可視化。
技術的に言うと、API一本で解決する話なんですよね。標準化すれば自治体も横展開しやすい。
まとめ
- 見た目の可視化(ダッシュボード)は増えているが、機械可読な一次データとメタデータの標準化が不足している。
- e-Stat のようなAPIはあるが、省庁や自治体で提供状況がバラつくため横断的な検証が難しい。
- 政策目標と実績をコードで比較するためには、PDFをやめてCSV/JSONで出す・メタデータ標準を採用する・APIを統一する、これらの実装が必要。
- 実行可能な改良案は明確で、技術的負債を解消すれば説明責任と市民向け情報提供が一段と向上する。
おかむーから一言
テクノロジーで社会をアップデートする、って言ってきたけど、本当に必要なのは「データを開けること」です。API一本、メタデータ一つで、政策の信頼性はガラッと変わる。さあ、コードで語ろう!
信息来源
- https://www.kantei.go.jp/
- https://www.digital.go.jp/resources/japandashboard
- https://www.kantei.go.jp/jp/news/index.html
- https://dashboard.e-stat.go.jp/
- https://www.kantei.go.jp/jp/naikaku/index.html
- https://www.govtechtokyo.or.jp/services/data-utilization/
- https://www.gii.co.jp/report/tbrc2009626-government-technology-govtech-global-market-report.html
- https://prtimes.jp/main/html/rd/p/000000223.000040956.html
- https://gptech.jp/articles/dictionary-govtech/
- https://graffer.jp/govtech/articles/what-is-govtech
- https://www.zhihu.com/question/290714454
- https://metidx-gov.note.jp/n/n9468573c213b
- https://www.zhihu.com/question/6430289390
- https://ai-government-portal.com/%E5%85%AC%E5%8B%99%E5%93%A1%E3%81%AE%E6%96%B0%E3%81%97%E3%81%84%E6%8C%91%E6%88%A6%E3%80%8C%E8%A1%8C%E6%94%BFux%E6%94%B9%E5%96%84%E6%A5%AD%E5%8B%99%E5%A7%94%E8%A8%97%E3%80%8D%E5%AE%8C%E5%85%A8%E3%82%AC/
- https://www.zhihu.com/question/38923279
相关报告

代码で語るマニフェスト:以香川县公共设施预约系统为例的技术与数据审视
以香川县公共设施预约系统为例,从API、数据格式与标准化角度检视自治体系统,给出可执行的技术改进方案与代码示例。

用代码说话的宣言:从机器可读性到API化,解读日本数字化政策的数据工程路径
从Digital庁到e-Stat,评估日本数位政策的数据交付形态,提出API化与工程化改进路线,附代码与验证示例。

代码で語るマニフェスト:从数据与工程看日本政府与自治体的开放化现状
用工程师视角检视日本政府与自治体的数据发布:CSV、API、PDF问题与改善路线,提出可操作的技术方案与代码示例。