Code-driven Manifesto: Auditing Local Gov Data and Systems (Kagawa case study)

IT Policy Proposals
Code-driven Manifesto: Auditing Local Gov Data and Systems (Kagawa case study)

どうも〜おかむーです!今日はちょっとエンジニアっぽい話をしますよ〜

  • Public booking portals often hide data behind logins or PDFs — machine-readability is low
  • National standardization (Digital Agency, 総務省) is a clear push, but local gaps remain
  • Technical fixes: publish CSV/JSON, expose auth'd REST APIs, and adopt common schemas

結論

現場のシステムは「動いている」けどデータ利活用には向いていない、というのが一番短い結論です。国(digital.go.jp, soumu.go.jp)の標準化方針は良い方向だけど、自治体レガシー(例: 香川県の公共施設予約 pf489.com)では機械可読性・API公開・エクスポート機能が不足していて、エンジニア的に言うと“API一本で解決する話”が多いんですよね。

レポート本文

現状観察 — 具体例

これ見てくださいよ: 香川県の公共施設予約システムは https://www.pf489.com/Kagawa/webR/Home/StartPage/ で稼働しているけど、初見だと「ログイン必須」「画面中心」「CSV/JSONの公開が見当たらない」。要するにデータがUIに埋め込まれてて再利用しにくい。

一方で、総務省やデジタル庁は自治体システム標準化(https://www.soumu.go.jp/, https://www.digital.go.jp/)を進めていて、基幹系データの共通化やガバメントクラウド活用を促している。要するに国はAPI化を後押ししてるけど、現場はまだ追いついていないということです。

問題点を技術視点で整理

  • 機械可読性: PDFや画面HTMLのみでCSV/JSONがない
  • API: 公開REST APIがないか、認証が不明瞭
  • スキーマ: 統一されたOpen Dataスキーマ(DCAT/JSON-LD/CSVW)が未採用
  • ガバナンス: データ更新頻度・TTL・スキーマ版管理が不十分

簡単な技術検証例(コード)

エンジニア的に言うと、まずはスクレイピングとe-Stat APIで差を確認できます。例えばe-Stat API(https://www.e-stat.go.jp/)から取得するサンプル:

import requests

API_KEY = 'YOUR_ESTAT_KEY'

params = {'appId': API_KEY, 'surveyCode':'00200521'}

r = requests.get('https://api.e-stat.go.jp/rest/2.1/app/json/getSimpleStatsData', params=params)

print(r.json())

一方で、pf489のような予約UIはHTMLから予定を引っ張る必要がある。BeautifulSoupでテーブルをパースしてpandasで整形するのは現実的な応急手段です。

改善提案(技術的な道筋)

  • 最低限CSV/JSONのエクスポートを実装する(認証が必要ならOAuth2 + token-based API)
  • API仕様をOpenAPI/Swaggerで公開する
  • スキーマ定義はDCAT/CSVW/JSON-Schemaで統一
  • ガバメントクラウドでコンテナ化し継続的デプロイ(CI/CD)を導入
  • 局所的なデータパイプライン例: API -> ETL(pandas) -> Data Warehouse -> CKANカタログ
  • コード片(データ変換):

    import pandas as pd
    

    df = pd.read_html('https://example.gov/booking')[0]

    df.to_csv('bookings.csv', index=False)

    政策の数値目標と実績のギャップ

    国が掲げる「標準化・共通化」目標は具体的だが、個別自治体はベンダ依存・UI中心の導入で、実績としてはAPI公開率や機械可読データの割合が低い。これを評価するには「API公開率」「CSV/JSON提供率」「更新頻度」を指標に監視ダッシュボードを作ると良いです(Digital Agencyの事例集を参照)。

    オープンデータの活用可能性

    • 観光・施設利用の需要予測モデル(予約ログを使う)
    • 空き室情報をリアルタイムデータ化して民間サービスと連携
    • 災害時の公共施設の避難所利用状況を迅速に集約

    まとめ

    現場の予約システムは“ユーザー向けUI”としては機能しているけど、データを社会で再利用するための作りになっていない。APIと機械可読フォーマット、標準スキーマ、そしてガバナンスを取り入れれば、データから政策検証や新サービス創出が一気に進むはずです。

    おかむーから一言

    テクノロジーで社会をアップデートするって言うけど、実務はAPIとCSVの積み重ねなんですよ!まずは小さく公開して、改善を回していきましょう〜