コードで語るマニフェスト:自治体データとシステムをエンジニア視点で検証する

IT 정책 제안
コードで語るマニフェスト:自治体データとシステムをエンジニア視点で検証する

どうも〜おかむーです!今日はちょっとエンジニアっぽい話をしますよ〜

  • 지방정부 전산 시스템은 레거시와標準化의 기로에 서 있다
  • PDF·웹 UI 중심 공개는 재사용을 막는다 — CSV/API 중심으로 바꿔야 한다
  • 실무적 개선안: API 우선, JSON Schema, 가버먼트 클라우드 연동

結論

지방자치단체의 데이터·시스템 문제는 기술 역량 부족이 아니라 '형식과 운영 정책'의 문제다. 엔지니어적으로 말하면, 데이터가 머신리더블(예: CSV/JSON/API)로 제공되고 표준 스키마(JSON Schema, DCAT 등)에 맞춰지면, 재사용과 검증이 훨씬 쉬워진다. 단기적으로는 PDF→CSV 파이프라인, 중장기적으로는 API-first·공통플랫폼 전환이 해법이다。

レポート本文

現状観察:具体例とソース

これ見てくださいよ。香川県の公共施設予約システム(https://www.pf489.com/Kagawa/webR/Home/StartPage/)は動いているけど、外부에서 쓸 수 있는 API가公開되어 있지 않다. 로그인 UI 중심으로 설계돼 있어 자동화나 통합이 어렵다.

一方で、デジタル庁や総務省は「基幹業務システムの標準化」「自治体情報システムの標準化・共通化」を掲げている(https://www.digital.go.jp/policies/local_governments, https://www.soumu.go.jp/menu_seisaku/chiho/jichitaijoho_system/index.html)。要するに、標準化ガイドラインはあるんだけど現場実装が遅れているんです。

問題点を技術的に分解する

  • フォーマットの非機械可読性:PDFやHTMLテーブル中心。要するにデータが人間向けに閉じている。
  • APIの欠如:認証付きWeb UIだけで、REST/GraphQLのエンドポイントが無いケースが多い。
  • スキーマの不一致:自治体ごとにフィールド命名や型が違う。集約にはマッピングが必要。
  • 運用・SLAの欠如:データ更新頻度やバージョン管理が曖昧。

エンジニア的に言うと:設計図

  • API-first 설계:CRUDをREST/GraphQL로 노출。認証はOAuth2/MTLSで標準化。
  • Schema-driven:JSON Schema/CSV schemaを公開。メタデータはDCAT-AP-JP準拠。
  • ガバメントクラウド連携:Digital Agencyの指針に従ってクラウド上に共通アプリを配置(https://www.digital.go.jp/policies/local_governments)。

実務的な改善案(短期→中長期)

短期(0–6ヶ月)

  • PDF→CSV ETL 파이프라인 도입(Tabula/camelot + CIで自動化)
  • 主要公開データをe-Statや地方統計APIに合わせて1次整備

中期(6–18ヶ月)

  • 최소限のREST API公開。GETエンドポイントでCSV/JSON返却。
  • JSON Schema 공개とテストスイート(CIでスキーマ違反を検出)

長期(18ヶ月〜)

  • 基幹業務システムの標準化・共通化を進め、ガバメントクラウドに移行
  • データカタログ(DCAT-AP-JP)とポータルで横断検索可能に

コード例:PDF→CSVの自動化イメージ(Python)

# requestsでPDFを取得してTabulaでテーブル抽出、最終的にCSVを出力する流れ

import requests

from tabula import read_pdf

r = requests.get('https://example.local/gov/report.pdf')

with open('/tmp/report.pdf','wb') as f:

f.write(r.content)

dfs = read_pdf('/tmp/report.pdf', pages='all')

例えば最初のテーブルをCSV化

dfs[0].to_csv('output.csv', index=False)

要するに、コード書く人ならわかると思うんですけど、これをCIに組み込めば定常的に機械可読データが得られるんですよ。

政策目標と実績のギャップ

デジタル庁や総務省は標準化を政策目標に掲げてるけど、現場の自治体は個別ベンダーと契約したレガシー画面が残る。数値目標(例えば“標準基盤への移行率X%”)と現状の移行速度にズレがあるなら、KPIを運用レベルで再設計する必要がある。

オープンデータ活用提案

  • オープンAPI競技会の開催:自治体が提供するAPIでハッカソンを回し、実用性を検証
  • データバウンスバック:民間が加工した派生データを自治体にフィードバックして品質改善
  • 標準スキーマ・テンプレート配布:住民記録・公共施設予約など、業務別テンプレを公開

まとめ

短い話にすると、フォーマットと公開ポリシーを直せば再利用は一気に進む。今はPDFと人間向けUIがボトルネック。API-firstとJSON Schema、そしてガバメントクラウドへの共通アプリ配置が現実的なロードマップです。技術的にはそこまで難しくない、ただ運用とガバナンスを合わせる必要があるだけなんですよ!

おかむーから一言

テクノロジーで役所をアップデートするのは俺たちのミッション。まずは小さなAPI一つから始めよう、変化はそこから来るんです!

공유하기