オープンデータページの更新状況調べたら鼻血出た

Yasuto FURUKAWA
Dec 12, 2021

--

本記事はCivicTech & GovTech Advent Calendar 2021 12日目の投稿です。

はじめに

各自治体におけるオープンデータ状況を時折気にしています。

2016年12月に公布・施行された官民データ活用推進基本法では、都道府県では「都道府県官民データ活用推進計画」の策定が義務付けられ、オープンデータの公開が本格的に始まりました。このできごとから5年ほど経ちましたが、現在どのような状況になっているのでしょう?

2021/10の政府CIOポータルデジタル庁の報告では、

・すべての都道府県で取り組み達成

・中規模都市以上の取組率は100%を達成

・各自治体の取組率は約67%(1,194/1,788自治体)

となっています。

お、結構進んだなあ、というのが第一印象ですね。
しかし各自治体の詳細や「次の一手」はどうなっているのでしょうか。

こんな事気にする方はさほど多くはないのかもしれませんが、今のうちにもうちょっとアップデートしておいたほうが良さそうなので、ここに記しておきたいと思います。

海外でのオープンデータセンサス(たとえばTaiwan OpenData Report)や、先日の武蔵大学庄司先生のスライドなどにもあるように、
今後の国内オープンデータは

  1. 質の向上
  2. 利活用の推進
  3. 自治体の負担軽減

…といった、次のフェーズに入ってきています、いや、次のフェーズに進まなくてはいけませんよね。

東京データプラットフォーム協議会第3回推進会議 庄司先生スライドより

しかし、オープンデータ活動の支援を行ったり、データそのものをたくさんダウンロードしてきた視点から見ると、コロナ禍を追い風に脱皮できた組織と、伝統性を重視した組織でここ数年で如実に差が広がってきているように感じます。いわばマラソンにおける第4集団くらいのイメージです。

先頭集団は10km先だってよ… / CC PDM 1.0

すぐ新鮮なデータにありつけるの?

わたしが今回フォーカスしたい視点は「オープンデータ取組済」となっている自治体のことです。2016年末から国内のオープンデータがはじまったとはいえ、その後も各自治体が能動的かつ継続的に取り組めているかどうかは、ちょっと気になるところです。

もちろん担当の方はデータ活用推進計画を策定して日々アップデートを行っているとおもいますが、住民や利用者の視点としてはCode fo Amercaが提唱していた、まるでAmazonで話題の新刊本にたどり着けるように、すぐ新鮮なオープンデータにアクセスできる状態なのでしょうか?

そこで、デジタル庁から提供されているオープンデータ取組済自治体一覧(令和3年10月12日時点) の都道府県csvに記載されている一覧をもとに、各都道府県オープンデータランディングページ(入口ページ)の更新日から本日(2021/12/11)までの日数を計算してみました。つまり、この値が小さければ小さいほど最新の更新アナウンスが行われ、大きいほど「ほったらかし」の傾向が出ると考えました。

都道府県別オープンデータサイト一覧

確認結果

各都道府県のオープンデータランディングページの更新日からの経過日数を確認したところ

  • 最短…0日(福岡県)
  • 最長…1153日(秋田県)
  • 中央値…10日
  • 平均値(ばらつきがアレなのであまり意味がないですが)…132.6日

となっておりました。まとめた一覧表はこちらになります。

また、30日以上オープンデータランディングページの更新がない都道府県は下図になります(Flourishはこちら)

全体を見ていて気づいたことをいくつか羅列してみます(単に私が見つけられなかった場合があればごめんなさいです)。

  • 秋田県は1153日(3年ほど)全くオープンデータを追加更新していないのではなく、各課のサイトまでたどると2020年ごろにも公開がされているようではあります。しかしランディングページにはデータ一覧も追加日時も見当たらない(各課のリンクまでクリックしていかないとわからない)ため、大変もったいないことになっています。慣れない方が見たら「あら、最新のデータ無いんだ」と判断されてしまうかもしれません。
秋田県さんもう一・二歩おねがいします…
  • 滋賀県も出し方で損をしているような気がします。データカタログ は名称と種類程度で日付もリンクも無いため新鮮かどうかの判断がつきません。また、秋田県と同様に利用者はリンクの藪の中を匍匐前進でデータ探索をすることになります。おそらくですが、最新データは一個一個見ていけばどこかにあるかもしれませんね…
滋賀県の一覧はあるが、更新日が不明orz
  • 沖縄県は構造的な問題かもしれません。ページからリンクされている沖縄地図情報システムでは2021/11での位置を持つGISのオープンデータなども閲覧・DLできますが、私のようなオープンデータ観察家や、BADオープンデータ供養寺の熱心な檀家さん()でもないと、この関係性の文脈についてすぐ理解した上ですぐたどり着くことが困難かもしれません。こちらもまずは散在している構造や情報を整理したほうがわかりやすいと思います。
「沖縄県地図情報システム」という別ページには色々ある(GISデータ以外はここにはない)
  • 岩手県はデジタル庁のリンクが旧ページのままであることと、旧ページにも新ページにも違うバージョンのデータリストが掲載されているため、誤解を招きやすくなっています。これも利用者に一定の判断や知識を求めさせることになり、統一したほうがよいのではないでしょうか。
どっちにもデータリストが載ってて一瞬(゜Д゜)となる

このほかの傾向としていくつか挙げておきます(詳細コメントは整理表の右端にコメントを入れています

最近やっと更新
その前の更新が半年前(兵庫県)だったり、二年で8データのみ追加(鳥取県)など

更新日情報がすぐわからないです
新着情報一覧がないので検索しないと最新かどうかわからない(岡山県)、一覧に西暦がない(兵庫県)など

コロナ以外もなにとぞ
コロナ関連情報は頻繁に掲載されているがそれ以外は半年以上間があいている(岡山県)

兵庫県さんお願いだから西暦入れてくだせぇ…

…みなさまなかなかな状態です。
単に日数が経っていることよりかは「ユーザーさん、とりあえずオープンデータがおいています(知らんけど)」という年季の入ったカンバンが立ったままの状態が課題なのかもしれません。
また、あまりにひどいと住民からOpenWashing(オープンのふりをしている何か)ともみなされるのでは…と心配になります。

ええまあはい / CC0

こうしてみては

ちょっともったいないところを延々と書き連ねるのもなんですので、いくつか改善点を考えてみました。

HTMLリスト掲載の形式から卒業しては?
頻繁に更新されているサイトのほとんどはCKANなどのデファクトスタンダードな専用データポータルで提供しています。また、利用者としても最新情報が見れますし、APIで自動処理に持ってくる事もできますので、DX的観点からも令和感があります。CMS入れ替えの頻度などにもよるのですぐは難しいとおもいますが、「更新日」が一体何を指すのかはちょっと探らないとわからない状態になっています。
もちろんwordを入れても素晴らしい大河恋愛小説が書けるか?と同様に、データポータルを導入しただけではすべて解決にはならないのでご注意のほどを。

シンプルな取組(出席)確認から一歩すすめては?
もう検討中かもしれませんが、より高質なオープンデータの提供や運用体制をモニタリングするために、デジタル庁さんの取組一覧は、月/年別更新数やデータまでのアクセス性についても考慮してはどうでしょうか。CKANなどのプラットフォームを導入済み自治体でしたらAPIで最新タイムスタンプ等が取れるので、リストの自動更新も可能かと思います。

自分の組織内でもっとレビュー・試食しみては?
あまりに雑然としたデザインのwebサービスを何年も置いておくことはお客様にゴザに座らせて手づかみで生焼けの食材提供する野生食堂を営んでいるようなものです。ソフトウェアやサービス開発ではドッグフーディングというテストの考えがあります。大雑把に言うと「お客さんに出す前にしっかり試食しましょうね」という意味です。
Netflix・Spotify・Amazonなどユーザー視点に立った高質なUI/UXのwebサービスにすっかり慣れてしまっている一般市民が、オープンデータ野生食堂内を快く探索してくれることはほぼないですし、ひいては将来目指したいデータドリブン社会にもなかなかたどりつけないのではないでしょうか。
ですので、利活用や効率化の視点を絡めて組織内でしっかりドックフーディング(試食)はどんどん進めていき、そこで出た改善点や欲しいデータを更に取り込むサイクルは今後重要になってくるとおもいます。

本来ならオープンデータ周辺におけるドッグフィーディングついて海外事例を調べたり、まとめを書くつもりでした。しかし実態調査をしていたらちょっとやんごとなきな状況だったため現在の構成になりました。これはまたの機会に。

興味を持った大学の方に

市区町村対象の調査も行ってみようかと思いましたが、魑魅魍魎多種多様な体裁のwebページを材料にする時点でもうコストがかかることが目に見えています。また比較的揃っていたとしても更新日時の自動取得はPythonのBeautifulSoupなどを使っても結構めんどいようですので、今回は都道府県レベルの目視確認でやめておきます。
なお、卒論ネタで困っている大学の先生諸氏におかれましては、気力と時間が潤沢にある学生さん向けに、市区町村別オープンデータ更新状況や品質について調査・論考したのち、現場に提案するなんてテーマはいかがでしょう。

おわりに

そこそこ引用されているAyre, L. B., & Craner, J. (2017)の論文では、継続的かつ品質の高いオープンデータの提供は透明性と説明責任を向上させると論じられており、下図のようにまとめています(ざっくり翻訳版ですがこちらに図を置いておきます)。

さまざまなオープンデータシナリオにおける説明責任と透明性の関係(Mayernik, M. S, 2017)

今回確認した「うーん、もう一歩」の自治体は黄色の枠に該当するように見受けられます。これをお読みの方が住まわれている、もしくは働かれている自治体のオープンデータに対する姿勢はどの枠になるでしょうか?

透明性と説明責任が伴ったオープンデータ提供は、住民や企業にとって行政への信頼性向上につながり、ゆくゆくは地域魅力の土壌になるとも考えています(今回見た都道府県でも、もしここにわたし引っ越しても大丈夫かしら…と思ったりしました)

自治体の方は様々なリソース不足に陥っているなか大変申し訳ありませんが、この記事がちょっと良くなるきっかけになれば幸いです。

参考:2020年春に作成したコロナまとめサイト検討時のアンチパターン模式図

--

--

Yasuto FURUKAWA

GIS Engineer / Organizer 人と位置と科学。Code for Japan/OSGeoJP/MIERUNE/Code for Sapporo/Rakuno Gakuen Univ./CoSTEP04