NTTドコモR&Dの技術ブログです。

ドコモ・バイクシェアのデータがオープンデータになったので触ってみた

アドベントカレンダーをご覧のみなのもの~!おはこんハロチャオ~! NTTドコモの三村だよ!今日は世界のみなのものに向けて記事を書いていくぞ〜!

ということで新たな大地に旅に出て約1ヶ月たったのですが皆さんいかがお過ごしでしょうか? 私はアニメをよく見ており、バスケがしたくなったり、下北沢やお茶の水に行ってみたくなったりしています。

そんな聖地巡礼に便利なのがドコモ・バイクシェアです! そこで今回はバイクシェアのデータ分析について紹介します。

ドコモ・バイクシェアとは?

バイクシェアとは"乗りたい時に借りて、行きたい場所で返すことができる自転車のシェア(共有)サービス"です。 今回は、バイクシェアサービスの中でも株式会社ドコモ・バイクシェアが展開するバイクシェアに注目ていきます。 docomo-cycle.jp

そんな、バイクシェアデータが公共交通オープンデータで公開されました!

ckan.odpt.org

備考

OpenStreet株式会社でも同日にシェアサイクルのオープンデータ公開されており利用規約に従いデータを利用することができます。

ckan.odpt.org

詳しく下記の記事にて説明してくださっておりとても参考になります。

note.com

データの描画

では次に公開されたドコモバイクシェアのデータをもとに地図上に描画してみましょう!

ポートの位置

東京都内を中心に色々なところに自転車を駐輪できる場所(ポート)がありますね。 これでいつもで聖地巡礼の時に安心!とはいかないでですね・・・ やっぱりそのポートに行った時に自転車がないと利用できない。

そこで、今度は各ポートごとの貸出可能な自転車の台数を可視化してみましょう!

自転車の利用可能台数

横軸に時間、縦軸に自転車の利用可能台数を描画してみました。 この図からなんとなく、自転車がある時・ない時があり、これはポートごとに特徴がありそうなことが分かりました。 また、ポートに自転車がない時間があることも分かりますね・・・

データ分析

ポートごとに特徴があるのであればそれをグループ分けできるのちゃうかなと思うわけで、実際にやってみました! 今回は簡単な手法チャチャと可視化てしているためにk-meansを使ってみます。 この手法はなにもラベルを与えることなくポートをグループ分けしてくれます。 今回はscikit-learnと呼ばれるライブラリを用いて実装しました。

scikit-learn.org

まずグループを一括に可視化した図を見てみましょう。 今回も横軸に時間、縦軸に自転車の利用可能台数を描画してみました。 グループごとに色分けして太線は各グループの中心線です。

グループ化した結果を可視化

なんとなくグループ分けができていることが分かりました。 しかし、見にくいのでグループごとに図を分けしてみましょう。

グループ1の利用傾向

グループ2の利用傾向

グループ3の利用傾向

朝利用されている傾向があるポートのグループや、夕方利用されているポートのグループがあることが分かります。

最後にグループ色分けして地図上に描画してみましょう。

グループ化した結果

なんとなく土地ごとに特性があることが見えてきますね。 このような感じで自転車のオープンデータを見るだけでも多くのことが分かってきます。

最後に

ドコモ・バイクシェアのデータを見ても分かる通り自転車がない時間があったり、バッテリーが切れていて自転車が利用できない時間があったりするなど、より良いサービスにして行くためには、まだまだたくさんの課題があります。 こういった問題に対して効率よく解決する機会学習モデルを構築したい人、他にも自転車などの位置情報データと様々なビッグデータを突き合わせて新たなビジネスを創出したい人や下記のようなさまざまな企業と連携して社会課題に取り組みたい人がいらっしゃったらは是非とも連絡ください!

https://www.jreast.co.jp/press/2021/20220121_ho02.pdf

参考

Provider name of content, etc.: DOCOMO BIKESHARE, INC. / Association for Open Data of Public Transportation