私のブックマーク
人の移動
落合 桂一((株) NTTドコモ)
1.はじめに
スマートフォンをはじめとした携帯端末では GPSや Wi-Fi,携帯電話の基地局情報などさまざまな方法で位置情報を測定する(測位する)ことができ,スマートフォンの普及により人の移動に関するデータが利用できるようになった.社会生活において人々の移動は基本的な行動であり,経済活動や交通,公衆衛生などさまざまな分野と深い関わりがある.人の移動に関するデータが特に注目されたのは,新型コロナウイルスの感染防止のため緊急事態宣言が発出されたときであろう.緊急事態宣言では混雑を回避するため外出自粛が要請され,その効果を定量的に計測する指標の一つとして主要駅や歓楽街の人出が計測された.
本稿では,人の移動に関する最新の研究動向,研究で使われているライブラリなど実装に関する情報やデータセットについて紹介する.
2.人の移動に関する研究動向
2・1 主要な学会
人の移動に関する研究は,NatureやScienceなどの自然科学系のジャーナル,ACMのKDDやSIGSPATIAL,UbiCompなどコンピュータサイエンス系の国際会議などで論文が発表されることが多い.また,ソーシャルメディアの一種である位置ベースソーシャルメディアを対象とした研究もあり,それらの研究は本誌 2017年5月号に掲載の私のブックマーク「位置ベースソーシャルメディア(Location-based SocialMedia)」も参照されたい.
人の移動に関するさまざまな特性をもとに訪問する場所やPoint-of-Interest(POI)の予測・推薦を行う研究も盛んに行われており,そのような研究はRecsys,SIGIR,AAAI,IJCAIなど情報推薦,情報検索,人工知能分野の学会でも発表されている.
2・2 研究テーマ
近年の研究テーマの動向を調べるため,KDDとSIGSPATIALを対象に2021~23年までに本会議に採録された論文を調査した.対象学会の論文採録リストに対して,人の移動を扱った論文を論文タイトルとのキーワードマッチにより抽出(キーワードはgeo, spatial,location,traffic,transport,trajectory)し,アブストラクトを読み,人の移動と関連がない論文(例えばnetwork trafficなど)は除外した.その後,論文タイトルとアブストラクトから筆者が該当するテーマをラベル付けした.その結果が表1である.
表1 KDDおよびSIGSPATIALで発表された論文の研究テーマ
交通量や渋滞予測の研究が最も多く,次いで訪問場所やルートの予測,移動軌跡(Trajectory)の類似度計算方法と続く.
交通量や渋滞予測の研究では例えば以下のような研究がある.
- Shirakami, Ryu, et al.: QTNet:Theory-based queue length prediction for urban traffic, Proc. 29th ACM SIGKDD Conf. on Knowledge Discovery and Data Mining, pp.4832-4841(2023)
- Wang, Mudan, et al.: Contagion process guided cross-scale spatio-temporal graph neural network for traffic congestion prediction, Proc. 31st ACM Int. Conf. on Advances in Geographic Information Systems, Article No.89, pp.1-11(2023)
COVID-19/Epidemicは感染症の流行予測の研究で,新型コロナの流行以降研究が盛んに行われている.Google Scholarで“human mobility”と検索すると検索結果は約64,200件であるが,COVID-19を検索キーワードに追加すると約17,300件となっており,人の移動とCOVID-19の関係についての研究が多いことがわかる(検索結果の件数は2024/1/12現在).
KDD 2021では,人の移動が感染拡大に与える影響を定量化し行政における意思決定支援に活用した研究がApplied Data ScienceトラックのBest Paperに選ばれた.
Privacyに関する研究も行われており,例えば下記のような研究がある.
最近では携帯電話の位置情報を活用した研究がよく行われているが,2008年時点で携帯電話の位置情報を活用した先駆的な研究があり,研究テーマの最後にご紹介したい.この論文はネットワーク科学で有名な Barabásiらの研究で,人の移動距離がべき乗則に従うことを明らかにした.
3.研究で使われているライブラリや実装
3・1 技術トピックとモデルの実装
人の移動は時空間的な情報であるため,時間的な特徴に着目する(時系列データとして扱う)のか,空間的な特徴に着目するのか,あるいは両方に着目するのかなどによって使われるモデルも異なってくる.
時系列データとして扱う場合はRecurrent Neural Network(RNN)やTransformerなどの系列データに対応したモデルが利用されることが多い.そのため,実装としても一般的なニューラルネットワークの研究で使われるPyTorchやTensorFlowでRNNやTransformerなどのモデルを実装する.
空間的な特徴に着目する場合は,移動をグラフ構造として表現しGraph Neural Networkが利用されることが多い.実装ではグラフ構造を扱うため,PyTorch Geometric(PyG)やDeep Graph Library(DGL)がよく利用される.また,グラフ構造を扱うためNetworkXを利用することもある.PyGとDGLともにNetworkXで作成したグラフ構造をそれぞれのライブラリで扱うデータ形式に変換する機能をもっている.
時空間の両方を扱う場合は,前述のモデルを組み合わせて使われることが多く,実装としても前述のライブラリを利用することが多い.
3・2 位置情報の扱いに有用なライブラリ
機械学習のモデルとしては前節に書いたようなライブラリが利用できるが,実装中にデータを確認するときは位置情報向けのライブラリを利用することが多いため,ここで紹介する.
位置情報の表現方法としてよく利用される形式は,以下のとおりである.
標準地域メッシュは日本の位置情報を扱う場合によく利用される.国や自治体の統計情報が標準地域メッシュで公開されており,そのようなデータとのひも付けを行う場合は標準地域メッシュを利用するのが便利である.標準地域メッシュと GeoHash,H3は階層的な構造をもっており,位置情報の粒度を変えることが容易である.緯度経度から標準地域メッシュに変換するPythonのライブラリとしては,python-geohashやjismeshなどがある.
GeoHashとH3は全世界の位置情報を扱える表現方法である.GeoHashは矩形で表現された位置情報を一つのハッシュで表現する方法で,H3は六角形で表現された領域を一つの値で表現する方法である.
またデータを可視化するときに有用なライブラリとしてFoliumがある.Foliumはleaflet.jsというJavaScriptで使用することのできる地図への可視化ライブラリをPythonから利用できるようにしたものである.数行のPythonコードを書くだけで可視化ができることが特徴である.
4.データセット
研究で利用される人の移動データとしては,オープンデータではタクシーやバイクシェアのデータ,チェックインデータなどがある.なお,本誌2021年7月号に掲載の私のブックマーク「都市空間の情報処理─データセットの世界動向」でも人々の移動データについてデータセットがまとめられているので,参照されたい.
研究で利用されるさまざまなデータセットを一つのライブラリでダウンロードできるようにした論文もある.
- Wang, Jingyuan, et al.: LibCity: An open library for traffic prediction, Proc. 29th Int. Conf. on Advances in Geographic Information Systems, pp.145-148(2021), GitHub
ここまでは個人の移動軌跡についてのデータセットを紹介したが,最後に統計情報として地域メッシュごとの人口統計データを紹介する.NTTドコモでは,携帯電話ネットワークの仕組みを使用してモバイル空間統計という人口統計データを作成している.モバイル空間統計では1時間前の人口分布が10分おきに,最小500mメッシュ単位で属性(性・年代)と居住地ごとにわかる.
5.まとめ
本稿では,人の移動に関する最新の研究動向やライブラリなど実装,データセットについて紹介した.人の移動は経済活動や感染症の流行などさまざまな社会活動と関連しており,多様な応用が考えられる研究テーマである.本稿がこの分野の研究を進めるうえで参考になれば幸いである.
謝辞
貴重な機会を与えていただいた本学会誌編集委員会に感謝申し上げます.