Vol.30.No.1(2015/01)クラウドソーシングとヒューマンコンピュテーション(Crowdsourcing and Human Computation)


私のブックマーク

クラウドソーシングとヒューマンコンピュテーション(Crowdsourcing and Human Computation)

馬場雪乃(国立情報学研究所/JST, ERATO, 河原林巨大グラフプロジェクト)

はじめに

不特定多数の人に仕事を発注する仕組み「クラウドソーシング」の登場は、大量の人的資源の獲得を容易にした。
コンピュータ科学の諸分野では、クラウドソーシングをより成熟した基盤にするために、品質管理やメカニズムデザイン、プラットフォーム設計など多様な観点で研究が進められている。また、クラウドソーシングの登場を受けて人工知能分野では、人間と計算機の協調問題解決を目指す「ヒューマンコンピュテーション」に関する研究が促進された。

本稿では、以下5つの観点で情報源を紹介する:(1) クラウドソーシング・ヒューマンコンピュテーションと、関連する研究の概略、(2) クラウドソーシング・ヒューマンコンピュテーションの最新研究動向、(3) クラウドソーシング・ヒューマンコンピュテーションの活用事例、(4) 研究でのクラウドソーシング活用、(5) クラウドソーシング・ヒューマンコンピュテーションの研究資源

クラウドソーシング・ヒューマンコンピュテーションと、関連する研究の概略

The Rise of Crowdsourcing
「クラウドソーシング」という言葉が最初に登場した米国Wired誌の記事。
クラウドソーシング―みんなのパワーが世界を動かす
上記記事の執筆者Jeff Howeによる、クラウドソーシングの概念と事例紹介の書籍。
Enrique Estellés-Arolas and Fernando González-Ladrón-de-Guevara: Towards an integrated crowdsourcing definition, Journal of Information Science, Vol. 38, No. 2 (2012)
クラウドソーシングの定義を調査した論文。
Aniket Kittur, Jeffrey V. Nickerson, Michael Bernstein, Elizabeth Gerber, Aaron Shaw, John Zimmerman, Matt Lease, and John Horton: The future of crowd works, in Proceedings of the 2013 Conference on Computer Supported Cooperative Work (CSCW) (2013)
クラウドソーシング研究のサーベイ論文。
Luis von Ahn: Human Computation, Ph.D. Thesis, Carnegie Mellon University (2005)
ヒューマンコンピュテーションの生みの親であるLuis von Ahnの博士論文。
Edith Law and Luis von Ahn: Human Computation, Morgan & Claypool Publishers (2011)
ヒューマンコンピュテーションの研究動向をまとめた書籍。
Luis von Ahn and Edith Law: Human Computation: Core Research Questions and State of the Art (2011)
上記書籍と同様の内容のチュートリアル資料。
Pietro Michelucci: Handbook of human computation, Springer (2013)
ヒューマンコンピュテーションに関する研究トピック紹介の書籍。
Crowdsourcing & Human Computation
ペンシルベニア大学のChris Callison-Burchによる、クラウドソーシングとヒューマンコンピュテーションの講義資料。

人工知能 Vol. 29 No. 1 (2014年1月)では「ヒューマンコンピュテーションとクラウドソーシング」特集が組まれ、8篇の解説記事が掲載されている。

鹿島 久嗣, 馬場 雪乃: ヒューマンコンピュテーション概説
森嶋 厚行: ヒューマンコンピュテーションのためのプラットフォームとソフトウェア開発
櫻井 祐子, 松原 繁夫: ヒューマンコンピュテーションのためのメカニズムデザイン
小山 聡: ヒューマンコンピュテーションの品質管理
水山 元: 予測市場とその周辺
高木 啓伸, 井床 利生, 斉藤 新, 小林 正朋: クラウドアクセシビリティ ─クラウドソーシングによる障害者支援─
後藤 真孝, 吉井 和佳, 中野 倫靖, 緒方 淳: クラウドソーシングに基づくメディア処理サービス ─能動的音楽鑑賞サービスSongle と音声情報検索サービスPodCastle ─
芦川 将之, 池田 朋男: クラウドソーシングを用いたアノテーション

人工知能学会誌 Vol. 27 No. 4 (2012年7月)には以下の解説記事が掲載されている。

鹿島 久嗣, 梶野 洸: クラウドソーシングと機械学習

クラウドソーシング・ヒューマンコンピュテーションの最新研究動向

ブログ
Follow the Crowd
クラウドソーシングの最新研究紹介ブログ。複数の研究者により運営されている。
A Computer Scientist in a Business School
クラウドソーシングの品質管理やプラットフォーム調査に関して多数の論文を発表している、ニューヨーク大学のPanos Ipeirotisによるブログ。
国際会議

クラウドソーシングとヒューマンコンピュテーションに関する論文が発表される主要国際会議は以下である。

HCOMP
ヒューマンコンピュテーションとクラウドソーシングに関する国際会議。ワークショップとして4回開催された後、2013年よりAAAI主催の国際会議となった。
AAAI, IJCAI
人工知能に関する国際会議。ヒューマンコンピュテーションや、クラウドソーシングの品質管理についての論文が例年採択されている。
CHI
ヒューマンコンピュータインタラクションに関する国際会議。クラウドソーシングを利用したアプリケーションが多数発表されている。
UIST
ユーザインターフェースに関する国際会議。CHIと同様に、VizWizSoylentなど、クラウドソーシングを利用したアプリケーションが多数発表されている。
CSCW
Computer-Supported Cooperative WorkとSocial Computingに関する国際会議。”Being a Turker“など、クラウドソーシングの調査論文が多数発表されている。
SIGMOD
データベースに関する国際会議。”CrowdDB: answering queries with crowdsourcing“など、ヒューマンコンピュテーションによるデータベース操作を扱った論文が多数発表されている。
WWW
ウェブに関する国際会議。例年、クラウドソーシングのセッションが設けられ、品質管理や報酬設定に関する論文が発表されている。
ワークショップ

様々な国際会議で、クラウドソーシング・ヒューマンコンピュテーションを題材にしたワークショップが開催されている。そのうち、2回以上開催されているものを紹介する。

Workshop on Crowdsourcing for Multimedia (CrowdMM)
マルティメディア研究におけるクラウドソーシング・ヒューマンコンピュテーション活用についてのワークショップ。ACM Multimediaの併設で、2012年より毎年開催されている。
Workshop on Multimodal Crowd Sensing (CrowdSens)
クラウドソーシングを利用して実世界の情報を獲得する「クラウドセンシング」についてのワークショップ。2012年にCIKM、2014年にKDDの併設で開催されている。

他に、機械学習分野の国際会議ICMLとNIPSでは、近年はクラウドソーシング・ヒューマンコンピュテーションに関連したワークショップが毎年併設されている。特に、最近3年間に開催されたものを紹介する。

ICML’12 Workshop on Machine Learning in Human Computation & Crowdsourcing
ICML’13 Workshop on Machine Learning Meets Crowdsourcing
ICML’14 Workshop on Crowdsourcing and Human Computing
NIPS’12 Workshop on Human Computation for Science and Computational Sustainability
NIPS’13 Workshop on Crowdsourcing: Theory, Algorithms and Applications
NIPS’14 Workshop on Crowdsourcing and Machine Learning

国内では人工知能学会全国大会において、オーガナイズドセッションが2013年と2014年に開催されている。

オーガナイズドセッション「ヒューマンコンピュテーションとクラウドソーシング」
その他
Crowdsourcing News, Events, and Resources
テキサス大学オースティン校のMatt Leaseが管理する、クラウドソーシング研究関連情報のまとめ。
クラウドソーシング研究会
国内クラウドソーシング研究者のコミュニティ。

クラウドソーシング・ヒューマンコンピュテーションの活用事例

クラウドソーシング・ヒューマンコンピュテーションを活用したプロジェクト等を紹介する。

reCAPTCHA
「人間かボットか」を判定する仕組みCAPTCHAを、人手による書籍電子化に活用するプロジェクト。
Foldit
タンパク質の構造予測問題をゲームにすることで人間に解決させる取り組み。
Jim Grayの捜索
海上で行方不明になった研究者Jim Grayの捜索プロジェクト。「海域の衛星画像からJim Grayのクルーザーを見つけるタスク」がAmazon Mechanical Turkで発注された。
DARPA Network Challenge
米国内の10地点に設置された赤い風船を見つけ出すコンペティション。ソーシャルネットワーク活用やチームビルディングの手法を試すことを目的に開催された。
Fast Adaptable Next-Generation Ground Vehicle (FANG) Mobility/Drivetrain Challenge
DARPA主催の、クラウドソーシングを利用した軍用車両設計のコンペティション。
Netflix Prize
オンラインDVDレンタルサービスを提供するNetflixが、推薦アルゴリズム改善のために開催したコンペティション。
Duolingo
言語教育プラットフォーム。一定のスキルに到達した学習者に対して、翻訳作業を発注する。

研究でのクラウドソーシング活用

汎用的なプラットフォーム(日本国外)
Amazon Mechanical Turk
2005年にサービス開始された、米国Amazon社運営のクラウドソーシングの老舗プラットフォーム。画像分類や音声の書き起こし等の小規模な仕事に特化している。発注者になるには、請求先として米国内住所が設定されているクレジットカード等が必要である(2014年11月現在)。
CrowdFlower
Amazon Mechanical Turkと同種のプラットフォーム。発注時には、PayPal経由で支払いが可能である(2014年11月現在)。
oDesk
デザイン、ソフトウェア開発、文書執筆等の比較的規模が大きい仕事を対象にしたプラットフォーム。
汎用的なプラットフォーム(日本国内)
ランサーズ
2008年にサービス開始された、日本における老舗クラウドソーシングプラットフォーム。「タスク方式」と呼ばれる小規模な仕事と、「プロジェクト方式」「コンペ方式」と呼ばれる比較的規模が大きい仕事、どちらも発注可能である。
クラウドワークス
ランサーズと同様に、様々な種類の仕事に対応したプラットフォーム。
Yahoo!クラウドソーシング
小規模な仕事に特化したプラットフォーム。
Crowd4U
公共・学術利用を目的としたクラウドソーシングプラットフォーム。ボランティアに対して仕事を発注することができる。
特定の目的を持ったプラットフォーム

デザイン、ソフトウェア開発、翻訳など、特定の種類の仕事に特化したクラウドソーシングプラットフォームも存在する。

99designs
ロゴやウェブページ、名刺等のデザインに特化したプラットフォーム。
TopCoder
プログラミングコンテストの開催で有名なTopCoderは、ソフトウェア開発のクラウドソーシングプラットフォームも提供している。
uTest
ソフトウェアのテストに特化したプラットフォーム。
Conyac
文章翻訳に特化したプラットフォーム。

データ解析に特化したクラウドソーシングプラットフォームも登場している。

Kaggle
予測モデル構築のプラットフォーム。参加者を競わせ、優れたモデルの獲得を目指す。
CrowdSolving, Deep Analytics
Kaggleと同様のプラットフォームの国内版。
ビッグデータ大学
データ解析者の教育を目的とするプラットフォーム。
クラウドソーシング利用のノウハウ・ツール
Guidelines for Academic Requesters
複数の研究者によって策定された、学術目的でのクラウドソーシング利用のガイドライン。
Best Practices Guide for Requesters
Amazon Mechanical Turkの発注者を対象にした文書だが、その他のプラットフォームにも適用可能なコツが紹介されている。
TurKit
Amazon Mechanical TurkのAPIをJava, JavaScriptで呼び出すためのライブラリ。

クラウドソーシング・ヒューマンコンピュテーションの研究資源

主に、複数ワーカの回答を統合することで品質を保証する「回答統合手法」の研究のために、データセットや共通タスクが整備されている。

ツール
SQUARE
複数の回答統合手法が実装されており、ベースラインとして用いることができる。
データセット
回答統合手法用のデータセット
前述のSQUAREで用いられているデータセットの一覧。
Amazon Mechanical Turkで収集された言語や音声のデータセット
NAACL’10併設のワークショップCreating Speech and Language Data With Amazon’s Mechanical Turkにおいて収集されたデータセット。
共通タスク
CrowdScale
HCOMP’13で実施された、回答統合に関する共通タスク。
MediaEval Crowdsourcing Task
クラウドソーシングで獲得した、マルチメディア関連コンテンツに対するアノテーションの統合を目指す共通タスク。2013年は、Flickrに投稿された写真へのアノテーション、2014年はコメントへのアノテーションが対象とされた。
TREC Crowdsourcing Track
情報検索分野で実施された共通タスク。文書とトピックの適合度のアノテーションをクラウドソーシングで精度良く収集する方法を競う。

おわりに

本稿では、クラウドソーシング・ヒューマンコンピュテーションに関する情報源を5つの観点に沿って紹介した。本研究分野拡大の一助となれば幸いである。

謝辞

本稿の執筆にあたり、クラウドソーシング研究会の皆様からご助言を頂きました。心より感謝申し上げます。