Curationによるデータ構造化

DCC

昨日、イスラエルのFirst Life Researchに触れたが、さっそく今日、二~三の方からお問い合わせを頂戴した。たしかにソーシャル・メディア・マーケティングという視点で医療を眺めるなら、TOBYOやFirst Lifeのような事業が出現するのは自然の流れと言えよう。ソーシャルメディアと医療といえば、本来なら、ソーシャル・グラフのパワーを活用した患者SNS事業などがメインに位置してもよいはずなのだが、残念ながら撤退したサービスもあり、その難易度は高いことがわかってきた。

それに対し、TOBYOやFirst Lifeは「すでにネット上にある公開データ」に焦点を合わせている。そして患者体験として公開されたUGCの構造化をめざしている。TOBYOは「すべての闘病体験を可視化し検索可能にする」とのミッションによって、患者体験UGCの構造化を宣言しているわけだ。実際にはブログなどUGCサイトにメタデータを付し、整理分類し、リスト化を進めている。First Lifeもほぼ同様の考え方をしている。だが、両者が違っているのは、TOBYOがCuration(自動生成データ等に対する人手による検証と修正)という方法を取っているのに対し、First Lifeはセマンティック技術で機械化しようとしている点だろう。「Medical Ontology」と彼らが呼んでいるのは、患者UGCを意味的に機械判別する仕組みのことと推測される。

だが、これは容易なことではない。たとえばある闘病体験ブログがあるとして、その疾患名を特定するような単純なことが、実は機械には非常に難しいのだ。たとえばブログタイトルに「前立腺がん闘病記」と明記されてあればよいが、カテゴリー名やエントリ・タイトル、果ては本文まで参照しなければ、そのブログがいったい何の疾患についてのものかわからないケースが多い。こうなると機械ではお手上げである。

ブロゴスフィア自体が混沌とした状態にあり、ここから特定のデータを抽出するためにはかつていわれた「Structured Bloging」のような構造化のための共通仕様が必要だ。しかし、その最有力候補と目されたMicroformatsの普及は予想以上に遅れている。また、セマンティック・ウェブなど、機械が意味解釈をおこなうようなビジョンはずいぶん以前から語られてきたが、その実現性ははっきりしない。セマンティック・サーチなど「次世代検索エンジン」を華々しく標榜するものもあったが、いつのまにやら姿を消してしまった。

ところでCurationという言葉だが、たとえばOrganizedWisdom が最近この言葉を使い始めている。彼らにとってこの言葉は「カオスから秩序を創造する」ためのキイワードであるようだ。また、英国の有名なDCC(Digital Curation Centre)(上図)も思い出される。DCCの場合、科学・学術研究データのCurationに主眼が置かれているが、このような社会的なデータ共有化プロジェクトは闘病体験データを対象にしてもおかしくない。また、そう言えばAmazon Mechanical Turkなども、Curationを市場化したユニークなサービスといえるだろう。

三宅 啓  INITIATIVE INC.


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>