設問の再生: Patient Document Research

福島のスキーリゾート「アルツ磐梯」に来ている。今日から開催されたHealth2.0福島に参加するためだ。夫婦同伴で来たが、当方はイベントを、妻はスキーを楽しもうという趣向である。幸い好天に恵まれ、紺碧の空のもと、素晴らしい眺望を楽しんでいる。ところで昨日から風邪で熱がある。ここのところ1ヶ月ばかり、休みなしで仕事を続けてきた疲れが出たのか。

さて、前回のエントリでも触れたように、いよいよネット上の患者ドキュメントの自然言語解析に本格的に取り組むことになった。最近、次世代エネルギー資源として、海底のメタンハイドレードが注目されているわけだが、ニュース解説などで「従来から、有望なエネルギー資源であると衆目の一致するところだったが、どうガスを抽出し、どう実用化するかが難問であった」と言われている。やっと五年くらいで実用化する目処がついたようだが、最近このニュースを目にするたびに、「あぁ、これはネット上の患者ドキュメントとまったく同じだなぁ」と思うのである。

ネット上に公開された患者ドキュメントは、TOBYOが可視化したものだけでも、4万サイト、500万ページ、30億ワードという分量に達している。繰り返すが、このように大量の医療体験が公開されたのは、史上始まって以来のことである。また、このデータが医療業界、行政、マーケティング、研究などさまざまの分野で非常に価値があることは、誰も異論を挟む者はいないだろう。しかし、メタンハイドレードと同じように、このデータからどう有用な情報を取り出して、どう実用化するか、という点が難問なのであった。 続きを読む