dimensions 2、来月登場

dimensions 2

dimensions 2 コンビネーション・

酷暑の日々。世間はお盆-夏休みモードだが、当方は最後の追い込みで仕事。
来月リリース予定の闘病ブログ調査プラットフォーム「dimensions 2」の完成に取り組んでいる。

「dimensions 2」は、いわば私達のTOBYOプロジェクトの集大成のような成果物になるのだろうと考えている。ここまで来るまでに、いろいろ試行錯誤を重ねた。5万件、1000万ページの闘病ドキュメントを、どうわかりやすく社会に伝えられるかをめぐり、このおよそ5年間を費やしてきたのだが、ようやく結論らしきものが見えてきたと思えたのは、今年に入ってのことだった。

当初、拡張検索エンジン「X-Search」、トラッキング・ツール「Distiller」の二本立てでスタートしたのだが、率直に言ってそれだけで満足できるわけもなかった。そのある種の欠落感を充足するために、特に一昨年から様々な仮説設定と実験に取り組んできた。ようやく欠落感を埋めるものを探し当てたと思えるようになったのは、ごく最近のことである。

dimensions出発時点の2つのツールに、データ分析ライブラリー「Analysis」、そして患者意見抽出・集計ツール「OPINIONS」を加え、dimensionsは4つのツールから成る文字通り日本初の「闘病調査プラットフォーム」へと成長したと思う。そして単に「2が4になった」ということだけでなく、従来の「X-Search」、「Distiller」にも大幅な改良を施している。

日本初の闘病ブログ調査プラットフォーム。「患者のことは患者から直接聞く」ための、唯一のプラットフォームである。様々な医療関係者に使っていただきたい。

三宅 啓  INITIATIVE INC.

盛夏2015

石神井公園三宝寺池

季節の歯車は回り、気がつけばいつの間にかもう真夏だ。このブログも5月以来、随分ブランクを作ってしまった。6月、7月とdimensionsの新規コンテンツとなる患者意見抽出ツール「OPINIONS」開発に集中して取り組んでいた。なんとか今月中に開発を終え、来月リリースへ持って行きたい。

  • TOBYO収録闘病ブログが5万件を突破

まず、7月初めにTOBYO収録闘病ブログは5万件に達したことをご報告したい。とにかく、貴重な体験ドキュメントを公開していただいたすべての闘病者の皆さんに、感謝を申し上げねばならない。皆さんが労を惜しまず、貴重なご自分の闘病体験を記録し公開していただいたおかげで、TOBYOはそれらを収集し、後続の闘病者の皆さんにより利用しやすい形でご紹介することができた。あらためて、全ての闘病者の皆さんにお礼を申し上げたい。

さて、TOBYOプロジェクトはブログ5万件、約1000万ページの闘病ドキュメントを可視化するところまで来たが、今後も様々な形でこの闘病ビッグデータを便利に利用できるように、新しいコンテンツを開発していきたい。もちろんネット上の闘病ドキュメントは今後も継続して収集していく。TOBYOサイトのリニューアルにも、そろそろ着手していかねばならないだろう。

  • 患者意見抽出ツール「OPINIONS」の開発

冒頭触れたように、目下、9月リリースへ向け「OPINIONS」開発が佳境を迎えている。春先から、いくつかの開発上の難所をなんとか乗り越えてきた。振り返れば、一昨年初頭から、テキストマイニング研究に始まる一連の試行錯誤を繰り返してきたわけだが、「ネット上の患者ドキュメントをどうわかりやすい形で集計し出力するか」という一点を焦点として、あれこれ仮説出しと実験に明け暮れてきた。

続きを読む

患者ブログからの意見・評価情報抽出の研究

三つ組、手がかり語、実験システム概要

論文「闘病ブログに出現する(薬剤名,対象,効果)で表される薬剤服用情報の抽出」(北海道大学情報科学研究科,北嶋志保,他)をめぐって

先のエントリ「患者による医療評価」にも述べたが、目下、新規サービス「OPINIONS」の開発に取り組んでいる。これは大きく2つのパートからなっている。ひとつは闘病ブログから患者の薬剤・病院・治療など医療に対する意見・評価を抽出し、評価タイプや極性(ポジティブ、ネガティブ)によって分類して提供しようというもの。今ひとつは、患者の医療に対する意見・評価をアンケート設問形式で集計出力し、たとえば「薬剤レミケードについて『効いた』と答えた人が〇〇人、〇〇%。『効かなかった』と答えた人が〇〇人、〇〇%」というわかりやすいかたちで提供しようとするものだ。

この2つの機能からなる「OPINIONS」によって、闘病ブログに表現された患者の知識・体験を個々の「物語」としてではなく、ウェブに集積された「患者の集合知」として捉え、その全体の傾向をできるだけシンプルに抽出したいと考えている。たとえば、TOBYO収録の乳がん患者ブログはすでに4000件を越えているが、それらをひとつひとつ「物語」として読んでいくとすれば、それだけで多大な時間を費消することになるだろう。何年もかかるかもしれない。たしかに、そこには多くの興味ふかいエピソードが存在するだろうが、「患者の医療評価」という視点で全体の傾向を抽出することのほうが、おそらく社会、患者、医療業界にとって有益であると思われる。

「ウェブに集積された集合知」から意見や評価情報を取り出す試みは、ゼロ年代から10数年にわたり、多くの研究者によって続けられてきている。医療分野における患者の意見・評価抽出についてもさまざまなチャレンジがあるが、今春、日本知能情報ファジィ学会誌「知能と情報」に発表された論文「闘病ブログに出現する(薬剤名,対象,効果)で表される薬剤服用情報の抽出」(北海道大学情報科学研究科,北嶋志保,ジェプカ  ラファウ,荒木  健治)には、TOBYOのバーティカル検索エンジン「TOBYO事典」データを用いた薬剤服用情報の抽出実験が紹介されており、そこに示された新知見から、当方「OPINIONS」開発にも大きな示唆をいただいた。ここに感謝しておきたい。 続きを読む

患者による医療評価

dimensionsの新コンテンツ「OPINIONS」

現在、TOBYO収録の闘病サイトコレクションは4万9千件を越え、近いうちに5万件に到達するだろう。収録ページ数はおよそ9百万ページだが、これは収録サイト5万件に達した時点で、だいたい1千万ページになると推測される。

2008年にTOBYOをローンチした時点で、私達はネット上の闘病サイト集合全体を「闘病ユニバース」と名づけ、その規模を約3万サイトと想定していた。しかし、その後、様々なデータを突き合わせてみると、2008年時点では、闘病ユニバースの規模はまだ約2万サイト程度に過ぎなかったことが判明している。その後、闘病ユニバースは膨張してきたわけだが、現在、その規模は5万6千~6万サイトと推定される。そうすると現時点でTOBYOは、闘病ユニバースの少なくとも8割以上をカバーしているとみてよいだろう。TOBYOは、闘病ユニバースの拡大に歩調を合わせて成長してきたわけだ。

4月14日からバーティカル検索エンジン「TOBYO事典」の検索対象データを拡大した。これまでは2009年までの約300万ページが検索対象だったが、これを2013年5月までに収録したおよそ670万ページに拡大した。これはいずれ、リアルタイムでTOBYOクローラが取ってきた収録件数に合わせることになる。ユーザーには、できるだけ最新のデータを提供していかねばならないと考えている。 続きを読む

23andMe社が新薬開発へ進出

23andMe CEO and Founder Anne Wojcicki,Forbes

「製薬企業は消費者との直接の関係を持っていない。消費者はいつも被験者だった。彼ら消費者に参加してもらい、『あなたがこの研究に貢献し、あなたがこの研究を実現したのだ』と称揚することで、私達はこれまでと違うやり方でものごとを達成できるだろう。」 (23andMe社CEOアン・ウォイッキ氏,The Verge)

3月12日、米国23andMe社は新薬開発事業に進出することを発表した。23andMeといえば、かつてゼロ年代に台頭したHealth2.0ムーブメントから登場したスタートアップであり、Googleのグループ会社として、さらにはCEOのアン・ウォイッキ氏がGoogleファウンダーのセルゲイ・ブリン氏の妻であったことも手伝い、ひときわ大きな注目を浴びた企業だ。

99ドルで遺伝子解析キットを直接消費者に販売し、回収・解析の上、疾患罹患リスク予測や先祖推定などを提供するこのサービスは、はじめ順調に軌道に乗るかと思われたが、一昨年、米国FDAの解析キット販売停止勧告により、その前途は一挙に視界不良となった。(当ブログ「イノベーションと規制」参照)。「もう23andMeは終わりかもね」とさえ言われたが、今回の「転進」は、同社にとって起死回生の新戦略になる可能性がある。 続きを読む