患者による医療評価

dimensionsの新コンテンツ「OPINIONS」

現在、TOBYO収録の闘病サイトコレクションは4万9千件を越え、近いうちに5万件に到達するだろう。収録ページ数はおよそ9百万ページだが、これは収録サイト5万件に達した時点で、だいたい1千万ページになると推測される。

2008年にTOBYOをローンチした時点で、私達はネット上の闘病サイト集合全体を「闘病ユニバース」と名づけ、その規模を約3万サイトと想定していた。しかし、その後、様々なデータを突き合わせてみると、2008年時点では、闘病ユニバースの規模はまだ約2万サイト程度に過ぎなかったことが判明している。その後、闘病ユニバースは膨張してきたわけだが、現在、その規模は5万6千~6万サイトと推定される。そうすると現時点でTOBYOは、闘病ユニバースの少なくとも8割以上をカバーしているとみてよいだろう。TOBYOは、闘病ユニバースの拡大に歩調を合わせて成長してきたわけだ。

4月14日からバーティカル検索エンジン「TOBYO事典」の検索対象データを拡大した。これまでは2009年までの約300万ページが検索対象だったが、これを2013年5月までに収録したおよそ670万ページに拡大した。これはいずれ、リアルタイムでTOBYOクローラが取ってきた収録件数に合わせることになる。ユーザーには、できるだけ最新のデータを提供していかねばならないと考えている。 続きを読む

7年目の春

医療コンシェルジュ?

石神井公園では梅が咲きはじめ春はもうすぐ。早いもので年が明けたと思ったらもう2月も後半。ブログを書くのをサボっているうちに、時はどんどん流れていく。のみならず今月は、TOBYOが誕生してもう7年目である。7歳といえば、人間ならさしずめ小学校一年生というところか。

年末のエントリで、dimensionsを中心にTOBYOプロジェクトの振り返りをしておいたので、あらためてここで過去に目を向けることもないだろう。それよりもこれからのTOBYOプロジェクトを考えてみたい。

昨年は「がん闘病CHART」をリリースしたが、今後も新規コンテンツにチャレンジをしていくことになる。また現状インターフェースも、さらに使いやすいものにしていく必要があると考えている。ユーザーがほしい情報がもっと簡単に正確に抽出できるような、そんな仕組みを模索していかねばならない。 続きを読む

TOBYOプロジェクトとdimensionsの軌跡

「アナリシス」の疾患データ・コーナー

今年も今日が最後となった。TOBYOプロジェクトの一年と、dimensionsをめぐるこれまでの軌跡を振り返ってみよう。

今年は、まず年初からdimensionsの新規コンテンツとなる「アナリシス」の開発に着手した。dimensionsは2010年から開発を開始し、翌2011年に、拡張検索エンジン「X-サーチ」と患者ブログ・トラッキング・ツール「ディスティラー」からなる患者体験リスニング・システムとしてデビューした。当時の位置づけは、ソーシャル・リスニング・システムということであり、これは当時マーケティング・リサーチ界隈で台頭しつつあった「ソーシャル・リスニング」という新しいコンセプトを当てはめたものであった。

これら開発の背景を整理すると、TOBYOプロジェクトの立ち上げにさかのぼるが、そもそもゼロ年代半ば頃から、ネット上に大量に公開され始めた患者体験ドキュメントをどのように見るかといういう問題に行き着く。私達はそれら患者体験ドキュメントを、とりあえずまず「闘病記」という言葉で呼んだわけだが、同時に、これら大量のドキュメント群を「闘病記」という狭い概念で捉えてしまうことに違和感を持っていた。

続きを読む

TOBYO dimensionsの新バージョン

クリックで拡大。Analysisの「DATA」出力。

TOBYOプロジェクトのプロフェッショナル向け患者体験可視化システム「TOBYO dimensions」が、新しく再デビューします。

TOBYO dimensions」は、患者体験トラッキング・ツール「ディスティラー」と拡張検索エンジン「X-サーチ」からなる患者体験可視化システムとして、2011年からサービスを開始してきました。このプロジェクト自体が、まったくの未踏領域だったこともあり、これまで試行錯誤の連続でした。

振り返ると、これまでのdimensionsは、当初から検索エンジン技術に基礎を置いたシステムであったわけですが、昨年から、自然言語処理技術を新たにシステムのコアに位置づけようと、様々な試行を繰り返してきました。その途上で、袋小路に迷いこむような経験もしたわけですが、そのあたりは、このブログの昨年エントリを読んでもらえば、なんとなくご想像していただけることでしょう。

ちょうど一年前には「患者体験を典型的な文に収斂する」という目標を立てて、研究開発を進めていました。しかし、ウェブ上に公開された患者ドキュメントの性質をあらためて考えてみると、それらに表出された患者体験と感情は多様であり、何らかの「結論」へ収斂するようなものではないということに、改めて気づかされました。

続きを読む

病院「イメージマップ」登場 =病院を患者の言葉で可視化する=

癌研有明病院に関する患者の言葉を可視化する。クリックすると拡大。

この夏から、TOBYOでは患者の話題を可視化する「TOBYOがんCHART」を公開しています。これは「病院、薬、検査・治療、症状、生活」の各ジャンルで、がん患者の言葉に基づいて作成したランキング・チャートです。実際にがん患者がネット上で話題にしているトピックを、一切加工せず、多いもの順にそのまま提供しています。各トピックの検索結果画面では、各種フィルターによって、いっそう詳しい情報を探索することができます。

そして今回、新たなコンテンツ「病院イメージマップ」を追加しました。これは「全がんTOP20病院」についてのがん患者の言葉を、計量化し統計処理した上で図解したものです。言葉を計量化し統計処理することを「テキストマイニング」と呼んでいますが、この手法によって大量のテキストデータの傾向を手際よく把握することができます。また、言葉をノード、言葉と言葉を結ぶ辺をエッジと捉えると、テキストデータをノードとエッジからなるネットワーク・グラフで表すことができます。

日本医科大学病院に対する患者の言葉。クリックすると拡大。

今回公開した「病院イメージマップ」は、それぞれの病院に対する患者の言葉とその関係を数量化し、ネットワーク・グラフで可視化したものです。言葉は出現度数ごとに大きさを変えたノードで表現され、言葉と言葉の関係は曲線でエッジとして表現されています。曲線で結ばれた言葉は、結びつきの強い言葉であり、その強さはエッジの太さと明度で表現されています。また、ノードは同じ性質のものを統計的にグループ化し色をつけています。これらによって、その病院について実際に患者が語っている言葉を、ひと目で確認することができます。

まだネットワーク・グラフ出力はテスト段階であり、様々な出力を試しています。今後、精度を上げて一層見やすく、わかりやすいものにしていきたいと考えています。TOBYOプロジェクトではこのイメージマップのような「患者の言葉の可視化」など「患者言語の研究」に取り組んでいます。4万6千サイト、800万ページ、60億語という膨大な「闘病の言葉の宇宙」から、患者、家族、社会に役立つ情報を抽出し届けていきます。ご期待ください。