TOBYOプロジェクトとdimensionsの軌跡

「アナリシス」の疾患データ・コーナー

今年も今日が最後となった。TOBYOプロジェクトの一年と、dimensionsをめぐるこれまでの軌跡を振り返ってみよう。

今年は、まず年初からdimensionsの新規コンテンツとなる「アナリシス」の開発に着手した。dimensionsは2010年から開発を開始し、翌2011年に、拡張検索エンジン「X-サーチ」と患者ブログ・トラッキング・ツール「ディスティラー」からなる患者体験リスニング・システムとしてデビューした。当時の位置づけは、ソーシャル・リスニング・システムということであり、これは当時マーケティング・リサーチ界隈で台頭しつつあった「ソーシャル・リスニング」という新しいコンセプトを当てはめたものであった。

これら開発の背景を整理すると、TOBYOプロジェクトの立ち上げにさかのぼるが、そもそもゼロ年代半ば頃から、ネット上に大量に公開され始めた患者体験ドキュメントをどのように見るかといういう問題に行き着く。私達はそれら患者体験ドキュメントを、とりあえずまず「闘病記」という言葉で呼んだわけだが、同時に、これら大量のドキュメント群を「闘病記」という狭い概念で捉えてしまうことに違和感を持っていた。

続きを読む

TOBYO dimensionsの新バージョン

クリックで拡大。Analysisの「DATA」出力。

TOBYOプロジェクトのプロフェッショナル向け患者体験可視化システム「TOBYO dimensions」が、新しく再デビューします。

TOBYO dimensions」は、患者体験トラッキング・ツール「ディスティラー」と拡張検索エンジン「X-サーチ」からなる患者体験可視化システムとして、2011年からサービスを開始してきました。このプロジェクト自体が、まったくの未踏領域だったこともあり、これまで試行錯誤の連続でした。

振り返ると、これまでのdimensionsは、当初から検索エンジン技術に基礎を置いたシステムであったわけですが、昨年から、自然言語処理技術を新たにシステムのコアに位置づけようと、様々な試行を繰り返してきました。その途上で、袋小路に迷いこむような経験もしたわけですが、そのあたりは、このブログの昨年エントリを読んでもらえば、なんとなくご想像していただけることでしょう。

ちょうど一年前には「患者体験を典型的な文に収斂する」という目標を立てて、研究開発を進めていました。しかし、ウェブ上に公開された患者ドキュメントの性質をあらためて考えてみると、それらに表出された患者体験と感情は多様であり、何らかの「結論」へ収斂するようなものではないということに、改めて気づかされました。

続きを読む

ブログ統計:TOBYOがんチャート、Analysis

TOBYOがんチャート

今年もまた炎暑の夏が来た。石神井公園では例年に比べ、蝉の数が少ないような気もする。今月はTOBYOの新規コンテツ「TOBYOがんチャート」開発に取り組んでいた。また、9月からリリースするプロフェッショナル向け闘病ブログ統計「Analysis」の準備も進めている。この二つを開発する上で、闘病ブログのスキャン技術の精緻化が必要となったが、これは時間をかけ経験を蓄積し、今後も改善を積み上げていくほかない。

「TOBYOがんチャート」は7月の早い時期に公開すべく開発を進めてきたが、予想以上に様々な問題が出てきて、計画は大巾に遅れてしまった。それでもここ2~3日中には公開できそうだ。まだアルファ版であり、今後、少しづつ改良を加えていく。また、「患者が話題にしていることTOP20」ランキングを医療機関、薬剤。検査・治療の3ジャンルで公開するが、どうも「TOP20」では食い足りない気もする。今後、TOP30とかTOP50へと拡大することも検討したい。

さて、このようなクチコミ・ランキングを提供するのは、これまで患者の声を定量的に可視化する試みが少なすぎたと思えたからである。患者がネットで公開する闘病ブログなどドキュメントは、これまで「闘病記のネット版」とみなされてきた。だから、どうしてもそれらの一本一本をストーリーとして順次的に読むという接触態度が一般的であり、公開された膨大な患者体験の集積を数量化し、その全体を統計的に解析するという方法が開発されてこなかった。

つまり、闘病体験のそれぞれを「物語」として分離固定化し、それら集積が全体として何を言わんとしているかに関心を払ってこなかった。 もちろん、そもそも闘病ブログというものが非構造的で不揃いな質的データであるという事情もそこにはあった。

私達も「非構造化データにある程度秩序を与える」ぐらいのことは当初から考えていたのであるが、全面的に質的データを統計的に扱うことには躊躇があったことも否定出来ない。 しかし、昨年春頃には「質問票のないアンケート調査結果」として闘病ブログをとらえ、ブログ記述から逆に「質問」を再現するような方法で、数量的にデータを捉えようというアイデアが生まれた。ここから試行錯誤を繰り返し、紆余曲折を経て、結局、「ブログ統計」というシンプルな落とし所へと、私達の問題意識は収斂してきたわけである。

そして、9月リリース予定の「Analysis」にはシンプルに「ブログ統計」というフレーズを付すことになった。私達が現在めざすところは、患者ブログ全体を数量的に解析した結果を社会へ配信することである。このことによって、個々のストーリーではなく、全体として患者ブログがどんなことを主張しているかを統計的に可視化したい。

まずは「ランキング」というプリミティブな形式で、「患者が話題にしているコト」をわかりやすく提供したい。「TOBYOがんチャート」と「Analysis」は、当初、まったく別のプロジェクトとして想定されていたのだが、結局、「ブログ統計」というコンセプトの二つの表現形態であり、根っこで通底していることが徐々に明らかになってきた。

というわけで「TOBYOがんチャート」。最初はアルファ版から出発するが、徐々に完成度を上げ充実させていきたい。乞うご期待。

三宅 啓  INITIATIVE INC

闘病ポータルから闘病コーパスへ

石神井公園の森のオフィス。

石神井公園の新緑が、日に日に鮮やかさを増している。池面に映る緑陰は色を深め、その上を身軽にトンボがホバリングしている。それを狙って、上空から急速滑空してくるのは燕。初夏の風景はまぶしすぎる。

天気の良い日には、よく外へ出て、石神井公園の緑陰のテーブルで仕事をする。これを「森のオフィス」と呼んでいる。風に鳴る葉音や、小鳥のさえずりを聞きながら仕事に没頭し、時を過ごすのがなにより気に入っている。都心からサバーバンへ来てみると、やっとここに、自分のワークスタイルを見つけたような気がする。

さて、年初から開発を進めてきたdimensionsの新サービス「Analysis」が、ようやく今月完成した。これまでdimensionsはプロフェッショナル向け患者リスニング・サービスとして、拡張検索エンジン「X-Search」、トラッキング・ツール「Distiller」の二つで構成されていた。今回、これに新たに「Analysis」が加わることになるが、これによってdimensionsは、かなり大きくその性格を変えることになるだろう。 続きを読む

「生、病、死」の考察

キューブラー・ロス「死ぬ瞬間」

先週孫が生まれた。出産予定日は知らされていたものの、いざ出生の事実に面と向かってみると、そこにはある種「予想外の幸運に出くわした」みたいな感じがあった。無論、「歳を食ったなぁ」という感懐もある。そして、昨年末の母の死と合わせて考えると、この短期間に近しい人間の生と死の両端を体験することになったわけだ。

「人間の生と死」と言ったが、今ひとつのファクターとして「病」があるだろう。私達がTOBYOプロジェクトで採集している闘病ドキュメントとは、この「生、病、死」の記録に他ならない。その中でもプロジェクトでは「病」に焦点をあて、数百万ページのドキュメントから「病」に関する記述を抽出・集計・分析することを目指してきた。だが本来、「病」とは「生、死」との三点セットの相互関連として論じられるべきであり、それだけを単独であつかうことは不自然であるかもしれない。

また、この三点セットは往々にして「生、病」が前面に出され、「死」は後方へ退けられる傾向がある。特に「闘病」という言葉を使った場合、そこから強く喚起されるのは「生と病」である。「闘病」という言葉が、多分に積極的な行為を表すからだろう。対して「死」が積極的に焦点化されることはない。どうやら私達に共有された無意識には、「生、病」をポジティブに捉えたいという一種の強迫観念があり、逆に「死」を議論の余地のないネガティブ・ファクターとして無視したいという暗黙裡の合意があるような気がする。 続きを読む