この夏から、TOBYOでは患者の話題を可視化する「TOBYOがんCHART」を公開しています。これは「病院、薬、検査・治療、症状、生活」の各ジャンルで、がん患者の言葉に基づいて作成したランキング・チャートです。実際にがん患者がネット上で話題にしているトピックを、一切加工せず、多いもの順にそのまま提供しています。各トピックの検索結果画面では、各種フィルターによって、いっそう詳しい情報を探索することができます。
そして今回、新たなコンテンツ「病院イメージマップ」を追加しました。これは「全がんTOP20病院」についてのがん患者の言葉を、計量化し統計処理した上で図解したものです。言葉を計量化し統計処理することを「テキストマイニング」と呼んでいますが、この手法によって大量のテキストデータの傾向を手際よく把握することができます。また、言葉をノード、言葉と言葉を結ぶ辺をエッジと捉えると、テキストデータをノードとエッジからなるネットワーク・グラフで表すことができます。
今回公開した「病院イメージマップ」は、それぞれの病院に対する患者の言葉とその関係を数量化し、ネットワーク・グラフで可視化したものです。言葉は出現度数ごとに大きさを変えたノードで表現され、言葉と言葉の関係は曲線でエッジとして表現されています。曲線で結ばれた言葉は、結びつきの強い言葉であり、その強さはエッジの太さと明度で表現されています。また、ノードは同じ性質のものを統計的にグループ化し色をつけています。これらによって、その病院について実際に患者が語っている言葉を、ひと目で確認することができます。
まだネットワーク・グラフ出力はテスト段階であり、様々な出力を試しています。今後、精度を上げて一層見やすく、わかりやすいものにしていきたいと考えています。TOBYOプロジェクトではこのイメージマップのような「患者の言葉の可視化」など「患者言語の研究」に取り組んでいます。4万6千サイト、800万ページ、60億語という膨大な「闘病の言葉の宇宙」から、患者、家族、社会に役立つ情報を抽出し届けていきます。ご期待ください。