薬剤の違いを可視化する

ハーセプチン、タキソール、リュープリンの患者パーセプション(クリックすると拡大)

患者がウェブ上に公開している膨大な量の闘病体験ドキュメントをどのようにわかりやすく可視化するか。前回エントリではワードクラウドを使って、患者の言葉をグラフィカルに可視化してみた。同じワードクラウドを使って、今回は薬剤ごとに患者が述べた言葉から、それぞれの薬剤の「違い」を可視化してみよう。乳がん治療に使われるハーセプチン、タキソール、リュープリンの三剤について、まず結びつきの強い言葉を患者ドキュメントからテキストマイニングによって抽出し、三剤との関連性の強度を数値化する。そして、三剤に関する患者の言葉および関連性データからなるリストを作成し、それらの相互関係にもとづいてワードクラウドを出力する。

おおよそ、そんな手順にしたがって作成されたのが上図である。これを見れば、ハーセプチン、タキソール、リュープリンが、それを体験した患者の心のなかで、どんなふうにその「違い」をイメージされているか、患者の言葉を手がかりとして視覚的に捉えることが出来る。三剤について患者が述べた言葉を比較分析し、ハーセプチンに関して言われることが多かった特徴的な言葉を緑、タキソールの特徴的な言葉をオレンジ、リュープリンに特徴的な言葉を紫で表示した。今回抽出したのは名詞、サ変名詞、形容動詞、ナイ形容詞、副詞可能、動詞、形容詞、副詞の約300語で、患者パーセプションの大まかな傾向をつかむために、どちらかと言えばやや広範囲な抽出となった。三剤の「違い」をもっと明確にするために、今後、品詞選択を絞り込むことが必要だろう。

次に、乳がん治療薬三剤の「共通点」だが、これは患者パーセプションにおいてどのように捉えられているだろうか。次の図は、三剤に共通して患者が述べた言葉を100語抽出しワードクラウド化したものだ。これを見ると、とにかく「副作用」が患者の一番の関心事であることが一目でわかる。痛いほどわかる。主な言葉を拾ってみると「副作用。チェック。今日。言う。病院」などが目に飛び込んでくるが、それらからストーリーを想像するまでもなく、患者の三剤に共通する関心事が極めて直截に伝わってくる。

ハーセプチン、タキソール、リュープリンに対する患者の共通認識


今後、薬剤のみならず治療法、そして医療機関の比較などもワードクラウド化したい。患者パーセプションを直接可視化する方法として、今後さまざまなワードクラウド出力に取り組んでいくつもりだ。

三宅 啓  INITIATIVE INC.

ワードクラウドで患者の言葉を可視化する

ハーセプチン体験者約1000人が語っている言葉


(図をクリックすると大きく表示)
ネット上に公開された膨大な患者の言葉をわかりやすく要約する方法を、あれこれ試している。一目で見て、パッと全体の傾向がつかめるようなものがよい。その一つがワードクラウドである。

かつてWeb2.0時代に盛んに用いられた「タグクラウド」だが、その後、単にタグを表示するものから、テキストマイニングの結果を表示する「ワードクラウド」へとその役割は変わってきている。これはテキストデータをマイニングし、言葉の出現度数に応じてサイズを変えて言葉を表示しようという、まことにシンプルな発想にもとづいている。近年の有名な事例としては、オバマ大統領の就任演説をワードクラウド化し、初回就任演説と第二回就任演説の言葉を比較するものがあった。

演説にせよ闘病ドキュメントにせよ、本来、中身を把握するためにはそれらをはじめからシーケンシャルに「読む」ことが必要となる。それらを読み進めるうちに、様々な「意味」や「ニュアンス」あるいは「雰囲気」などが出現し、あるまとまったメッセージやイメージが理解されていく。このように「書かれた言葉」は「読む」という一種の生産活動によって、メッセージやイメージを生成するのである。だが、数万人の数百万ページにおよぶ数十億語を読むということになると、人の短い一生を費やしても読みきる事は困難になる。 続きを読む

闘病ドキュメント解析へのチャレンジは続く

動詞系語でハーセプチン関連語をマッピング

いよいよ炎暑が来たかと思うと、涼しい日が続いたり、はたまた「戻り梅雨」だそうで、東北など滂沱たる強雨に襲われたり。今年の夏は、はっきりしないが、当方、毎日スイカを食べて元気に過ごしている。それでも最近、87歳になる母が、日を追って精神的身体的に弱ってきているのが気になる。老化は如何ともしがたいのだが、介護のことをこれまで以上に思案し始めている。当方のワークスタイルを含めて、これからどう働き、どう過ごしていくかを考える時期に来ているようだ。果たして「親を介護しながらベンチャー」みたいなことが、うまくできるものだろうか。

結局、闘病であれ介護であれ、家族が本人を支えていくことが基本になるのだろうが、その実態はどうなのか。患者視点による医療アウトカムの公開をめざす「Perspective」では、赤裸々にこれらの実態を記録した闘病ドキュメントの分析によって、闘病や介護における関係者の役割を可視化しようと考えている。

今回、dimensionsのデータベースから、乳がんの分子標的剤「ハーセプチン」が記載されたドキュメントデータだけを抜き出し、その服用実態分析をおこなってみた。これは患者1045人による、8968ページ、語数998万ワードからなるデータである。これをテキストマイニングして、「プロダクト・マップ、コミュニケーション・マップ、ディシジョン・マップ、サティスファクション・マップ」などアウトカム・マップを出力する予定だ。なかでもコミュニケーション・マップとディシジョン・マップは、患者が医療者や家族など関係者とどのようなコミュニケーションをしているか、あるいはどのような医療意思決定をしているかを可視化するものだけに、重要なポイントだと考えている。 続きを読む

闘病ドキュメントはアウトカムデータである

石神井公園、夏

石神井公園、夏

今朝、新宿御苑の蝉が鳴いた。今年はじめて聞く蝉だ。いきなり切って捨てるように梅雨が終わり、また夏がめぐってきた。季節の変り目のせいもあるのか、ここ数日、痛風で自宅蟄居。やっと回復して見上げる夏空が眩しい。

先月から、PRO(Patient-Reported Outcomes)のことを引き続き思案してきた。調べてみると、すでに2001年ごろから、このPROという言葉は米国で使われていたようだ。不覚にも、この間ずっと患者体験ドキュメントについてこのブログで検討しながら、当方、今日までこんな言葉があるとは思いもつかなかったのである。自分の狭量ぶりというものを、思い知らされた次第である。

だが、「アウトカム」という言葉には、何か懐かしい響きが聞き取れる。医療を事業テーマに決めた時分、まず医療評価の基礎から勉強をはじめたのだが、最初に注意を惹いた言葉がこの「アウトカム」だった。無論、「ストラクチャー、プロセス、アウトカム」というドナベディアン・モデルから教えられたのだが、すでにJCAHOやHCAHPSが稼働し、社会にアウトカム・データを公開していた米国とは違い、日本ではようやく医療機能評価機構による「ストラクチャー、プロセス」評価が開始されたばかりあった。それでもアウトカムは、最も患者が求める情報でありながら、日本では公開される気配はまるでなかった。だから自然、「医療アウトカムをどのように評価し、どのように公開するか」ということが、初期の私たちの大きな関心事であり事業テーマになったのだ。 続きを読む

新たにPerspectiveが加わり、dimensions2.0へバージョンアップ

dimesions 2.0

ここ二回連続で「クチコミ病院検索」の問題を扱ったが、こっちのブログで書き出したものに補筆し、改めてYahoo!Newsのほうへニュース投稿した。結局、「ネガティブ・コメントを削除するクチコミ検索」という現象は、医療パターナリズムに端を発するものである。そこを批判しなければ、似たようなことは形を変えて何度も繰り返されるだろう。しかし、このエントリは当方の予想を超える関心を惹起したようだ。

さて、患者の闘病体験をトラッキングし自由自在に検索する「TOBYO dimensions」だが、近々にバージョンアップする予定である。今年になってから、患者闘病ドキュメントをテキストマイニング出力するPDR、PAI、PDSなどサービスを開発してきたが、あれこれとっ散らかってしまったので、一度まとめなおす必要があると思っていた。いろいろ検討した結果、やはりdimensionsに統合するのが一番すっきりするということになった。新たにPerspectiveというサービスをdimensionsに追加するが、これはPDR、PAI、PDSなどをまとめたものである。テキストマイニングによるデータ出力をメインとして、さまざまな患者視点アウトカム・レポートを提供しようと考えている。

Perspectiveとは「考え方、見方」や「遠近法」という意味を持つ言葉だが、私たちが目指しているのは、まず「医療に対する患者の考え方、見方を提供する」ことであり、同時に「患者視点で医療を遠近法で透視し、患者の目に見えたままの医療を描出する」ことである。また近年、米国FDAなどが中心となって提唱している、新しい患者中心医療評価尺度である「患者報告アウトカム」(PRO)の考え方も念頭に置いている。 続きを読む