患者生成コンテンツ解析の新展開

「ハーセプチンの開始」自己組織化マップ

連日、素晴らしい秋晴れの日が続く。ブログを怠けているうちに、そして、そろそろあの酷暑の記憶を忘れ始めたころに、いつのまにか季節の歯車は大きく回転したようだ。毎日、老母を車椅子で散歩に連れ出し、移ろいゆく石神井公園の景観を一緒に眺める日々を送っている。少し前のエントリでも触れたが、精神的、身体的に老化著しい母を、今月から自宅介護することになった。ベンチャーと介護の二足わらじだが、さて、うまくいくものか?

ところで先月末だったか、ある大学から「患者の語り」について問い合わせがあった。TOBYO収録の患者生成ドキュメントを研究したいということだが、「患者の語り」という言葉にひっかかり苦笑した。ご存知のように当方では「患者の語り」という言葉を使わない。比喩として「語り」と言うことはあるかもしれないが、TOBYOプロジェクトの対象はあくまでも患者の「書き言葉(エクリチュール)」であり「語り」ではない。そればかりか、本来「書き言葉」と「語り」はかなり異なるものだ。だから両者の差異を、ほんとうはあいまいにしてはいけないのだと思う。

簡単にいえば、「語り」はパフォーマンスの性格が強く、行為遂行的であり、その首尾は「(パフォーマンスとして)成功したかどうか」あるいは「適切か、不適切か」で評価される。一方「書き言葉」は、どちらかというと事実確認的(コンスタティブ)性格が強く、その首尾は、記述された事実の真偽によって評価される。(参考:J.L.オースティン「言語と行為」)。

続きを読む

薬剤の違いを可視化する

ハーセプチン、タキソール、リュープリンの患者パーセプション(クリックすると拡大)

患者がウェブ上に公開している膨大な量の闘病体験ドキュメントをどのようにわかりやすく可視化するか。前回エントリではワードクラウドを使って、患者の言葉をグラフィカルに可視化してみた。同じワードクラウドを使って、今回は薬剤ごとに患者が述べた言葉から、それぞれの薬剤の「違い」を可視化してみよう。乳がん治療に使われるハーセプチン、タキソール、リュープリンの三剤について、まず結びつきの強い言葉を患者ドキュメントからテキストマイニングによって抽出し、三剤との関連性の強度を数値化する。そして、三剤に関する患者の言葉および関連性データからなるリストを作成し、それらの相互関係にもとづいてワードクラウドを出力する。

おおよそ、そんな手順にしたがって作成されたのが上図である。これを見れば、ハーセプチン、タキソール、リュープリンが、それを体験した患者の心のなかで、どんなふうにその「違い」をイメージされているか、患者の言葉を手がかりとして視覚的に捉えることが出来る。三剤について患者が述べた言葉を比較分析し、ハーセプチンに関して言われることが多かった特徴的な言葉を緑、タキソールの特徴的な言葉をオレンジ、リュープリンに特徴的な言葉を紫で表示した。今回抽出したのは名詞、サ変名詞、形容動詞、ナイ形容詞、副詞可能、動詞、形容詞、副詞の約300語で、患者パーセプションの大まかな傾向をつかむために、どちらかと言えばやや広範囲な抽出となった。三剤の「違い」をもっと明確にするために、今後、品詞選択を絞り込むことが必要だろう。

次に、乳がん治療薬三剤の「共通点」だが、これは患者パーセプションにおいてどのように捉えられているだろうか。次の図は、三剤に共通して患者が述べた言葉を100語抽出しワードクラウド化したものだ。これを見ると、とにかく「副作用」が患者の一番の関心事であることが一目でわかる。痛いほどわかる。主な言葉を拾ってみると「副作用。チェック。今日。言う。病院」などが目に飛び込んでくるが、それらからストーリーを想像するまでもなく、患者の三剤に共通する関心事が極めて直截に伝わってくる。

ハーセプチン、タキソール、リュープリンに対する患者の共通認識


今後、薬剤のみならず治療法、そして医療機関の比較などもワードクラウド化したい。患者パーセプションを直接可視化する方法として、今後さまざまなワードクラウド出力に取り組んでいくつもりだ。

三宅 啓  INITIATIVE INC.

新たにPerspectiveが加わり、dimensions2.0へバージョンアップ

dimesions 2.0

ここ二回連続で「クチコミ病院検索」の問題を扱ったが、こっちのブログで書き出したものに補筆し、改めてYahoo!Newsのほうへニュース投稿した。結局、「ネガティブ・コメントを削除するクチコミ検索」という現象は、医療パターナリズムに端を発するものである。そこを批判しなければ、似たようなことは形を変えて何度も繰り返されるだろう。しかし、このエントリは当方の予想を超える関心を惹起したようだ。

さて、患者の闘病体験をトラッキングし自由自在に検索する「TOBYO dimensions」だが、近々にバージョンアップする予定である。今年になってから、患者闘病ドキュメントをテキストマイニング出力するPDR、PAI、PDSなどサービスを開発してきたが、あれこれとっ散らかってしまったので、一度まとめなおす必要があると思っていた。いろいろ検討した結果、やはりdimensionsに統合するのが一番すっきりするということになった。新たにPerspectiveというサービスをdimensionsに追加するが、これはPDR、PAI、PDSなどをまとめたものである。テキストマイニングによるデータ出力をメインとして、さまざまな患者視点アウトカム・レポートを提供しようと考えている。

Perspectiveとは「考え方、見方」や「遠近法」という意味を持つ言葉だが、私たちが目指しているのは、まず「医療に対する患者の考え方、見方を提供する」ことであり、同時に「患者視点で医療を遠近法で透視し、患者の目に見えたままの医療を描出する」ことである。また近年、米国FDAなどが中心となって提唱している、新しい患者中心医療評価尺度である「患者報告アウトカム」(PRO)の考え方も念頭に置いている。 続きを読む

ことばの宇宙

UNIVERSE

前回エントリ「患者による医療評価のイノベーション」に、たくさんのアクセスをいただき驚いている。この分野、つまりウェブ上の患者ドキュメント分析の分野に、予想以上の人々が関心を抱いていることを認識させられた。

ことばの宇宙

これまで私たちは、ウェブ上に自然発生的に生成された闘病ドキュメント・サイト群によるネットワークを「闘病ユニバース」(闘病の宇宙)と呼んできた。このブログでもいろいろな角度から、この自生的なゆるいネットワークを分析してきたのだが、この「闘病の宇宙」が何によって出来上がっているかというと、それは「ことば」によってである。だから「闘病の宇宙」とは「ことばの宇宙」なのである。

現在、闘病ユニバースの広がりはおよそ5万サイトと推定される。そのうち4万サイトをTOBYOでは可視化しているが、この可視化領域に存在することばの総量はおよそ30億ワードである。この30億ワードから、どのように価値のある知識・情報を抽出するかを、私たちはTOBYOプロジェクトの初期段階から考えてきた。その第一段階では、私たちは、この「ことばの宇宙」を名詞とくに固有名詞の集合体と見ていたと思う。病名、病院名、薬剤名、治療法名、医療機器名など、医療分野の名詞・固有名詞に着目し、それらを闘病ユニバースからいかに効率的に抽出するか。これを最初に目指したのである。

続きを読む