「最近ある医薬品業界のマーケティング担当者が、次のように指摘した。あらゆる患者の経験が、今やデータの川となって流れ出しているが、これを賢く蓄積すれば、患者の健康状態に関する詳細なポートレートを描き出すことができ、さらに他の患者のデータの川と合流させることにより、疾患の全体像と患者集団全体に関する知識の深い貯水池としてまとめあげることができる。」(「ビジョンから決断へ ファーマ2020」, PwCジャパン)
花も終わり、ひところに比べると、新宿御苑を訪れる人並みも落ち着いてきた。今日の昼、御苑を歩いていると何組かの幼稚園児が遠足に来ていたが、あちこちに設営され始めたテントが目をひいた。毎年恒例のことだが、首相主催の観桜会が週末に開催されるらしい。
4月も半ば過ぎとなったが、今月はずっとテキストマイニング運用準備に取り組んできた。主にデータベースや形態素解析エンジンのチューニングをやったわけだが、結果として解析プロセスに要する時間は、従来の半分以下に短縮することができた。これで、闘病ブログ4万サイト、500万ページ、30億ワードのドキュメント・データすべてを、テキストマイニング処理する準備が整った。
これからリリースするサービスは、PDR(Patient Document Research)とPDS(Patient Document Sampler)の二つだが、一応、今の時点では、患者リスニングツール「dimensions」のカスタム・サービスという位置づけを想定している。特にPDRだが、dimensionsが固有名詞と名詞を抽出・集計し、個々の患者体験に出現する薬品名や検査・治療法名などをトラッキングするツールであるのに対し、新たに形容詞・形容動詞と動詞・サ変名詞を抽出することになる。
私たちの患者体験共有サービス=TOBYOは、可視化サイト数4万件に達し、ネット上に闘病者が自発的に生成した闘病ユニバースの大部分をカバーしつつある。ネット上に公開された闘病体験ドキュメントなら、そのほとんどをTOBYOで探し出すことができるだろう。Googleなど検索エンジンでは、ペットの闘病サイトや偽装サイトなどのノイズを排除できないが、闘病サイトだけを厳選したTOBYOなら、参考になるサイトへ簡単にアクセスできる。そして、「どこに、どんな闘病サイトがあるか」だけでなく、これからdimensions、PDR、PDSが実現しようとしているのは、「どこに、どんな患者のことばがあるか」、要するに患者が発した一つひとつの「ことば」まで明確にすることである。
「患者のことば」は、その位置と、頻度と、関係を計量化することによって、統計的に理解することが可能となる。これまで闘病ドキュメントは、「闘病記」すなわち「物語」という古い観点からしか見られてこなかった。この「TOBYO開発ブログ」をその初期からお読みいただけるとわかると思うが、私はずっとこの「闘病記、物語」という枠組みから、闘病ユニバースに公開されたドキュメント群を解き放ちたいと考えてきた。すなわち「物語」というかたちで完結した一人の患者ストーリーとしてではなく、無数の患者が語り、書き出したことば全体を、事実と無意識が交錯する「患者ディスクール」(discours)としてとらえたいと思ったのである。やはり、これはWeb2.0初期にたびたび言及された「知識集合体、集合知」から影響されたところが大きかったと思う。
※注:ディスクール(フランス語:discours)は、言語・文化・社会を論じる際の専門用語としては、「書かれたこと」や「言われたこと」といった、言語で表現された内容の総体を意味する概念である。英語では “discourse” が相当し、日本語では意訳して言説(げんせつ)の語を当てることが多い。出典:Wikipedia
そしていよいよ、この「患者ディスクール」から新たな知見を取り出す時がやってきた。以前のエントリでも触れたが、できれば通常のアンケート調査の設問と回答のような皆が慣れ親しんだ形式で、簡単でわかりやすく、しかもこれまで思いもしなかったような知見を取り出せたらと考えている。そのためには、ある種の分析フレームがどうしても必要なので、今年になって少しづつ設計してきたが先月完成した。その要点は次のようなものである。
患者の医療体験を「事実、行動、感情」の三つの側面で見る。体験事実、患者行動過程、患者感情エンジン。すなわち患者ディスクールは、体験した事実に関わる、患者の行動と感情のことばの集合体である。
「患者行動過程」は、「動詞、サ変名詞」を中心にワード抽出をおこない、他の品詞との関係を明らかにする。患者の医療行動は「調べる、選ぶ、治す」のように、主として「動詞、サ変名詞」によって書き出されている。これに対し、常に患者行動に影響を与えるファクターとして、感情を出力する「患者感情エンジン」というものを想定した。「患者感情エンジン」は「情緒、好悪、満足」の三つのカテゴリーからなる。この三つの歯車がかみ合い、患者行動過程に対する感情が出力される。出力された個々のことばは「良い、好き、こわい、悲しい、うれしい」のように、形容詞と形容動詞によって表出されることが多い。合理的な過程に対する、非合理的な心の揺らぎを想定しなければ、患者ディスクールを解き明かすことはできないだろう。
つまり「名詞」で「事実」を可視化することだけでなく、これからは「動詞」と「形容詞」から、患者の行動と感情を明らかにすることになる。患者が体験した事実、患者がとった行動、患者がもった感情。このトライアングルによって、無数の患者によって表出されたディスクールを解析していく。
三宅 啓 INITIATIVE INC.
とても画期的な取り組みに思えます。期待しています。