新たにPerspectiveが加わり、dimensions2.0へバージョンアップ

dimesions 2.0

ここ二回連続で「クチコミ病院検索」の問題を扱ったが、こっちのブログで書き出したものに補筆し、改めてYahoo!Newsのほうへニュース投稿した。結局、「ネガティブ・コメントを削除するクチコミ検索」という現象は、医療パターナリズムに端を発するものである。そこを批判しなければ、似たようなことは形を変えて何度も繰り返されるだろう。しかし、このエントリは当方の予想を超える関心を惹起したようだ。

さて、患者の闘病体験をトラッキングし自由自在に検索する「TOBYO dimensions」だが、近々にバージョンアップする予定である。今年になってから、患者闘病ドキュメントをテキストマイニング出力するPDR、PAI、PDSなどサービスを開発してきたが、あれこれとっ散らかってしまったので、一度まとめなおす必要があると思っていた。いろいろ検討した結果、やはりdimensionsに統合するのが一番すっきりするということになった。新たにPerspectiveというサービスをdimensionsに追加するが、これはPDR、PAI、PDSなどをまとめたものである。テキストマイニングによるデータ出力をメインとして、さまざまな患者視点アウトカム・レポートを提供しようと考えている。

Perspectiveとは「考え方、見方」や「遠近法」という意味を持つ言葉だが、私たちが目指しているのは、まず「医療に対する患者の考え方、見方を提供する」ことであり、同時に「患者視点で医療を遠近法で透視し、患者の目に見えたままの医療を描出する」ことである。また近年、米国FDAなどが中心となって提唱している、新しい患者中心医療評価尺度である「患者報告アウトカム」(PRO)の考え方も念頭に置いている。 続きを読む

医療クチコミ情報に対する中立性

とりあえず業務連絡から。闘病サイトだけを検索するバーティカル検索エンジン「TOBYO事典」だが、長らくデータ更新なしでテスト版を公開してきた。ここのところTOBYO自体の機能更新に手が回らなかったためであるが、いつまでもこのまま放置していてはいけないと考え、このたびデータを更新し、また検索エンジン自体も最新のものを実装することにした。来週ぐらいに、新しいTOBYO事典を公開する予定。

5月末現在、TOBYOが収録しているデータ量は、すでに600万ページを超える規模に達している。とりあえず、このうちの300万ページを「TOBYO事典」の検索対象とする。これは従来公開していた「テスト版」の約2倍のデータ量となる。検索エンジンのほうは、プロジェクト初期に採用したエンジンが、日々増加するデータ量に対応できなくなってきていたので、今回、思い切って最新の検索エンジンに切り替えた。これでTOBYOプロジェクトとしては、三代目の検索エンジンとなる。

当初から「世界初の闘病専門検索エンジン」と銘打ってきたのだが、現在に至るも「ワン&オンリー」の存在である。貴重な闘病体験ドキュメントだけを自由自在に検索できる、世界でただ一つの検索エンジンである。病院名、薬品名、治療法などをキイワードにして、存分に闘病ユニバースを探索していただきたい。業務でご利用の方には、dimensionsの「X-Search」をお使いいただきたい。TOBYO収録データをすべて検索できる。

検索エンジンは、私たちTOBYOプロジェクトの「こだわり」であり「要」と言えるだろう。私たちのミッションは「ネット上のすべての闘病体験を可視化し、検索可能にする」ことである。このミッションを実現するものは検索エンジンである。患者が記録した事実、患者がつぶやいた生の言葉、患者が露わにした感情。私たちは可能な限り、それらすべてを可視化し、検索エンジンを使って、誰でもその情報を利用できるようにしたいと考えている。 続きを読む

ことばの宇宙

UNIVERSE

前回エントリ「患者による医療評価のイノベーション」に、たくさんのアクセスをいただき驚いている。この分野、つまりウェブ上の患者ドキュメント分析の分野に、予想以上の人々が関心を抱いていることを認識させられた。

ことばの宇宙

これまで私たちは、ウェブ上に自然発生的に生成された闘病ドキュメント・サイト群によるネットワークを「闘病ユニバース」(闘病の宇宙)と呼んできた。このブログでもいろいろな角度から、この自生的なゆるいネットワークを分析してきたのだが、この「闘病の宇宙」が何によって出来上がっているかというと、それは「ことば」によってである。だから「闘病の宇宙」とは「ことばの宇宙」なのである。

現在、闘病ユニバースの広がりはおよそ5万サイトと推定される。そのうち4万サイトをTOBYOでは可視化しているが、この可視化領域に存在することばの総量はおよそ30億ワードである。この30億ワードから、どのように価値のある知識・情報を抽出するかを、私たちはTOBYOプロジェクトの初期段階から考えてきた。その第一段階では、私たちは、この「ことばの宇宙」を名詞とくに固有名詞の集合体と見ていたと思う。病名、病院名、薬剤名、治療法名、医療機器名など、医療分野の名詞・固有名詞に着目し、それらを闘病ユニバースからいかに効率的に抽出するか。これを最初に目指したのである。

続きを読む

PDR:患者ディスクールの分析視点

PDR

「最近ある医薬品業界のマーケティング担当者が、次のように指摘した。あらゆる患者の経験が、今やデータの川となって流れ出しているが、これを賢く蓄積すれば、患者の健康状態に関する詳細なポートレートを描き出すことができ、さらに他の患者のデータの川と合流させることにより、疾患の全体像と患者集団全体に関する知識の深い貯水池としてまとめあげることができる。」(「ビジョンから決断へ ファーマ2020」, PwCジャパン)

花も終わり、ひところに比べると、新宿御苑を訪れる人並みも落ち着いてきた。今日の昼、御苑を歩いていると何組かの幼稚園児が遠足に来ていたが、あちこちに設営され始めたテントが目をひいた。毎年恒例のことだが、首相主催の観桜会が週末に開催されるらしい。

4月も半ば過ぎとなったが、今月はずっとテキストマイニング運用準備に取り組んできた。主にデータベースや形態素解析エンジンのチューニングをやったわけだが、結果として解析プロセスに要する時間は、従来の半分以下に短縮することができた。これで、闘病ブログ4万サイト、500万ページ、30億ワードのドキュメント・データすべてを、テキストマイニング処理する準備が整った。

これからリリースするサービスは、PDR(Patient Document Research)とPDS(Patient Document Sampler)の二つだが、一応、今の時点では、患者リスニングツール「dimensions」のカスタム・サービスという位置づけを想定している。特にPDRだが、dimensionsが固有名詞と名詞を抽出・集計し、個々の患者体験に出現する薬品名や検査・治療法名などをトラッキングするツールであるのに対し、新たに形容詞・形容動詞と動詞・サ変名詞を抽出することになる。

続きを読む

患者コーパスとドキュメント・リサーチ

このところ厳しい寒さが続いていたが、今日は春を思わせる暖かい一日であった。新宿御苑の梅も開花し始めた。明日から三月である。

患者コーパス

昨日、TOBYO収録サイト数は4万件に到達した。TOBYOは闘病ユニバースの成長と歩調を合わせて成長してきている。貴重な体験ドキュメントを公開してくれた、すべての闘病者の方々に感謝の気持ちでいっぱいである。このように多数の闘病体験が、まとまったドキュメントとして公開されているのはおそらく日本語ウェブ圏だけだろう。

TOBYOは4万サイト、500万ページの闘病ドキュメント・データベースであるが、前回エントリでも述べたように、今後は蓄積された大量のデータからいかに「患者の声にもとづく医療評価」を切り出すかが新たなテーマとなってくる。そのための新たなミッションを「患者言語研究」と呼んでみた。もちろん、従来から私たちがテーマとしていた「患者が体験した事実の可視化」は引き続き追求しなければならないが、患者が医療を語る場合に、どのような言葉を使用しているかを広くリサーチしなければならないと考えている。つまりTOBYOは闘病体験ドキュメント・データベースであると同時に、「患者コーパス」という側面も併せ持っていることを、最近、強く意識し始めている。(注:コーパス(corpus:Wikipedia) 続きを読む