ブログをアンケート調査のように集計しました。(意見集計)

OPINIONS 意見集計

調査設問をフレーズに分解し集計する。

「この薬は効いた」という表現も、実は人によって様々な言い方があり、フレーズのバリエーションがあります。その数は数百、数千にものぼるでしょう。それらのフレーズパタンを技術的に吸収し、アンケート調査のような集計を、という発想で生まれたのが、OPINIONS「意見集計」です。

ページ単位ではなく人数単位で集計します。

これまでブログの集計はページ単位や話題件数が普通でした。それでは意味がつかみにくいので、人数単位で出力できるようにしました。「〇〇と答えた人は何人」と数値化するほうが、全体傾向はつかみやすくなります。

アンケート調査のような集計

患者さんの発言を集計して、わかりやすくアンケート調査のような集計形式で出力していきます。また設問リクエストにもお応えしていきます。

患者さんの意見を抽出し、ポジ・ネガ分類します。(意見分類)

OPINIONS意見分類

機械学習で患者さんの意見を抽出

「今日で3クール目の投薬が終わった」など、患者さんのブログ記事は、治療体験事実を記録するものが多いです。事実も重要ですが、患者さんが治療や薬剤をどう思い、何を考えたかを知りたいですね。そのためには意見抽出が必要です。膨大な数の記事を機械学習で意見抽出します。

意見をポジティブ、ネガティブに分類する

抽出した患者さんの意見を、ポジティブな意見とネガティブな意見に分類しました。まず意見全体のポジネガ比率を上部バーで表示しました。

次に、具体的な薬剤に対する患者さんの反応を、ポジ、ネガに分けて意見文表示しています。添付してあるURLで、もっと詳しい情報を元ページで確認できます。

機械学習で分類していますが、現在ベータ版運用しています。これも今後、精度を上げていきます。

患者ブログをギュッと絞り出し、エキスだけを取り出しました。

Analysis DATA list

テキストマイニング処理したデータを様々に出力できます

Analysisではテクストマイニング処理済みデータを様々な形式で出力し、データライブラリーとしてダウンロードしていただけます。

患者ブログのエキスをKWIC出力しました

患者ブログをひとつひとつ読んでいては一生かかります。治療、薬剤など大切なところだけを絞り出し、KWIC(Key Word In Context)形式で見やすく出力し、疾患別、薬剤別にDATA BOOKにまとめました。

DATA BOOKは、患者体験に関わる文だけをKWIC形式でまとめました。

Analysis DATA BOOK

患者ブログを時系列でトラッキングする環境がそろいました。

Distiller

薬剤などキーワードをトラッキングします

患者さんの治療過程に時間軸を通し、記事を時系列に並べ、どのように薬剤など要チェックなキーワードが出現するかをトラッキングします。

その記事がどの治療過程のものかを表示します

「イベント」列では検査、入院、手術など、治療過程を示すワードの有無をチェックし、表示します。その記事がどの治療過程の話かを素早く確認できます。

各記事はダウンロードできます

各記事で気になったところがあれば、CSVファイルでページごとダウンロードできます。また記事ごとにブックマークをつけ、あとで詳しく検討することもできます。

各記事を日付で絞り込めます

3つのサブキーワードを設定

キーワード以外のサブキーワードで、競合品などを同時にトラッキングできます。