標準データ項目セットを用いた知的データベースによる診療根拠の動的生成に関する研究(総括研究報告書)

文献情報

文献番号
200100510A
報告書区分
総括
研究課題名
標準データ項目セットを用いた知的データベースによる診療根拠の動的生成に関する研究(総括研究報告書)
課題番号
-
研究年度
平成13(2001)年度
研究代表者(所属機関)
山本 隆一(大阪医科大学)
研究分担者(所属機関)
  • 大江和彦(東京大学)
  • 坂本憲広(九州大学)
  • 増田 剛(大阪医科大学)
研究区分
厚生科学研究費補助金 総合的プロジェクト研究分野 21世紀型医療開拓推進研究(EBM研究分野)
研究開始年度
平成13(2001)年度
研究終了予定年度
平成14(2002)年度
研究費
10,000,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本研究の目的は平成11年度の厚生省による「電子保存された診療情報交換のためのデータ項目セット」開発事業の成果を利用し、この項目セットに準拠して収集された診療データから動的に診療根拠を抽出する方法を研究開発することにある。証拠に基づく診療(EBM)が重要であることは論を待たないが、一般的なEBMのように文献的な証拠に基づく場合、インフルエンザに対する抗ウイルス剤の効果のような流行性で急性の疾患への対処や、薬品の副作用などの迅速な対応を必要とする場合などでは十分な効果が期待できないことがある。例えば今年のインフルエンザにアマンタジンが効果を示すかどうかといった場合、文献的な根拠を待つことができないために、診療現場からの経験が厳密な検証なく、また統計的な処理がほとんど行われずに流布する形で現場医療に活かされている状況にある。薬品の副作用も相当な例数の蓄積と回顧的な解析が必要であるが、副作用を疑う医療現場からの報告に依存しており、疑うことが難しい状況では調査そのものも遅れる可能性がある。そしてこれらの場合、現場の印象がトリガーになる。熟練した医療従事者の印象は実際には複雑な知識背景のもとに下される判断で、高く評価する必要があるが、客観性は不十分といわざるを得ない。平成11年度に開発されたデータ項目セットは電子化診療情報を共通の標識で整理することで、異なる医療機関の診療情報を統一的に扱うことを可能とするもので、これを活用することにより、広範囲から診療情報をリアルタイムに収集することが可能になる。一方で情報工学の分野では知的データベースやデータ・マイニングと呼ばれる手法の研究が活発に行われている。これは網羅的に集められたデータの集合から意味のある関係を自動的に抽出する手法であり、人の印象に頼らないデータ解析を行うことができる。着眼点を指定しなくても動的に特異な関係を抽出できるために人が気付き難い関係や、気付くのに時間がかかる関係を早期に抽出するのに極めて有用な方法と考えられる。もちろん従来の回顧的な方法にくらべて若干の精度低下は予想されるし、背景となるべき医学理論を類推することはできない。あくまでもヒントを与える方法と考えることができ、回顧的な研究方法を併用する必要がある場合もある。しかしこの場合もすくなくとも着眼点を得るまでの時間は大幅に短縮され、医療現場へのフィードバックもそれだけ有効になることが期待できる。
研究方法
初年度の今年度の研究はデータマイニングを用いた動的な診療根拠を生成するための基礎的な研究と、このような手法の有用性の検討および有用であることが予想されるユースケースの特定、問題解決のフレームワークの作成をおこなった。データマイニングの手法の検討と評価、データ項目セットをこの目的に使用するための評価と問題点の抽出、収集データの無名性の定量化とプライバシー保護指針の試作、プライバシー・センシティブな情報の分離を容易にするためのデータベース・アーキテクチャの検討と開発の4分野にわけて研究を進めた。データマイニングの手法としては昨年別研究で行った成果をもとに診療情報を動的に収集し、機械的な知識発見が有効な場面を検討し、ユースケースを特定し、フレームワークを作成した。データ項目セットは診療根拠の動的生成に必要になると思われる項目をあつめ、データ項目セットの項目で適用可能かどうか調査をおこなった。プライバシー保護に関して個人情報保護法案が審議中であることを考慮し、この法案に対応したプラ
イバシー保護ガイドラインを試作した。データベース・アーキテクチャはHL7 ver3 RIMとデータ項目セットを基礎にプライバシー・センシティブな項目を抽出し、それらを他の項目と独立して扱うことが可能なデータベース・アーキテクチャを検討した。
結果と考察
我々は相関ルール発見手法は知識すなわちルールを予測できない場合のデータマイニングの手法として有効であり、ルールの抽出が可能であることを示し、冗長なルールの排除などに一定の成果を上げてきた。本年度の研究では医療の現場で、診療情報を動的に収集し、機械的な知識発見が成功するとして、それが診療の遂行にとって有効である場面、すなわちユースケースを検討したところ、1.急性で流行性または集団発生をするような疾患と、2.低頻度で診療現場で気づきにくい、例えば低頻度の薬剤副作用の発見のような場合の2つに特定した。1に関してはEnd Userの関心は特定されており、収集した情報に対して動的に、相関ルール発見手法を適用し、冗長のルールを排除したのち、ルールをデータベース化し(ルールベースと呼ぶ)、ルールベースに対してEnd Userが対話的にアクセスすることで、有用なルールの早期の抽出が可能と考えた。2に対しては、ルールそのものが、低頻度であり、通常の相関ルール発見手法では検出が難しい。そこで、ルールの特徴を調べ、支持度の低いルールで一定のファクタが加わることによって、確信度が有意に変化するルールに着目する必要があることを示した。これらはフレームワークであり、今後実装の上検証を進める予定である。次年度はさらに論理的な淘汰を検討すると同時に、得られたルールを決定木などのデータマイニングまたは知識データベースの手法でスクリーニングすることで、新規性の高いルールを抽出することを目指すともに、作成したフレームワークをもとに実装モデルを作成し、検証を加える。また本研究の前提となる電子化された診療情報の収集で、項目の標準化やプライバシーの保護は必須である。項目の標準化は平成11年度に厚生省の補助によって策定された「電子化された診療情報交換のためのデータ項目セット」を基礎に、本研究の目的を達成するための問題点を抽出し、いくつかのコードセットを定める必要および、検査項目などの詳細化が必要であることが判明した。さらに診療根拠にとってもっとも重要な病名概念の整理を行い、体系化した。またプライバシー保護の概念が個人情報保護法の検討とともに、変遷しつつあり、本研究を含めて医療の分野で対応を検討しなければならない。そこで審議中の個人情報保護法案を基礎にプライバシー保護ガイドラインを試作し、匿名化および説明と同意が重要な概念であることを示し、どちらにも無名化指標が重要であることを示した。またプライバシー・センシティブな情報を安全に扱うためのデータベース・アーキテクチャの基本は、これらのデータの分離であり、分離することができれば管理や情報提供に際してプライバシーの保護が容易になる。問題は分離の基準であり、種々の利用場面に適応できる標準的なデータモデルが必要になる。今年度はHL7 ver 3 RIMとデータ項目セットをデータモデルの参照モデルとして採用し、データベース・アーキテクチャの基礎を設計することができた。今後はデータマイニングシステムへのデータ提供インターフェイスなども含めて検討を進めることとしている。最後に次年度の実験の基礎としてVPN環境を構築を試み、PC-UNIX上で安価にVPNサーバが構築できることを示した。
結論
データマイニングに関しては、今年度は、相関ルール発見手法を適用し、導出ルール数を抑制淘汰することで、大量の診療データからなんらかの相関ルールを導出できることを確認するとともに、このような手法が診療の根拠の生成にとって有用であるユースケースを検討し、急性で流行性の疾患と低頻度の薬剤副作用の発見のような低頻度の事象の検討の2つのユースケースで有効であることを示し、ユースケースごとにフレームワークを示した。二つのユースケースでフレームワークは異なるが、いずれも相関ルール発見手法を基本に、ルール
ベースを用いた後処理や相関ルール発見手法自体のモディファイで対応可能であることを示した。プライバシー保護に関しては従来の守秘を中心とする概念から、自己情報のコントロールを主体とする概念に変遷しつつあり、単純にセキュリティの問題として扱うことはできない。無名性の指標として最小特定人数を応用し、十分な匿名化を行うか、匿名性の程度を示して説明し同意を得ることが重要であることを示し、プライバシー保護ガイドラインを試作した。またデータ項目セットについては症状・所見コード(8項目)、診療問題コード(8項目)についての標準化作業が必要で、また、検体検査、放射線検査、生体検査、内視鏡検査、病理検査、細菌検査、超音波検査について、検査結果値の表記に関する標準化と検査結果実施記録項目セットの作成を行う必要があることを示してきたが、さらに診療根拠にとってもっとも重要な病名について概念を整理し、シソーラスを検討した。また患者基本情報を診療情報から分離した、データベースアーキテクチャが実現可能であることが示された。

公開日・更新日

公開日
-
更新日
-