診療記録記載用語の標準化と構造化に関する研究

文献情報

文献番号
199900908A
報告書区分
総括
研究課題名
診療記録記載用語の標準化と構造化に関する研究
課題番号
-
研究年度
平成11(1999)年度
研究代表者(所属機関)
里村 洋一(千葉大学医学部附属病院)
研究分担者(所属機関)
  • 木村 通男(浜松医科大学付属病院)
  • 廣瀬 康行(琉球大学医学部附属病院)
研究区分
厚生科学研究費補助金 健康安全確保総合研究分野 医療技術評価総合研究事業
研究開始年度
平成11(1999)年度
研究終了予定年度
-
研究費
5,500,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
研究要旨 : 電子化した診療記録を医療機関関係者間で共有するためのデータの標準化を目標として用語の構造化と標準化を実現しようとするのがこの研究の目標である。診療記録に用いられる用語集に構造を与え、コンピュータによって記録を作成するに当たって、効率よくかつ統一性のあるデータが作成できるよう、インテリジェンスのある辞書はどうあるべきか、またその構築の具体的な方法ににはどのような条件が必要かなどを検討した。対象を、疾病・症状・診察所見・検査所見から手術・処置に広げて、用語の収集と構造化を試みた。開発されている厚生省の標準医療用語辞書、日本医学会の医学用語集より、基本語を抽出し、これに領域や、用法上の属性を与えた。また、SNOMEDから英語の基本語を抽出し、これに日本語を与えることで、基本語の範囲拡大を試みた。用語辞書編集のツールとして、類似語検索システムと用例検索システムを作成した。
情報の共有の前提として、データの標準化や通信手法の規格化、さらにそれに伴う危険を回避するための安全が重要である。中でも、データの標準化は最も基本的な要素であって、かつ最も困難な課題である。 申請者らは、長年、医療情報システムの開発と普及に当たっており、早くからこの問題に挑戦してきた。既に、病名(診断名)については、「ICD10対応標準病名集」の形で、その研究成果を応用した。
病名以外の医療用語、たとえば医療行為(手術や処置)や病理診断、検査所見などについても、その構造や用語法について標準化を進めるとともに利用者に使いやすい用語処理の方法を提供する必要がある。
本研究課題は、用語の標準化に必要な要素の抽出と用語の選択、これら用語の相互関係の構造化に挑戦するとともに、用語集編集のツールを開発することである。この成果によって、電子化診療録に記載されるデータの一貫性と統一性を得ることが期待でき、診療情報の電子化を促進する。
研究方法
本研究では、標準的な医学用語集として開発されたり、用いられている用語集を用いて、これらを統合的に利用するための共通的構造とそれぞれの要素の持つべき属性を検討した。そのために、次の4段階を踏んだ。1)内外の用語集から、対象とした領域の用語を収集し、次いで、2)これら用語の階層構造を定義して構造化する。さらに、3)これらの用語から基本となる概念を抽出し基本語集を作成するとともに、4)これを元の用語に回帰させる手法を検討した。
結果と考察
研究結果 基本語の抽出:既に抽出された日本語の基本語については、研究者らがこの数年来開発してきた11000余りの病名基本語がある、これには、病名表現の主幹部のほかに、部位、生理機能、病理形態学的変化、病態の進行に関する表現なども含まれている。この研究では、これに加えて、処置・手術の用語集から、処置や手術に関する表現の主幹部抽出した。また、SNOMEDを分析し、出現頻度の高い単語を選び、これを基本語抽出の一方法とし、日本語訳を与えて基本語に加えることを試みた。
1 構造化:
用語を構造化する方法には、大きく分けて2通りある。一つは、ある一定の視点から対象の事象を分類し、その分類概念に基づいて用語を階層的に配置するものである。たとえば、ICD-10準拠の病名集はこの例である。もう一つは、用語をその構成する最小の意味単位に分解し、用語をその構成要素の組合せとして理解し、どの構成要素のからも検索可能なような意味ネットワークを構成するものである。
前者は、分類概念が使用者の間で共通のものとして理解されており、かつ、分類の目的に対応した利用が行われる場合に便利である。後者は、構造が複雑で統一的な分類概念が当てはまらない場合に使われる、その代表が文献検索用の用語集である。特にコンピュータを利用した検索や利用には適している。本研究では、電子カルテ等によって日常診療に利用される医学用語の体系化を目指していることから、後者の形の構造化をめざし、ICDのような分類に関してはそれぞれの領域用語集の機能に任せるととした。
2 意味単位:
用語を意味単位に分解する場合には、意味単位とは何かを定義する必要がある。日本語のように主として表意文字を用いる場合には、最小の意味単位として個々の文字を用いることもできる。しかし、表意文字といえども、用字法や対象領域によってその意味が異なることがしばしばであり、一律に一文字を意味単位として扱うことに困難がある。たとえば「疼痛」の「疼」と「痛」を分離するのは言語学的には正当であっても、現在の医療では意義がない。そこで、この研究では、最小意味単位(ATOM)を医学や医療において独立した用語として認識される範囲に置くこととした。また、このATOMの単位での同義語を収集し、このレベルでの冗長性を確保した。たとえば、「疼痛」「痛」「痛み」「いたみ」は同義であると見なして、これらを全てATOMとするがそれらの間に優先度を与えることとした。
複数のATOMが組み合わされた場合に、これを用語(TERM)と呼ぶ。英語ではTERMとATOMの間に単語(WORD)の概念が存在するが、日本語では必要とされない。ただし、英語と日本語の連携を考えるとき、WORDの単位で日本語ではTERMであるべき概念もATOMとして取り扱うのが便利な場合がある。なお、全てのATOMはTERMでもありうる。
3 属性の記述
全ての要素(ATOM、TERM)はそれぞれの中で一定の分類が行われる。すなわち、医学用語全般を扱う場合にATOMの分類は、部位、臓器、病変、病因、症候、所見、機器、手技、薬剤、時間要素、量的要素、社会要素、接続表現、固有名詞などであるが、本研究で対象とした病名、症状、医療行為の場合には、この分類は単純化され、部位、臓器、症状、行為、時間要素、量的要素、固有名詞などに限定される。
この他の属性として、品詞(形容詞の場合は対応する名詞)、仮名表現、SNOMEDコード、等をあたえることとした。
4 辞書編集ツール
上記の様な構造を持った用語集を編集するためには、専用のデータベース検索システムを準備することが必要である。このシステムには以下の能力が要求される。
1) 用語を既知のATOMに分解する機能(パーシング)
2) 用語の表現を正規化する機能
漢字の統一
1バイト文字の排除
スペース、括弧等記号の整理
3) 新規のATOMを登録し属性を与える機能
4) 類似の用語を検索する機能
1) と2)については、研究者等がこの数年間で開発した正規化プログラムが利用できたので、本研究では、用語の類似性を検索するとともに、新規のATOMの発見を支援し登録する機能を持ったシステムの開発を行った。
通常、数万に上る用語を検索しこれらの中から類似性のある用語を見つけだすのは、骨の折れる作業である。人手で行う場合には、数十人が分担して何ヶ月もの期間をようしてやっと可能な作業である。
本システムを利用することによって、一用語に対して類似の用語またはATOMを数秒で提示することができる。
SNOMEDからのATOM抽出
日本語の医学用語の多くは英語の概念をそのまま日本語化したものである。そこで日本語用語集からのATOM抽出に加えて、英語の単語からもATOMを得ることを試みた。まず、14万語のSNOMEDから約5万語の単語を分離し、これを出現頻度別に上位のものからATOMとして採用し日本語訳を与える作業を開始した、とりあえず上位2840語(SNOMEDの中に14回以上出現するもの)を対象とした。21万語の日英医学辞書(MEID辞書)を利用して日本語候補を選び、ATOMとして適切な訳語の選択をした後、日本語用語集からの抽出の場合と同様にそれぞれに属性を与えた。領域分類はSNOMEDの軸分類に従った。この作業の結果、英単語と対応する日本語との間には意味範囲にずれがあり、その単語(ATOM)が使われる文脈によって同じ英単語でも日本語訳が異なることが明確に認識された。このことは、ATOMからTERMへの合成過程にも影響がある。ATOMの文脈への依存性を属性のひとつとして追加する必要があると判断された(文脈属性と呼ぶこととする)。
SNOMEDの日本語訳への応用
抽出されたATOM(日英対応分)を用いて、SNOMEDの自動翻訳を試みた。現時点ではATOMの絶対量が少なく、完全な機能は果たさないが、動作の原理は確認された。
残された問題
ATOMとその属性を基盤にしたこの構造化は、広く医療・医学の範囲をカバーするが、ATOMの同義関係と領域別辞書の用語構成が構造の柱となっており、固有名詞のように意味関係を持たない用語には弱い側面がある。実務面でこれを補うには、領域別の用語集に細密な分類が与えることと、ATOMの文脈属性を充実させることが必要である。
本研究では、SNOMEDの翻訳への応用をシステムの検証に用いたが、SNOMEDから抽出したATOMが大きな部分を占めるATOM辞書を使う限り、十分な検証を得たとはいえない。他の英語医学用語集の翻訳や、実際の診療記録から標準用語への変換を試みて、検証を追加すべきであろう。
結論
本研究は、医療用語の構造化をめざして、ATOM辞書の整備とその応用を目指したが、試験的な段階の目的を果たした。今後は、ATOM辞書の充実、特に文脈との関係を詳しく分析し、実用のレベルへ近づけたい。
学術発表
1) Y. Satomura, Yu-Bin Ryu, et al. A structured Japanese medical terminology aiming at CPR system, AMIA WG6 conference 1999.11, Washington DC
(Methods of Information in Medicine 6月号に掲載予定)

公開日・更新日

公開日
-
更新日
-

研究報告書(紙媒体)