文献情報
文献番号
199900089A
報告書区分
総括
研究課題名
健康危機の早期検出を目指した厚生統計情報等の自動解析システムの開発に関する研究
課題番号
-
研究年度
平成11(1999)年度
研究代表者(所属機関)
山口 直人(国立がんセンター)
研究分担者(所属機関)
- 水野正一(東京都老人総合研究所)
- 秋葉澄伯(鹿児島大学医学部)
- 大瀧 慈(広島大学原爆放射能医学研究所)
- 川崎裕美(広島県立保健福祉短期大学)
研究区分
厚生科学研究費補助金 行政政策研究分野 統計情報高度利用総合研究事業
研究開始年度
平成11(1999)年度
研究終了予定年度
平成12(2000)年度
研究費
4,500,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
本研究の目的は、疾病の異常な集積を市区町村単位のレベルで、早期に、かつ的確に自動検出するためのシステムを構築することである。人口動態調査、患者調査、地域がん登録などのデータは従来、経年変化や都道府県別比較などの巨視的な集計を中心に解析されており、わが国の厚生行政に貴重な資料を提供している。しかし、近年、比較的小地域に悪性腫瘍の集積を疑う意見が出され、環境中の化学物質との関連が科学的根拠のないままに指摘されるなど、市区町村単位あるいはそれ以下のレベルでの疾病の集積を科学的方法で把握する必要が急速に高まっている。本研究は、死亡、死産、罹患等のデータを定期的に解析し、小地域における真の地域集積を自動検出するシステムを開発することを目指すが、これによって、国民に対する「健康危機」に早期に、かつ的確に対応することが可能になり、逆に不確かな情報で、存在しない健康危機が無用の混乱を起こすことを回避できる。本研究での開発は、研究終了時点での実用化を目指すものであり、しかも過去に遡って解析を行い、現在の問題にも対応できるものである。
研究方法
研究は、(1)既存の利用可能な疾病情報のデータベース構築、(2)自動解析システムの開発、(3)4kmメッシュを基準とした地理情報システ(GIS)の活用に関する検討、(4)医療施設の患者データベースを活用する可能性に関する検討の4つの分野に分けて行う。このうち、(1)データベース構築に関しては、人口動態死亡調査のデータベース構築を市区町村単位で行う。死亡数の解析には各市区町村の人口データが必要だが、人口データは国勢調査年のデータを基本とし、調査間の人口は性・年齢別に内挿処理を行って推定する。まず死亡データベースを完成させて、解析への利用可能性を検討し、確認した後に患者調査データ、人口動態死産データ等に拡張する。(2)自動解析システムの開発では、まず、様々なテーマについて、実際に地理集積性の解析を実施することで、自動解析システムに求められるシステム要件を検討し、その結果を基に、市区町村単位で経年変化と地理分布の双方を同時に解析できるシステムを開発する。さらに、特定の市区町村に注目して、そこの人口動態統計、特に、死亡について、データベースから参照可能なシステムを構築する。(3)GISの活用に関しては、人口動態調査データ等を4kmメッシュデータとして集計することの実行可能性、実行できた場合に市区町村レベルの解析との利点問題点の比較等を理論レベルでの検討、シミュレーション実験による検討、一部小地域において実際に死亡データをメッシュデータに整理集計する試行を行って検討する。(4)医療施設の患者データベースの活用については、その利用可能性に関する検討を中心に行う。計画段階での想定としては、第一段階の自動解析は人口動態調査、患者調査データ等を中心に行い、集積の可能性が判明した段階で、医療施設の患者データベース、健康保険レセプトデータ等に戻って、疾病の詳細に関してデータ収集を行うことが実行可能かどうか、問題点を検討する。また、一部小地域において、実際に死亡データから医療施設への患者データを照会、調査する試行を行って、問題点の洗い出しを行い、特に、患者のプライバシー保護の保証など、具体的な問題点を検討する。
結果と考察
1975年から1994年までの20年間の死因別死亡を、性・5歳年齢階級別・市区町村別に「全国死亡データベース」として整備した。また、人口についても、同時期の性・5歳年齢階級別・市
区町村別人口をデータベース化した。人口は国勢調査年のデータを基に、その間の人口を内挿処理によって推定した。特に、この期間に起こった市町村合併を自動的に考慮する設計を行った。データベース管理システムはリレーショナルデータベースを用い、死因分類等のマスターテーブルを用いて各種の分析ができるように配慮した。今後、国際疾病分類が新しくなった1995年以降のデータも、ICD9とICD10の対応関係を考慮しつつ、データベースに追加する予定である。
急速な人口流入が起こりつつある地域で小児白血病が増加するという仮説の検討を昨年度に引き続いて行った。1975年と1980年の人口を比較して、5年間における人口増加比を求め、1983-87年の小児白血病死亡率と人口増加率の関連をポアソン回帰分析によって解析した。人口規模が5千人以上5万人以下の小都市と5万人以上50万人以下の中都市とに分け、白血病死亡率も0-4歳、5-9歳、10-14歳の3群に分けて分析した結果、いずれの年齢階級でも人口増加率が高い市区町村の方が、白血病死亡率が高い傾向が認められた。この傾向は、中都市における10-14歳の死亡では統計的にも有意であった。
出生に関する分析としては、出生性比の経年変化に関する分析を行った。解析に際しては第一子のみを対象とし、全国の市区町村を人口規模で、小規模群(8千人未満)、中規模群(8千人以上2万人以下)、大規模群(2万人以上100万人未満)の3群に分けて分析を行った。その結果、中規模群及び大規模群では1975年から1995年までの20年間に、女児の出生割合が統計的に有意に上昇する傾向が認められた。環境要因の変化による影響も考えられ、今後、さらに詳細な検討を進める予定である。
解析システムとしては、経年変化と地理分布を同時に解析する自動解析システムの開発、解析結果等から注目された特定の市区町村について情報を分析するシステムの開発、様々な疫学解析の実施に際して必要なデータを全国死亡データベース等のデータベースから効率よく抽出するシステムの開発を行った。
自動解析システムに関しては今年度は、地図上に市区町村の標準化死亡比を表示して、視覚的に地理分布を分析するシステムを構築し、肺がん、胃がん、肝がん、結腸がんへの応用を試みた。来年度は、統計的な解析結果もシステムに加えて自動解析システムとしての完成度を高める予定である。また、出生や患者調査などのデータについても順次、データベース構築を進めて行く。
さらに、上述のような解析を行った結果、特定の市区町村における地理集積が疑われた場合、その市区町村の死亡状況を分析できるように、全国の任意の市区町村の死因別死亡を性・5歳年齢階級別に表示するシステム「Life Web」プロトタイプシステムを開発した。本システムはインターネット上で利用が可能であり、利用者からの指示に応じて、「全国死亡データベース」から必要なデータを自動抽出して、性・年齢階級別の一覧表表示を行うほか、全国との比較結果を標準化死亡比の形で表示する。また、結果をグラフ表示することも可能である。さらに、特定の市区町村における死因別死亡の経年変化を調整死亡率の形でグラフ表示する機能も開発した。今後、今人情報保護のための必要な機能を追加するなど、さらに検討を進める予定である。
本年度は、昨年度に引き続き、本研究の最終目的である自動解析システムの開発に向けた準備として、全国死亡データベースの構築、具体的な地理疫学的解析の実施、解析システムのプロトタイプの開発を行った。データベース構築に関しては全国死亡データベースの構築を来年度中に終える予定である。さらに来年度中には患者調査など、他のデータについてもデータベース構築を開始する。解析システムとしては、地理分布の自動解析システムについてプロトタイプシステムの開発を終えることができ、地理分布を視覚的に分析できるようになった。この成果を受けて、視覚的な分析を裏付ける統計的解析を付け加えて、解析システムとして完成させる予定である。また、特定の市区町村の死亡構造を分析するLife Webもプロトタイプシステムがほぼ完成した。今後の予定として、視覚的な分析、統計解析、そして特定の市区町村の分析の3者を統合して、より完成度の高いシステムを目指す予定である。また、Life Webをインターネット上での利用を想定して開発して成功したことを受けて、他のシステムも最終形としてはインターネット上での公開も視野に入れた検討を進める予定である。最後に、個々の地理疫学解析のための効率的なデータ抽出に関しては、幅広い解析のニーズに対応して、解析用データセットを自動的に生成するインターフェースの構築が重要であることが本年度の研究でも明らかにされたので、今年度までの検討結果を基に、抽出システムとして持つべきシステム要件を整理して、来年度中に開発に着手したいと考えている。
区町村別人口をデータベース化した。人口は国勢調査年のデータを基に、その間の人口を内挿処理によって推定した。特に、この期間に起こった市町村合併を自動的に考慮する設計を行った。データベース管理システムはリレーショナルデータベースを用い、死因分類等のマスターテーブルを用いて各種の分析ができるように配慮した。今後、国際疾病分類が新しくなった1995年以降のデータも、ICD9とICD10の対応関係を考慮しつつ、データベースに追加する予定である。
急速な人口流入が起こりつつある地域で小児白血病が増加するという仮説の検討を昨年度に引き続いて行った。1975年と1980年の人口を比較して、5年間における人口増加比を求め、1983-87年の小児白血病死亡率と人口増加率の関連をポアソン回帰分析によって解析した。人口規模が5千人以上5万人以下の小都市と5万人以上50万人以下の中都市とに分け、白血病死亡率も0-4歳、5-9歳、10-14歳の3群に分けて分析した結果、いずれの年齢階級でも人口増加率が高い市区町村の方が、白血病死亡率が高い傾向が認められた。この傾向は、中都市における10-14歳の死亡では統計的にも有意であった。
出生に関する分析としては、出生性比の経年変化に関する分析を行った。解析に際しては第一子のみを対象とし、全国の市区町村を人口規模で、小規模群(8千人未満)、中規模群(8千人以上2万人以下)、大規模群(2万人以上100万人未満)の3群に分けて分析を行った。その結果、中規模群及び大規模群では1975年から1995年までの20年間に、女児の出生割合が統計的に有意に上昇する傾向が認められた。環境要因の変化による影響も考えられ、今後、さらに詳細な検討を進める予定である。
解析システムとしては、経年変化と地理分布を同時に解析する自動解析システムの開発、解析結果等から注目された特定の市区町村について情報を分析するシステムの開発、様々な疫学解析の実施に際して必要なデータを全国死亡データベース等のデータベースから効率よく抽出するシステムの開発を行った。
自動解析システムに関しては今年度は、地図上に市区町村の標準化死亡比を表示して、視覚的に地理分布を分析するシステムを構築し、肺がん、胃がん、肝がん、結腸がんへの応用を試みた。来年度は、統計的な解析結果もシステムに加えて自動解析システムとしての完成度を高める予定である。また、出生や患者調査などのデータについても順次、データベース構築を進めて行く。
さらに、上述のような解析を行った結果、特定の市区町村における地理集積が疑われた場合、その市区町村の死亡状況を分析できるように、全国の任意の市区町村の死因別死亡を性・5歳年齢階級別に表示するシステム「Life Web」プロトタイプシステムを開発した。本システムはインターネット上で利用が可能であり、利用者からの指示に応じて、「全国死亡データベース」から必要なデータを自動抽出して、性・年齢階級別の一覧表表示を行うほか、全国との比較結果を標準化死亡比の形で表示する。また、結果をグラフ表示することも可能である。さらに、特定の市区町村における死因別死亡の経年変化を調整死亡率の形でグラフ表示する機能も開発した。今後、今人情報保護のための必要な機能を追加するなど、さらに検討を進める予定である。
本年度は、昨年度に引き続き、本研究の最終目的である自動解析システムの開発に向けた準備として、全国死亡データベースの構築、具体的な地理疫学的解析の実施、解析システムのプロトタイプの開発を行った。データベース構築に関しては全国死亡データベースの構築を来年度中に終える予定である。さらに来年度中には患者調査など、他のデータについてもデータベース構築を開始する。解析システムとしては、地理分布の自動解析システムについてプロトタイプシステムの開発を終えることができ、地理分布を視覚的に分析できるようになった。この成果を受けて、視覚的な分析を裏付ける統計的解析を付け加えて、解析システムとして完成させる予定である。また、特定の市区町村の死亡構造を分析するLife Webもプロトタイプシステムがほぼ完成した。今後の予定として、視覚的な分析、統計解析、そして特定の市区町村の分析の3者を統合して、より完成度の高いシステムを目指す予定である。また、Life Webをインターネット上での利用を想定して開発して成功したことを受けて、他のシステムも最終形としてはインターネット上での公開も視野に入れた検討を進める予定である。最後に、個々の地理疫学解析のための効率的なデータ抽出に関しては、幅広い解析のニーズに対応して、解析用データセットを自動的に生成するインターフェースの構築が重要であることが本年度の研究でも明らかにされたので、今年度までの検討結果を基に、抽出システムとして持つべきシステム要件を整理して、来年度中に開発に着手したいと考えている。
結論
本年度は、市区町村別の全国死亡データベースを基に、各種の地理疫学的解析を行い、貴重な成果を得た。また、出生性比の分析を通じて、他の人口動態統計データの有用性を示すこともできた。自動解析システムとして全国の市区町村における死亡リスクを視覚的に分析できる地図表示システムを開発した。さらに、市区町村別の死因別死亡を詳細に参照できるシステム「LifeWeb」のプロトタイプを開発した。
公開日・更新日
公開日
-
更新日
-