文献情報
文献番号
199900789A
報告書区分
総括
研究課題名
地域住民健診の有用性評価に基づく効果的運用に関する研究(総括研究報告書)
課題番号
-
研究年度
平成11(1999)年度
研究代表者(所属機関)
矢野 栄二(帝京大学医学部)
研究分担者(所属機関)
- 小林廉毅(東京大学大学院医学系研究科)
- 山岡和枝(帝京大学法学部)
- 村田勝敬(帝京大学医学部)
- 橋本英樹(帝京大学医学部)
研究区分
厚生科学研究費補助金 健康安全確保総合研究分野 健康科学総合研究事業
研究開始年度
平成10(1998)年度
研究終了予定年度
平成12(2000)年度
研究費
6,000,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
従来、わが国では保健医療の分野に限らず施策・活動の「評価」が行われることが少なかった。医療分野において、医療の技術評価あるいは臨床疫学に学んだ医療内容の見直しという活動はあったが、実はそれはまだ欧米における技術評価や臨床疫学の紹介が多く、実際にそれによりわが国の保健医療施策を評価し、見直していくという作業の進行は極めて遅く、実施された例はあまり無い。特に、予防行為についての実証的な研究はわが国では殆どない。このような状況の中で、近年がん検診を批判した書物が話題を集めており、これに対してがん検診の見直し作業が行われている。しかし、見直しはがんに限定することなく、その他の健診を含めた予防活動一般の再評価が必要とされよう。
これに対し、イギリスでは20年以上前から、Holland、Cochrane らによりスクリーニングの評価が行われ、カナダ、米国などでは政府機関で予防活動評価の組織的な研究がなされている。例えば、US Preventive Services Task Forceは、多くの二次予防の検査の有用性に疑問を呈し、一次予防の重要性を強調している。これには、広くTechnology Assessmentの研究や実践が社会の各分野にあり、医療分野でもClinical Decision MakingやClinical Epidemiology、そして近年ではEvidence Based MedicineやCochrane Collaborationなどのかなり実践に結びついた体系的な活動と研究が背景にある。
本研究者らは、大学、病院、事業所、地域の医師研究者らによる所謂「過労死」予防のための研究グループで研究活動を行っていたが、その活動の中で健康診断が予防にどの程度有用であるかについて疑問を持ち、欧米における研究を調査した。その結果、わが国の地域・職域で広く行われている血液検査等の項目の中に、欧米では「定期的な実施を勧告しない」とする項目が多くあり、また肝機能検査などの項目は検討の対象にすら挙がっていなかった。しかし、国によって頻度の高い疾患や生活習慣などが違うため検査の必要性や有効性は異なる。したがって、わが国において実証的な研究をする必要性が感じられた。
世界の健診資源の半分が日本で消費されると言う。妊産婦健診、乳幼児健診、学校健診、事業所における健診、そして老人健康診査と、わが国の健診(二次予防の体系)は非常に整備されているかに見えるが、実はこれらの健診が果たして有用であるのか否かの根拠は必ずしもはっきりしない。結核がわが国の死亡原因のトップであった頃の結核検診や、脳卒中対策の一環としての血圧測定は確かに有用性があると考えられるが、現在死亡原因の首位にあるがん検診については最近大きな見直し作業が進行している。同様に、それ以外の健診についても、その根拠や有用性の評価がなされるべき時期にあると考えられる。そこで地域住民に対して行われている健診を取り上げ、その有用性を文献的・実証的に検討するのが本研究の目的である。
これに対し、イギリスでは20年以上前から、Holland、Cochrane らによりスクリーニングの評価が行われ、カナダ、米国などでは政府機関で予防活動評価の組織的な研究がなされている。例えば、US Preventive Services Task Forceは、多くの二次予防の検査の有用性に疑問を呈し、一次予防の重要性を強調している。これには、広くTechnology Assessmentの研究や実践が社会の各分野にあり、医療分野でもClinical Decision MakingやClinical Epidemiology、そして近年ではEvidence Based MedicineやCochrane Collaborationなどのかなり実践に結びついた体系的な活動と研究が背景にある。
本研究者らは、大学、病院、事業所、地域の医師研究者らによる所謂「過労死」予防のための研究グループで研究活動を行っていたが、その活動の中で健康診断が予防にどの程度有用であるかについて疑問を持ち、欧米における研究を調査した。その結果、わが国の地域・職域で広く行われている血液検査等の項目の中に、欧米では「定期的な実施を勧告しない」とする項目が多くあり、また肝機能検査などの項目は検討の対象にすら挙がっていなかった。しかし、国によって頻度の高い疾患や生活習慣などが違うため検査の必要性や有効性は異なる。したがって、わが国において実証的な研究をする必要性が感じられた。
世界の健診資源の半分が日本で消費されると言う。妊産婦健診、乳幼児健診、学校健診、事業所における健診、そして老人健康診査と、わが国の健診(二次予防の体系)は非常に整備されているかに見えるが、実はこれらの健診が果たして有用であるのか否かの根拠は必ずしもはっきりしない。結核がわが国の死亡原因のトップであった頃の結核検診や、脳卒中対策の一環としての血圧測定は確かに有用性があると考えられるが、現在死亡原因の首位にあるがん検診については最近大きな見直し作業が進行している。同様に、それ以外の健診についても、その根拠や有用性の評価がなされるべき時期にあると考えられる。そこで地域住民に対して行われている健診を取り上げ、その有用性を文献的・実証的に検討するのが本研究の目的である。
研究方法
現在老人保健法の基本健康診査で行われている健診項目、すなわち問診、身体計測、血圧、検尿、心電図、脂質検査、貧血検査、肝機能検査、腎機能検査、クレアチニン、血糖検査、ヘモグロビンA1c検査について、文献的および実証的にその有用性を検討する。具体的には、効果と効率の違いを考慮し、鋭敏度、特異度などの疾病発見検査としての有効性と疾患発見と予後改善の関係(例えば、有効な治療法が存在するか)、健診受診と実際のアウトカム(生命や健康状態の予後、QOL)の関係や医療費節約効果等多面的に検討するものである。
本年度は、昨年度取り纏めた「スクリーニング検査の批判的評価項目」に基づいて、問診、身体計測、血圧、検尿、脂質検査、貧血検査、肝機能検査、腎機能検査、クレアチニン、血糖検査、ヘモグロビンA1c検査についての有用性評価を行った。この健診項目評価の視点は以下の9点である。①その検査が目的とする疾患は明確か、②それは健診で発見できる疾患か、③その疾患を発見することが、受診者にとって利益になるか、④確定診断検査が存在し、実施可能か、⑤検査には十分な有効性があるか、⑥健診検査に伴うマイナス面は、予想される利益を越えていないか、⑦その検査は受け入れられやすいものか、⑧その検査は目的からみて適当な方法で実施されているのか、⑨その検査以外の方法がないか。
実証的研究では、健診でもっとも重要なスクリーニング検査としての敏感度と特異度を明らかにするために、一泊人間ドック受診者 571名(糖尿病の既往者は除外)から得られた尿糖検査データ、および某金融機関の企業内定期健診受診者2061名(41~64歳男性)から得られた肝機能検査データを用いて解析した。
本年度は、昨年度取り纏めた「スクリーニング検査の批判的評価項目」に基づいて、問診、身体計測、血圧、検尿、脂質検査、貧血検査、肝機能検査、腎機能検査、クレアチニン、血糖検査、ヘモグロビンA1c検査についての有用性評価を行った。この健診項目評価の視点は以下の9点である。①その検査が目的とする疾患は明確か、②それは健診で発見できる疾患か、③その疾患を発見することが、受診者にとって利益になるか、④確定診断検査が存在し、実施可能か、⑤検査には十分な有効性があるか、⑥健診検査に伴うマイナス面は、予想される利益を越えていないか、⑦その検査は受け入れられやすいものか、⑧その検査は目的からみて適当な方法で実施されているのか、⑨その検査以外の方法がないか。
実証的研究では、健診でもっとも重要なスクリーニング検査としての敏感度と特異度を明らかにするために、一泊人間ドック受診者 571名(糖尿病の既往者は除外)から得られた尿糖検査データ、および某金融機関の企業内定期健診受診者2061名(41~64歳男性)から得られた肝機能検査データを用いて解析した。
結果と考察
定期健診項目の有用性評価を文献的に行った。その結果、米国研究班報告の勧告「定期健診に含めるべきとする確かな証拠がある」項目は血圧だけであった。また、「定期健診に含むべき証拠がある」項目として、身長・体重(BMI)と総コレステロールが挙げられた。一方、わが国の定期健診のいわば中心となる肝機能検査が、米国研究班報告では検討の対象に入っていなかった。すなわち米国研究班が予防活動についてそれまでの種々の研究を詳細にレビューした結果では、わが国で毎年義務的に行われている定期健診項目のほとんどが、実施すべきか否か議論が分かれるか、そもそも検討の対象にもならない項目であった。しかしながら、健診は対象とする集団の疾病構造によって有用性が異なるので、わが国の状況の中で、独自に評価できる研究-当該検査における目的とする疾病の明確化と敏感度・特異度の再評価、検査に伴うマイナス面をも考慮した実施方法の再評価、等々-の推進が必要である。
糖尿病および耐糖能異常発見という目的からみて採尿時間の違いによる尿糖検査スクリーニングの敏感度および特異度を検討した。人間ドックの2日目の朝、空腹時尿糖、75g経口糖負荷試験、糖負荷2時間後尿糖が調べられ、尿糖40 mg/dl以上(定性試験で±以上)を陽性と判定した。糖尿病、耐糖能異常の有無はWHO診断基準に基づいた。この結果、糖尿病22人(3.9%)、耐糖能異常88人(15.4%)、異常なし461人(80.7%)であった。糖尿病スクリーニングにおける空腹時尿糖の敏感度は男性10.5%(特異度100%)、女性0%(特異度99.0%)であり、負荷後尿糖の敏感度は男性84.2%(特異度78.8%)、女性100%(特異度95.1%)であった。耐糖能異常のスクリーニングにおける空腹時尿糖の敏感度は男女とも0%であり、負荷後尿糖の敏感度は男性63.6%、女性36.4%であった。一方、質問紙法で107名の産業医に尿糖検査の採尿時間帯を尋ねると、空腹時58.3%、随時29.1%、食後2.9%およびその他(不明等)9.7%であり、多くの産業医が空腹時に採尿しており、敏感度の高い食後の実施は殆どなかった。
過栄養性脂肪肝、アルコール性肝疾患、肝炎ウイルス感染症の病態のスクリーニング指標として使用されているGOT、GPT、γ-GTPの敏感度および特異度を検討した。過栄養性脂肪肝に関する敏感度はGOT<γ-GTP<GPTの順に高く、最も高いGPTで35.8%であった。肥満度(BMI)の同病態に関する敏感度は38.1%とむしろGPTより高かった。BMIの特異度は肝機能検査項目単独のGOTの96.0%に次いで94.1%と高かった。多飲酒に対する肝機能検査項目の敏感度は非肥満に比べ肥満群で高かったが、それでも33.3%であり、最も低い場合では非肥満群のGOTが7.1%であった。γ-GTPの敏感度は非肥満群で他の2項目より高いものの、20.5%であった。一方、特異度は80-95%であったが、肥満群でのGPTの63.4%が例外的に低かった。肝炎ウイルス感染症では、HBs抗原陽性に比べHCV抗体陽性に対する敏感度の方が高く、中でもGPTは45.5%と最も高かった。要約すると、肝機能検査を行っても目的とする疾患に対する敏感度が余りに低く(50%以下)、「健診項目として肝機能検査が本当に有用性があるのか?」と改めて疑問符が投げかけられた形となった。
健診項目検討の一例として、本年度は尿糖検査と肝機能検査にメスを入れた。その結果、尿糖検査においては、採尿時間の変更で敏感度が大幅に改善した。産業医の58.3%がこの事実を知らないで敏感度の低い空腹時尿を用いて検査していることを指摘した。一方の肝機能検査では、目的とする疾患に対し敏感度が余りに低率(50%以下)であり、上述のレビューと併せ考えると、健診項目としての意義を再考する必要があるように思われた。
糖尿病および耐糖能異常発見という目的からみて採尿時間の違いによる尿糖検査スクリーニングの敏感度および特異度を検討した。人間ドックの2日目の朝、空腹時尿糖、75g経口糖負荷試験、糖負荷2時間後尿糖が調べられ、尿糖40 mg/dl以上(定性試験で±以上)を陽性と判定した。糖尿病、耐糖能異常の有無はWHO診断基準に基づいた。この結果、糖尿病22人(3.9%)、耐糖能異常88人(15.4%)、異常なし461人(80.7%)であった。糖尿病スクリーニングにおける空腹時尿糖の敏感度は男性10.5%(特異度100%)、女性0%(特異度99.0%)であり、負荷後尿糖の敏感度は男性84.2%(特異度78.8%)、女性100%(特異度95.1%)であった。耐糖能異常のスクリーニングにおける空腹時尿糖の敏感度は男女とも0%であり、負荷後尿糖の敏感度は男性63.6%、女性36.4%であった。一方、質問紙法で107名の産業医に尿糖検査の採尿時間帯を尋ねると、空腹時58.3%、随時29.1%、食後2.9%およびその他(不明等)9.7%であり、多くの産業医が空腹時に採尿しており、敏感度の高い食後の実施は殆どなかった。
過栄養性脂肪肝、アルコール性肝疾患、肝炎ウイルス感染症の病態のスクリーニング指標として使用されているGOT、GPT、γ-GTPの敏感度および特異度を検討した。過栄養性脂肪肝に関する敏感度はGOT<γ-GTP<GPTの順に高く、最も高いGPTで35.8%であった。肥満度(BMI)の同病態に関する敏感度は38.1%とむしろGPTより高かった。BMIの特異度は肝機能検査項目単独のGOTの96.0%に次いで94.1%と高かった。多飲酒に対する肝機能検査項目の敏感度は非肥満に比べ肥満群で高かったが、それでも33.3%であり、最も低い場合では非肥満群のGOTが7.1%であった。γ-GTPの敏感度は非肥満群で他の2項目より高いものの、20.5%であった。一方、特異度は80-95%であったが、肥満群でのGPTの63.4%が例外的に低かった。肝炎ウイルス感染症では、HBs抗原陽性に比べHCV抗体陽性に対する敏感度の方が高く、中でもGPTは45.5%と最も高かった。要約すると、肝機能検査を行っても目的とする疾患に対する敏感度が余りに低く(50%以下)、「健診項目として肝機能検査が本当に有用性があるのか?」と改めて疑問符が投げかけられた形となった。
健診項目検討の一例として、本年度は尿糖検査と肝機能検査にメスを入れた。その結果、尿糖検査においては、採尿時間の変更で敏感度が大幅に改善した。産業医の58.3%がこの事実を知らないで敏感度の低い空腹時尿を用いて検査していることを指摘した。一方の肝機能検査では、目的とする疾患に対し敏感度が余りに低率(50%以下)であり、上述のレビューと併せ考えると、健診項目としての意義を再考する必要があるように思われた。
結論
莫大な資源を投下して、全国民をカバーする形で行われている今日の日本の健診を評価すると、血圧、身長・体重(BMI)および総コレステロール検査は目的疾患が明確であり、受診者の利益(介入による治療効果)に結びつき、かつ実施方法も適切であると考えられた。その他の検査項目は、実施方法や実施すべき検査かどうかについてさらなる検討が必要であるように思われた。この領域の評価・研究は圧倒的に不足しており、本研究で示された各健診項目の問題点を叩き台として、さらに一層の研究が推進されなければならない。
公開日・更新日
公開日
-
更新日
-