文献情報
文献番号
199700310A
報告書区分
総括
研究課題名
医師の臨床能力の客観的評価に関する研究
課題番号
-
研究年度
平成9(1997)年度
研究代表者(所属機関)
畑尾 正彦(日本赤十字武蔵野短期大学)
研究分担者(所属機関)
研究区分
厚生科学研究費補助金 行政政策研究分野 健康政策調査研究事業
研究開始年度
平成9(1997)年度
研究終了予定年度
-
研究費
2,000,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
医師国家試験改善検討委員会報告書で、基本的診療能力の評価は筆記試験だけ では不十分であり、実技試験の導入が今後の改善検討課題とされた。診療に関する技能、態度・マナーの適正な評価法である客観的臨床能力試験(OSCE)は、大学医学部の教育に導入できる実用性の高い試験であるが、全国規模で実施する場合に、検討と準備すべき問題点を明らかにして、得られた結果を将来の医師国家試験の改善に資するために本研究を行う。
研究方法
1.OSCEの実技ステーションにおける評価の信頼性の検討
1)大学で実施されたOSCEにおいて(1)評価者による評価結果の違いに対する評価打ち合せ と評価マニュアルの有用性、(2)試験日の違いの評価結果への影響、(3)課題の違いの評価結果への影響を調査・検討した。2)基本的臨床技能教育法ワークショップ(日本医学教育 学会 臨床能力教育ワーキンググループ)で、評価打ち合せを行うグループと評価マニュアルを 読むだけのグループに おける評価結果の不一致の程度を検討した。
2.評価結果の処理方法の最終結果(合否判定)に及ぼす影響の検討
大学で実施されるOSCEの評価結果を種々の方法で処理(採点)することによって、評定の不一致の程度を調査し、それが最終結果に及ぼす程度を検討した。
3.医療面接で受験者に、標準的な対応ができる標準模擬患者(Standardized Patient SP) を育成するためのプログラムを、東京SP研究会の活動と経験に基づいて策定した。
4.診療手技の評価に利用可能なシミュレータ機器の実状を、OSCEを実施した大学にアンケートを送付して調査した。
5.OSCEを全国規模で実施する場合に必要な人的資源を試算した。
1)大学で実施されたOSCEにおいて(1)評価者による評価結果の違いに対する評価打ち合せ と評価マニュアルの有用性、(2)試験日の違いの評価結果への影響、(3)課題の違いの評価結果への影響を調査・検討した。2)基本的臨床技能教育法ワークショップ(日本医学教育 学会 臨床能力教育ワーキンググループ)で、評価打ち合せを行うグループと評価マニュアルを 読むだけのグループに おける評価結果の不一致の程度を検討した。
2.評価結果の処理方法の最終結果(合否判定)に及ぼす影響の検討
大学で実施されるOSCEの評価結果を種々の方法で処理(採点)することによって、評定の不一致の程度を調査し、それが最終結果に及ぼす程度を検討した。
3.医療面接で受験者に、標準的な対応ができる標準模擬患者(Standardized Patient SP) を育成するためのプログラムを、東京SP研究会の活動と経験に基づいて策定した。
4.診療手技の評価に利用可能なシミュレータ機器の実状を、OSCEを実施した大学にアンケートを送付して調査した。
5.OSCEを全国規模で実施する場合に必要な人的資源を試算した。
結果と考察
1.評価の信頼性の検討1)大学で実施されたOSCE(1)評価マニュアルだけでは、複数の評価者間で評価結果に有意差が出る場合が多かった。前日または直前に打ち合せを行った場合には有意差が認められなかった。(2)試験日を3日に分けてOSCEを実施した場 合、日を追って得点が高くなる場合と低くなる場合と変化のみられない場合とがあった。同じ課題であっても、必ずしも後に受験するほうが得点しやすいとはいえなかった。(3) 課題によって、受験者の平均得点に差がみられた。医療面接67.9%、頭頸部診察77.7%、胸部診察84.0%、腹部診察77.0%、神経診察81.1%、救急蘇生84.0%で、難しい課題にあたった受験者の得点は低かった。2)基本的臨床技能教育法ワークショップで、評価マニュアルを読むだけの評価者群と1時間の打ち合せを行う評価者群とを比較すると、医療面接で打ち 合せ 群の評価結果の一致度が高かったが、腹部診察と頭頸部診察では、両群間に有意差 はみられなかった。このワークショップでは、スケジュールとして評価マニュアルを読む時間がとってあり、確実にマニュアルを読むことになる。評価マニュアルをきちんと読めば、打ち合せをした場合に近い評価の一致度を得ることが示唆される。評価打ち合せをしない場合に、評価マニュアルを読むことに加えて、評価基準を示すビデオが有用ではないかと考えられる。
2.評価結果の処理方法の最終結果(合否判定)に及ぼす影響の検討
評定尺度で不可と判定された評価項目数に着目して評価結果を処理した場合、Y大学で実 施されたOSCEでは、複数の評価者間での評定一致率は84.3%(第1試験日)、91.7%(第2試験 日)であった。4課題のOSCEで、不合格と判定された者は、114名の受験者中、医療面接で4名、頭頸部診察で2名、腹部診察で1名であった。その課題に関する受験者の実技が、上手でなくても、できればよいとの観点に立てば、評定尺度で不可(最低評定)と判定された評価項目数を集計して判断することになる。その場合の複数の評価者間での評定一致率は高い。就中、第2試験日の一致率が高いのは、第1日の試験後に評価者間で打ち合せをしたことが影響していると考えられる。仮に可以上と評定された項目数が、その課題の全評価項目数の60%未満だった場合をその課題全体の成績として不可(60%~70%未満を可、70%~80%未満を良、80%以上を優)とすると、いずれかの課題で不可と判定された7名のうち、2課題以上が不可だったものの4課題を積算法で総合した結果で不合格と判定されるものはいな かった。評価結果の処理方法を、不可と評定された項目数によって判定することで、Y大 学のシミュレーションからは、難しい課題を受験して低い得点だった場合でも、評価の最終結果(合否判定)への影響は少ないと予想された。
3.標準模擬患者(SP)の育成
全国規模のOSCEを実施する場合に必要なSPの数を試算し、そのSPを確保するための、1泊2日の育成プログラムを作成した。この育成プログラムが、できれば地方ブロックごとに、全国的に公的機関で実施されることが期待される。
4.シミュレータ機器に関するアンケート調査
OSCEを実施した13施設から回答を得た。心肺蘇生訓練シミュレータは9施設、心音シミュ レータは5施設、呼吸音シミュレータは3施設で採用されていた。最も利用されているのは心肺蘇生訓練用のもので、アンケート回答の約半数が現存のもので満足であり、半数はハード面での改良を望むとしている。心音・呼吸音については音質の改良を求めるものがあった。より適切なシミュレータ機器の開発が望まれるが、現状でも大きな支障はない。
5.OSCEを全国規模で実施する場合の人的資源
OSCEを、5課題(実技3課題)、7ステーション、1日9サイクルで行うとすると、1年度の医師国家試験受験者約9,000名を試験するのに、144列を用意する必要がある。
OSCE1列に要する人的資源は、本来の試験官としては、実技課題の評価者3名である。その他にSP1名、患者役2名、タイムキーパー1名、誘導係2~3名と、できれば統括責任者1名と会場係2~3名いることが望ましい。
OSCE1列に必要な人数に、会場数とその会場での列数とを乗じた数の人的資源が必要であ る。限られた人的資源で全国規模のOSCEを実施する方法を検討する必要がある。144列のOSCEを1日で実施する場合、1会場に4列を設定すると、36会場が必要である。
1.試験日を分ける方法として、4日に分ければ9会場、12日に分ければ3会場であり、実技 課題評価者に統括責任者を加えて、必要な本来の試験官は40名である。
2.各大学にexternal examinerが赴いて評価する方法とは、全国の大学病院またはその近 隣の公的病院を試験会場として、その大学の受験者を他大学の評価者が評価する方法であり、理論的に可能である。
3.試験場を一定のところに設置する方法は、設置されたOSCE試験場で、受験者はある期間内に、随時受験し、そのOSCE合格と現行の医師国家試験合格をもって、医師免許取得の要件とするものである。設定されたステーションを受験者が次々と通り抜けて受験する方式を想定し、5課題を評価する場合、午前と午後にそれぞれ3時間として1日60名の受験者を 評価できると試算される。週2日を試験日とし、ほぼ6か月を試験期間とすると、約9,000 名を試験するのに3か所の試験場が必要である。
2.評価結果の処理方法の最終結果(合否判定)に及ぼす影響の検討
評定尺度で不可と判定された評価項目数に着目して評価結果を処理した場合、Y大学で実 施されたOSCEでは、複数の評価者間での評定一致率は84.3%(第1試験日)、91.7%(第2試験 日)であった。4課題のOSCEで、不合格と判定された者は、114名の受験者中、医療面接で4名、頭頸部診察で2名、腹部診察で1名であった。その課題に関する受験者の実技が、上手でなくても、できればよいとの観点に立てば、評定尺度で不可(最低評定)と判定された評価項目数を集計して判断することになる。その場合の複数の評価者間での評定一致率は高い。就中、第2試験日の一致率が高いのは、第1日の試験後に評価者間で打ち合せをしたことが影響していると考えられる。仮に可以上と評定された項目数が、その課題の全評価項目数の60%未満だった場合をその課題全体の成績として不可(60%~70%未満を可、70%~80%未満を良、80%以上を優)とすると、いずれかの課題で不可と判定された7名のうち、2課題以上が不可だったものの4課題を積算法で総合した結果で不合格と判定されるものはいな かった。評価結果の処理方法を、不可と評定された項目数によって判定することで、Y大 学のシミュレーションからは、難しい課題を受験して低い得点だった場合でも、評価の最終結果(合否判定)への影響は少ないと予想された。
3.標準模擬患者(SP)の育成
全国規模のOSCEを実施する場合に必要なSPの数を試算し、そのSPを確保するための、1泊2日の育成プログラムを作成した。この育成プログラムが、できれば地方ブロックごとに、全国的に公的機関で実施されることが期待される。
4.シミュレータ機器に関するアンケート調査
OSCEを実施した13施設から回答を得た。心肺蘇生訓練シミュレータは9施設、心音シミュ レータは5施設、呼吸音シミュレータは3施設で採用されていた。最も利用されているのは心肺蘇生訓練用のもので、アンケート回答の約半数が現存のもので満足であり、半数はハード面での改良を望むとしている。心音・呼吸音については音質の改良を求めるものがあった。より適切なシミュレータ機器の開発が望まれるが、現状でも大きな支障はない。
5.OSCEを全国規模で実施する場合の人的資源
OSCEを、5課題(実技3課題)、7ステーション、1日9サイクルで行うとすると、1年度の医師国家試験受験者約9,000名を試験するのに、144列を用意する必要がある。
OSCE1列に要する人的資源は、本来の試験官としては、実技課題の評価者3名である。その他にSP1名、患者役2名、タイムキーパー1名、誘導係2~3名と、できれば統括責任者1名と会場係2~3名いることが望ましい。
OSCE1列に必要な人数に、会場数とその会場での列数とを乗じた数の人的資源が必要であ る。限られた人的資源で全国規模のOSCEを実施する方法を検討する必要がある。144列のOSCEを1日で実施する場合、1会場に4列を設定すると、36会場が必要である。
1.試験日を分ける方法として、4日に分ければ9会場、12日に分ければ3会場であり、実技 課題評価者に統括責任者を加えて、必要な本来の試験官は40名である。
2.各大学にexternal examinerが赴いて評価する方法とは、全国の大学病院またはその近 隣の公的病院を試験会場として、その大学の受験者を他大学の評価者が評価する方法であり、理論的に可能である。
3.試験場を一定のところに設置する方法は、設置されたOSCE試験場で、受験者はある期間内に、随時受験し、そのOSCE合格と現行の医師国家試験合格をもって、医師免許取得の要件とするものである。設定されたステーションを受験者が次々と通り抜けて受験する方式を想定し、5課題を評価する場合、午前と午後にそれぞれ3時間として1日60名の受験者を 評価できると試算される。週2日を試験日とし、ほぼ6か月を試験期間とすると、約9,000 名を試験するのに3か所の試験場が必要である。
結論
OSCEは医師の診療実技を適正に評価する妥当性の高い試験である。評価マニュアル を活用すれば、評価者間の評価のばらつきは少ない。試験日や課題の難易度の違いが最終結果(合否判定)に及ぼす影響は少なくできると予想される。信頼性の高い全国規模のOSCEを実施するために、人的資源を勘案して、3つの方法を策定した。(1)試験日を分ける方法(2)external examinerによる方法(3)試験場を一定のところに設置する方法
公開日・更新日
公開日
-
更新日
-