文献情報
文献番号
201005020A
報告書区分
総括
研究課題名
厚生労働科学研究成果データベースの検索機能強化に関する研究
課題番号
H22-特別・指定-023
研究年度
平成22(2010)年度
研究代表者(所属機関)
辻井 潤一(東京大学大学院情報理工学系研究科)
研究分担者(所属機関)
- 岡崎 直観(東京大学大学院情報学環)
- 松崎 拓也(東京大学大学院情報理工学系研究科)
- 奥村 貴史(国立保健医療科学院研究情報センター)
- 中村 修(慶應義塾大学環境情報学部)
- 建石 由佳(工学院大学情報学部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 厚生労働科学特別研究
研究開始年度
平成22(2010)年度
研究終了予定年度
平成22(2010)年度
研究費
55,000,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
既存の厚生労働科学研究の研究成果データベースは、研究成果の全文データが収録されておらず、検索機能も制限されていた結果、研究者や政策決定者への情報還元が非効率であるとの懸念が生じていた。また、検索エンジンへの情報提供がなされていないことから、研究成果が一般国民の目に触れる機会も限られていた。そこで、厚生労働科学研究成果の活用促進を図るため、研究成果データベースの機能向上策について検討し、高度な知的検索に対応した厚生労働科学研究成果データベースを研究開発することを目的として開始された。
研究方法
まず、研究成果報告書の効率的なOCR処理について検討し、実際の処理を試みた。また、研究成果報告書の回収実験を試み、研究成果報告書の効率的なデジタル化について検討した。また、検索機能の高度化を目的として、OCR処理された文献に関する知的検索と医学文献からの情報抽出を行う自然言語処理に関する研究を行った。さらに、高度な検索機能を備えた研究成果データベースの研究開発を行い、また、公的データベースを低コストに構築運用していくために、日本のインターネット研究コンソーシアムであるWIDEプロジェクトの協力を得て、研究用クラウド上にシステム構築を行い、評価を試みた。
結果と考察
研究成果報告書のデジタル化に関する研究により、1998?2002年度分の研究成果報告書をデジタル化するとともに、今後の研究成果報告書のデジタル化に向けた提言を行った。また、医学文献に対する知的検索に関する研究により、自然言語処理に求められる注釈作業を効率的に行うツールの公開が出来た。さらに、次世代版厚生労働科学研究成果データベースを開発し、クラウド上で仮設運用を開始することが出来た。これにより、研究開発した技術の検証と研究成果データベースの改良に向けた運用データの収集が可能となる。
結論
科学研究の成果を社会へと還元していく上で研究成果のデータベース化は欠かせない。今回開発した高機能版の研究成果データベースにより、一般国民にも研究成果の広報と普及が促進される。今後、収録資料の網羅性を高めることにより、厚生労働行政に必要な各種統計や学術的知見が効率的に検索、引用できる体制の実現を通じて、我が国が抱えている様々な政策課題の改善に寄与することが期待される。
公開日・更新日
公開日
2011-05-31
更新日
-