多機能高精度自動点訳エンジンの開発

文献情報

文献番号
201027028A
報告書区分
総括
研究課題名
多機能高精度自動点訳エンジンの開発
課題番号
H20-感覚・一般-001
研究年度
平成22(2010)年度
研究代表者(所属機関)
石川 准(静岡県立大学 国際関係学部)
研究分担者(所属機関)
  • 宮本 修(筑波技術大学障害者高等教育研究支援センター)
研究区分
厚生労働科学研究費補助金 疾病・障害対策研究分野 障害者対策総合研究
研究開始年度
平成20(2008)年度
研究終了予定年度
平成22(2010)年度
研究費
8,500,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
高度化するニーズに答える多機能高精度自動点訳システムを開発する。
研究方法
22年度は以下の研究を行った。
1.点訳精度向上のための新しい形態素解析手法の研究
2.点訳分かち書き誤りの発見の研究
結果と考察
点字コーパスによる点訳分かち書き誤り検出技術を開発し、その性能を評価し良好な結果を得た。今後点訳コーパスによる点字分かち書き修正機能を市販の自動点訳エンジン等に実装していく。さらに点字コーパスは読み下しの誤りを減らすためにも利用できる。
一方、最新の形態素解析エンジンを改良して試作した自動点訳エンジンは、現段階では既存の点訳エンジンの変換精度に達しなかった。高い変換精度を達成するには、形態素解析の性能に加えて、コーパスまたは辞書の性能、例外処理など、多くの労力を要する。
結論
点訳コーパスによる分かち書き誤り判別技術には新規性があり、学術的価値があると考える。
一方読みの精度向上には、辞書の整備と形態素解析アルゴリズムの改良を地道に継続する必要があり、分かち書き誤りの修正のような顕著な効果を短期間で実現する方法はいまのところ見当たらない。ただし、点字コーパスは読みの確からしさの評価にも応用できると期待できるので、今後既存点訳システムに実装してその有効性を検証する計画である。

公開日・更新日

公開日
2011-06-09
更新日
-

研究報告書(紙媒体)

公開日・更新日

公開日
2018-02-15
更新日
-

文献情報

文献番号
201027028B
報告書区分
総合
研究課題名
多機能高精度自動点訳エンジンの開発
課題番号
H20-感覚・一般-001
研究年度
平成22(2010)年度
研究代表者(所属機関)
石川 准(静岡県立大学 国際関係学部)
研究分担者(所属機関)
  • 宮本 修(筑波技術大学障害者高等教育研究支援センター)
研究区分
厚生労働科学研究費補助金 疾病・障害対策研究分野 障害者対策総合研究
研究開始年度
平成20(2008)年度
研究終了予定年度
平成22(2010)年度
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
高度化するニーズに答える高精度自動点訳技術の開発
研究方法
1.Open XML等の構造情報を自動点訳に利用するための点訳XMLの策定とその有効性評価の研究
2.点訳精度向上のための新しい形態素解析手法の研究
3.点訳分かち書き誤りの発見の研究
以上の成果に基づき多機能高精度自動点訳システムを開発する。
結果と考察
2-3 結果と考察
点字コーパスによる点訳分かち書き誤り検出技術を開発し、その性能を評価し良好な結果を得た。今後点訳コーパスによる点字分かち書き修正機能を市販の自動点訳エンジン等に実装していく。さらに点字コーパスは読み下しの誤りを減らすためにも利用できる。
一方、最新の形態素解析エンジンを改良して試作した自動点訳エンジンは、現段階では既存の点訳エンジンの変換精度に達しなかった。高い変換精度を達成するには、形態素解析の性能に加えて、コーパスまたは辞書の性能、例外処理など、多くの労力を要する。
構造化点訳xmlの仕様を策定し、OpenXMLドキュメント等からのインポート機能を既存の点訳システムに実装し、構造情報、レイアウト情報を利用する自動点訳の「読みやすさ」向上を確認した。
結論
2-4 結論
点訳コーパスによる分かち書き誤り判別技術には新規性があり、学術的価値がある。
一方読みの精度向上には、辞書の整備と形態素解析アルゴリズムの改良を地道に継続する必要があり、分かち書き誤りの修正のような顕著な効果を短期間で実現する方法はいまのところ見当たらない。ただし、点字コーパスは読みの確からしさの評価にも応用できると期待できるので、今後既存点訳システムに実装してその有効性を検証する計画である。

公開日・更新日

公開日
2011-06-09
更新日
-

行政効果報告

文献番号
201027028C

成果

専門的・学術的観点からの成果
大量点字コーパスによる点訳分かち書き誤り検出技術を開発し、性能を評価し良好な成績を得た。
また構造化点訳xmlの仕様を策定し、OpenXMLドキュメント等の構造情報、レイアウト情報を利用する自動点訳手法を確立した。
さらに医学等の自動点訳用専門辞書を整備した。
臨床的観点からの成果
本研究での該当なし
ガイドライン等の開発
本研究での該当なし
その他行政的観点からの成果
本研究での該当なし
その他のインパクト
著作権法が改正され視覚障害者情報提供施設による書籍の電子テキスト化作業が始まった。出版される電子書籍のアクセシビリティの実現の可能性もある。また国立国会図書館はオンライン電子書籍の電子納本を計画している。ますます多くの書籍や資料がテキストデータとして利用可能になり、それだけ高精度の自動点訳へのニーズはいっそう高まっている。本研究はそのようなニーズに一定程度応えられたものと思う。

発表件数

原著論文(和文)
0件
原著論文(英文等)
0件
その他論文(和文)
1件
宮本 修,視覚障害者のための情報支援システムに関する研究,早稲田大学大学院先進理工学研究科 博士論文
その他論文(英文等)
0件
学会発表(国内学会)
0件
学会発表(国際学会等)
0件
その他成果(特許の出願)
0件
「出願」「取得」計0件
その他成果(特許の取得)
0件
その他成果(施策への反映)
0件
その他成果(普及・啓発活動)
0件

特許

主な原著論文20編(論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る)

公開日・更新日

公開日
2015-05-29
更新日
-

収支報告書

文献番号
201027028Z