SQSマークシートの解読率を上げ、確認作業を楽にするツール
SQSマークシートは、学校評価制度などで最近多く使われるようになりました。マークシート作成用のJavaツールで作成したマークシートのPDFからマークシートを印刷し、対象者に鉛筆などでマークして貰って回収し、自動フィード付きのスキャナでスキャンした画像を、マークシート解析用のJavaツールに読み込ませて、どこにマークされたかを解析するツールです。
鉛筆のカーボンを検出するような大規模な装置は不要で、印刷機とAFD(自動フィード)付きのスキャナと、WindowsPCのみでマークシートアンケート(や、小テストなど)を行うことを可能にしています。
この記事では、この読取り画像に一工夫することで、解読率を上げるツールを開発したので、その紹介をすることを目的としています。
実は、SQSマークシートツールは、2016年に更新された改訂版で、とても読取効率が向上して、四隅の四角いマークについては、殆どノイズを拾わなくなったため、濃度を上げてスキャンするだけでもエラーの回避は圧倒的に向上していますが、当ツールでは、薄い鉛筆で丁寧に塗られているマークについての読み取り率については、未だアドバンテージがあると考えています。
グレイスケールでスキャンして、部分的に閾値を変えて白黒2値化する
SQSマークシートは、四隅の黒い四角形(正方形や長方形)でマークシート全体の位置を読取り、PDF(というか、PDFに添付された編集データ)により、マークの位置の白黒を判別しているようです。
四隅の黒い四角形が正しく読み取れないと、その用紙全体が読取り不可になるので、目視の確認が大変になります。
この部分はあらかじめ黒インクで印刷してあるので、印刷汚れや落書きが無ければ、適切な濃度でスキャンすれば読み取りエラーはほぼ100%回避できます。
マークシートの部分は、できるだけ薄い濃度のマークも黒くして読み取れば、読み取りエラーを減らすことができます。
それなら、外側の黒い四角形のマークを含む額縁状の部分を濃い色の閾値で白黒2値化して、内側の鉛筆でマークする部分を薄い灰色の閾値で白黒2値化して、両方のエラーを減らすことを自動で行ってから、それを改めて読み取りソフトで読み取らせればよいのはないか、と考えました。
やり方は、本ツールの「ここにスキャン画像の入ったフォルダをドラッグ&ドロップ」と書いてある枠に、画像の入ったフォルダをドラッグ&ドロップして、「白黒2値化」ボタンをクリックします。
読取アプリを使った後の確認作業を効率化する
SQSマークシート読取アプリ(最新版は、MarkReader-2.1.3-SNAPSHOT-jar-with-dependencies.jar)で読取を行ったときに出力されるエクセルファイルで出たエラーを実際のスキャンデータと照らし合わせて確認したい際は、3列目(C列)に表示されている画像データファイル名と照らし合わせて、画像データを開くか、もしくはスキャン後の紙をめくって比較する必要があります。
そのとき、画像ファイルを目視で探すのが意外に大変なので、セルに画像ファイルへのリンクを付けて、ワンクリックで、画像ファイルが開ける様にするようにしてみようと思いました。
やり方は、出力されたエクセルファイルを一つだけ開いた状態で、本ツールの「画像リンク」ボタンをクリックします。
画像ファイル名の部分に、画像ファイルへのリンクが貼られ、空白セルや、複数回答セルを検出した画像ファイルの色がピンク色になります。ただし、択一選択の設問に限ります。
画像ファイル名の部分にリンクが貼られたため、ワンクリックで目的の画像ファイルが開く