上QQ阅读APP看书,第一时间看更新
1.2 答题卡预处理
本案例选择某实际考试的答题复印/扫描图作为实验对象,重点对选择题的答题区域做图像增强处理,提高目标内容的对比度。
如图1-1所示,答题区域集中在试卷头部的网格区域,并且呈现黑白文字图的特点,因此我们可以采用基本的图像灰度化、图像二值化及图像反色来进行预处理,提高区域对比度,关键代码如下所示。
图1-1 答题卡图像示例
程序首先通过imread用于读取指定路径的图像得到数字图像矩阵,rgb2gray用于将RGB图转换为灰度图矩阵;然后通过graythresh用于计算灰度图的otsu阈值,im2bw用于进行二值化变换并反色;最后采用形态学水平闭合操作突出答题区域并通过bwareafilt提取最大面积的连通区域,经imwrite函数写到指定的图像文件。运行后,得到的结果如图1-2所示。
如图1-2所示,通过预处理得到了对比度增强的二值化图,突出了答案区域的文本内容,可以发现答案区域呈现出了网格划分、数字题号、字母答案的特点,并且每个题的答案是单选的A、B、C、D之一,可考虑通过图像分割及模板匹配等方案进行答案定位及识别。
图1-2 答题卡图像预处理