答题卡识别
实例内容:
- 该实例实现了一个基于计算机视觉技术的答题卡自动识别与评分系统,利用 OpenCV 库对答题卡图像进行处理和分析,最终得出答题卡的得分。
实例步骤:
- 导入必要的库
import numpy as np
import cv2
导入numpy用于数值计算,cv2即 OpenCV 库,用于图像处理和计算机视觉任务。
- 定义答案键和辅助函数
ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}
定义了一个答案键字典,其中键表示题目序号,值表示正确答案选项。同时定义了几个辅助函数:
sort_contours:用于对轮廓进行排序,可以按照从左到右、从右到左、从上到下、从下到上等方式排序。
order_points:对四个点进行排序,使其按照左上、右上、右下、左下的顺序排列。
four_point_transform:进行透视变换,将图像校正为鸟瞰视角,方便后续处理。
- 图像预处理
image = cv2.imread(r'./images/test_01.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 75, 200)
读取答题卡图像。
将图像从 BGR 颜色空间转换为灰度颜色空间。
对灰度图像进行高斯模糊处理,减少噪声。
使用 Canny 边缘检测算法检测图像的边缘。
- 轮廓检测与透视变换
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[-2]
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
for c in cnts:
peri = cv2.arcLength(c, True)
approx = cv2.approxPolyDP(c, 0.02 * peri, True)
if len(approx) == 4:
docCnt = approx
break
warped_t = four_point_transform(image, docCnt.reshape(4, 2))
检测图像的轮廓,并按面积从大到小排序。
遍历轮廓,找到近似为四边形的轮廓,该轮廓即为答题卡的边缘。
使用透视变换将答题卡图像校正为鸟瞰视角。
- 阈值处理与圆圈轮廓检测
warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1]
questionCnts = []
for c in cnts:
(x, y, w, h) = cv2.boundingRect(c)
ar = w / float(h)
if w >= 20 and h >= 20 and 0.9 <= ar <= 1.1:
questionCnts.append(c)
将透视变换后的图像转换为灰度图像。
使用 Otsu 自适应阈值处理将图像转换为二值图像。
检测二值图像中的轮廓,筛选出符合条件(宽度和高度大于等于 20,宽高比在 0.9 到 1.1 之间)的圆圈轮廓,这些圆圈即为答题卡上的选项。
- 答案识别与评分
questionCnts = sort_contours(questionCnts, method='top-to-bottom')[0]
correct = 0
for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):
cnts = sort_contours(questionCnts[i:i + 5])[0]
bubbled = None
for (j, c) in enumerate(cnts):
mask = np.zeros(thresh.shape, dtype='uint8')
cv2.drawContours(mask, [c], -1, 255, -1)
thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask)
total = cv2.countNonZero(thresh_mask_and)
if bubbled is None or total > bubbled[0]:
bubbled = (total, j)
color = (0, 0, 255)
k = ANSWER_KEY[q]
if k == bubbled[1]:
color = (0, 255, 0)
correct += 1
cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)
将筛选出的圆圈轮廓按从上到下的顺序排序。
每 5 个轮廓为一组,代表一道题的所有选项。
对于每组选项,创建一个掩码,将每个选项区域提取出来,计算该区域内的非零像素数量,非零像素数量最多的选项即为被选中的选项。
将被选中的选项与答案键进行对比,如果一致则标记为正确,并将正确题目数量加 1。
- 计算得分并显示结果
score = (correct / 5.0) * 100
print("[INFO] score:{:.2f}%".format(score))
cv2.putText(warped_new, '{:.2f}%'.format(score), (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
cv2.imshow('Original', image)
cv2.imshow('Exam', warped_new)
cv2.waitKey(0)
计算得分,得分等于正确题目数量除以总题目数量再乘以 100。
在透视变换后的图像上绘制得分信息。
显示原始图像和处理后的图像,等待用户按键退出。
结果: