目标检测在工厂制造中的创新应用与实践

摘要：在工业 4.0 浪潮推动下，工厂制造正朝着智能化、无人化方向加速转型，而目标检测技术作为机器视觉的核心，成为实现生产过程监控、质量管控与安全保障的关键支撑。

在工业 4.0 浪潮推动下，工厂制造正朝着智能化、无人化方向加速转型，而目标检测技术作为机器视觉的核心，成为实现生产过程监控、质量管控与安全保障的关键支撑。

现在市面的主流技术分2种，一种是老派的基于cnn神经卷积网络实现的，以yolo为代表，已经发展到yolo11版本；另一种是最新出来的基于transformer的DERT方案，以d-fine和deim代表，性能比较高，而且能够识别细小缺陷、模糊物体。

D-Fine：当需求聚焦于高精度工业缺陷检测（如芯片、精密零件）、或面临复杂干扰环境（如强反光、高速运动）时。

YOLOv11：当需要通用目标检测（如安全监控中的人员、设备检测）、追求快速部署与低成本，或场景灵活多变（如同时检测人员违规和简单产品缺陷）时。

核心场景应用集中于两大方向：

一是安全行为检测，实时识别员工违规操作（如未佩戴防护装备、进入危险区域），规避安全事故；

二是产品缺陷检测，精准定位生产过程中的外观瑕疵（如零件裂纹、表面划痕），提升产品合格率。本文将围绕这两大应用场景，结合实际案例与技术实现代码，全面解析在工厂制造中的落地价值。

工厂生产环境中，设备高速运转、危险区域（如机床周围、高压电箱旁）分布广泛，员工的不规范行为（如未戴安全帽、违规跨越护栏）是引发安全事故的主要诱因。传统人工巡检存在 “监控盲区多、响应不及时” 的问题，而 目标检测技术可通过实时分析车间摄像头画面，实现违规行为的秒级识别与预警。

某汽车零部件工厂拥有 20 条冲压生产线，车间内机床设备密集，且存在 “员工未戴安全帽操作”“非授权人员进入冲压区域” 等安全隐患。工厂引入 YOLOv11 目标检测系统后，通过以下方案实现安全管控：

1、硬件部署：在车间关键位置（生产线入口、机床操作台、危险区域边界）安装 4K 高清摄像头，摄像头通过边缘计算设备（NVIDIA Jetson AGX Orin）与 YOLOv11 模型联动，降低数据传输延迟，其部署示意图如图 1 所示：

2、检测目标定义：将 “安全帽（红色 / 黄色）”“员工人体”“危险区域标识线” 作为核心检测目标，标注 5000 张车间违规 / 合规场景图片，构建专属数据集；

3、预警机制：当系统检测到 “员工未佩戴安全帽” 或 “人体跨越危险区域标识线” 时，立即触发三级预警 —— 本地边缘设备发出声光警报、车间管理终端推送实时画面、后台系统记录违规时间与位置，形成闭环管理。

该方案实施后，车间安全违规事件发生率下降 82%，平均预警响应时间缩短至 0.8 秒，有效保障了生产安全。

YOLOv11 的安全行为检测可通过 Ultralytics 库快速实现，以下为关键代码片段，包含模型加载、实时摄像头检测与违规预警逻辑，代码运行界面截图如图 2 所示：

图 2：YOLOv11 安全行为检测代码运行界面截图

from ultralytics import YOLOimport cv2import numpy as npimport timefrom playsound import playsound # 用于声光预警# 1. 加载预训练YOLOv11模型（可替换为工厂自定义训练的模型）model = YOLO('yolov11n.pt') # 轻量化模型n版，适合边缘设备；高精度场景可使用yolov11x.pt# 2. 定义检测目标与违规判定规则# 目标类别映射（参考COCO数据集，可根据自定义数据集调整）class_names = model.namesSAFETY_HELMET = 39 # 安全帽在COCO数据集中的类别ID（可自定义标注）PERSON = 0 # 人体类别IDDANGER_ZONE = [(200, 300), (600, 300), (600, 500), (200, 500)] # 危险区域坐标（需根据实际场景校准）# 报警控制参数last_helmet_WARNING_time = 0last_danger_warning_time = 0WARNING_INTERVAL = 3 # 报警间隔(秒)，避免频繁报警# 3. 初始化摄像头（0为本地摄像头，可替换为网络摄像头RTSP地址）cap = cv2.VideoCapture(0)cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1280)cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)# 4. 辅助函数def is_in_danger_zone(person_center, danger_zone):"""判断人体中心是否在危险区域内（基于多边形点-in-区域算法）"""x, y = person_centern = len(danger_zone)inside = Falsefor i in range(n):j = (i + 1) % nxi, yi = danger_zone[i]xj, yj = danger_zone[j]if ((yi > y) != (yj > y)) and (x = inter_x2 or inter_y1 >= inter_y2:return False# 计算IOUinter_area = (inter_x2 - inter_x1) * (inter_y2 - inter_y1)helmet_area = (h_x2 - h_x1) * (h_y2 - h_y1)# 如果安全帽大部分在头部区域内，则认为佩戴了安全帽return (inter_area / helmet_area) > iou_threshold# 5. 实时检测与违规预警while cap.isOpened:ret, frame = cap.readif not ret:breakcurrent_time = time.timeno_helmet_persons = # 未戴安全帽的人danger_persons = # 处于危险区域的人# 模型推理（conf=0.5为置信度阈值，可根据场景调整）results = model(frame, conf=0.5, imgsz=640)# 解析检测结果，分离人体和安全帽persons = helmets = for result in results:boxes = result.boxes # 检测框信息for box in boxes:cls = int(box.cls[0])conf = float(box.conf[0])x1, y1, x2, y2 = map(int, box.xyxy[0]) # 检测框坐标（左上、右下）center_x = (x1 + x2) // 2center_y = (y1 + y2) // 2if cls == PERSON:persons.append({"box": (x1, y1, x2, y2),"center": (center_x, center_y),"confidence": conf,"wearing_helmet": False})elif cls == SAFETY_HELMET:helmets.append({"box": (x1, y1, x2, y2),"confidence": conf})# 匹配人与安全帽，判断是否佩戴for person in persons:person_box = person["box"]# 检查是否有安全帽戴在这个人身上for helmet in helmets:if is_helmet_on_person(helmet["box"], person_box):person["wearing_helmet"] = Truebreak # 找到匹配的安全帽就可以停止检查# 判断是否在危险区域if is_in_danger_zone(person["center"], DANGER_ZONE):danger_persons.append(person)# 记录未戴安全帽的人if not person["wearing_helmet"]:no_helmet_persons.append(person)# 绘制检测结果for person in persons:x1, y1, x2, y2 = person["box"]# 根据是否戴安全帽和是否在危险区域设置不同颜色if person in danger_persons:color = (0, 0, 255) # 危险区域：红色thickness = 3else:color = (0, 255, 0) # 安全区域：绿色thickness = 2cv2.rectangle(frame, (x1, y1), (x2, y2), color, thickness)# 显示是否佩戴安全帽helmet_status = "With Helmet" if person["wearing_helmet"] else "No Helmet"cv2.putText(frame, f"Person {helmet_status}", (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)# 绘制安全帽for helmet in helmets:x1, y1, x2, y2 = helmet["box"]cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 255, 0), 2)cv2.putText(frame, f"Helmet {helmet['confidence']:.2f}", (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)# 绘制危险区域cv2.polylines(frame, [np.array(DANGER_ZONE, np.int32)], True, (0, 255, 255), 2)cv2.putText(frame, "Danger Zone", (DANGER_ZONE[0][0], DANGER_ZONE[0][1] - 10),cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 255), 2)# 违规预警逻辑 - 未戴安全帽if no_helmet_persons and (current_time - last_helmet_warning_time) > WARNING_INTERVAL:cv2.putText(frame, f"WARNING: {len(no_helmet_persons)} Person(s) Without Helmet!", (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 3)try:playsound("warning_alarm.mp3") # 播放预警音效（需提前准备音频文件）last_helmet_warning_time = current_timeexcept:print("Warning: Could not play alarm sound")# 违规预警逻辑 - 进入危险区域if danger_persons and (current_time - last_danger_warning_time) > WARNING_INTERVAL:cv2.putText(frame, f"WARNING: {len(danger_persons)} Person(s) in Danger Zone!", (50, 100), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 3)try:playsound("danger_alarm.mp3")last_danger_warning_time = current_timeexcept:print("Warning: Could not play danger sound")# 显示实时画面cv2.imshow("YOLOv11 Factory Safety Detection", frame)# 退出逻辑（按下q键关闭）if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源cap.releasecv2.destroyAllWindows

代码说明：上述代码实现了 “安全帽检测”“人体危险区域入侵检测” 两大核心功能，可通过替换yolov11n.pt为工厂自定义训练的模型（基于自有数据集训练），进一步提升检测精度；同时，DANGER_ZONE坐标需根据车间摄像头视角校准，确保区域判定准确。

产品缺陷检测是工厂质量管控的核心环节，传统人工检测依赖员工经验，存在 “漏检率高、效率低” 的问题 —— 例如电子元件的微小裂纹、塑料零件的表面划痕，人工肉眼难以精准识别。目标检测技术 凭借对小目标的高灵敏度检测能力，可实现产品缺陷的自动化、高精度筛查，尤其适用于流水线高速生产场景。

某电子设备工厂生产路由器外壳（ABS 塑料材质），外壳常见缺陷包括 “表面划痕”“边角缺料”“注塑气泡” 三类，此前采用人工抽检（抽检率 30%），漏检率达 15%，且每条生产线需配置 3 名检测员工，成本较高。引入 YOLOv11 缺陷检测系统后，工厂实现了全流程自动化检测，生产线布局如图 3 所示：

检测流程设计：在外壳生产线末端安装 “传送带 + 工业相机（2000 万像素）”，外壳随传送带匀速移动（速度 0.5m/s），相机每 0.3 秒拍摄 1 张图片，图片实时传输至 YOLOv11 检测服务器；数据集构建：收集 10000 张包含 “正常外壳”“划痕缺陷”“缺料缺陷”“气泡缺陷” 的图片，使用 LabelImg 工具标注缺陷位置，按 8:2 比例划分为训练集与验证集，基于 YOLOv11 进行模型微调；缺陷处理机制：若系统检测到缺陷（置信度≥0.7），立即发送信号至传送带分拣装置，将缺陷产品推至 “不合格品区域”，同时记录缺陷类型、生产时间与设备编号，便于后续质量追溯。

该方案实施后，缺陷检测漏检率降至 0.8%，检测效率提升 3 倍，每条生产线减少 2 名检测员工，年节约人力成本约 40 万元。

以下代码基于 YOLOv11 实现电子元件外壳缺陷检测，

from ultralytics import YOLOimport cv2import numpy as npimport serial # 用于与分拣装置PLC通信（需安装pyserial库）# 1. 加载自定义训练的缺陷检测模型（基于工厂数据集训练）model = YOLO('yolov11_defect_detection.pt') # 自定义缺陷检测模型# 缺陷类别定义（与训练数据集一致）defect_classes = {0: "normal", 1: "scratch", 2: "missing_material", 3: "bubble"}# 2. 初始化工业相机（替换为相机实际参数，如分辨率、帧率）cap = cv2.VideoCapture(1) # 工业相机通常为外接设备，索引为1cap.set(cv2.CAP_PROP_FRAME_WIDTH, 2048)cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 1536)cap.set(cv2.CAP_PROP_FPS, 5) # 按生产线速度设置帧率# 3. 初始化与分拣装置的串口通信（实际波特率、端口需与PLC匹配）try:ser = serial.Serial('COM3', 9600, timeout=1) # Windows端口；Linux为/dev/ttyUSB0print("Successfully connected to sorting device.")except Exception as e:print(f"Failed to connect to sorting device: {e}")ser = None# 4. 缺陷检测与分拣逻辑def send_sort_signal(defect_type):"""向分拣装置发送信号：0=正常（不分拣），1=划痕，2=缺料，3=气泡"""if ser and ser.isOpen:ser.write(str(defect_type).encode('utf-8'))print(f"Sent sort signal: {defect_type} ({defect_classes[defect_type]})")while cap.isOpened:ret, frame = cap.readif not ret:print("Failed to read frame from camera.")break# 图像预处理（裁剪ROI区域，聚焦产品，减少背景干扰）roi = frame[300:1200, 500:1500] # 感兴趣区域（需根据相机视角校准）# 模型推理（imgsz=640适配多数硬件，可根据精度需求调整）results = model(roi, conf=0.7, imgsz=640)# 解析检测结果main_defect = 0 # 默认正常（0）for result in results:boxes = result.boxesif len(boxes) > 0:# 取置信度最高的缺陷作为主要缺陷max_conf_idx = np.argmax(boxes.conf.numpy)main_defect = int(boxes.cls[max_conf_idx])x1, y1, x2, y2 = map(int, boxes.xyxy[max_conf_idx])conf = float(boxes.conf[max_conf_idx])# 绘制缺陷框与标签color = (0, 255, 0) if main_defect == 0 else (0, 0, 255)label = f"{defect_classes[main_defect]} {conf:.2f}"cv2.rectangle(roi, (x1, y1), (x2, y2), color, 2)cv2.putText(roi, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)# 发送分拣信号（仅当检测到缺陷时发送）if main_defect != 0:send_sort_signal(main_defect)# 记录缺陷信息（可写入数据库或日志文件）with open("defect_log.txt", "a") as f:log_time = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime)f.write(f"{log_time} - Defect Type: {defect_classes[main_defect]}, Confidence: {conf:.2f}\n")# 显示检测结果（缩放至适合屏幕大小）display_roi = cv2.resize(roi, (800, 600))cv2.imshow("YOLOv11 Electronic Shell Defect Detection", display_roi)if cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源cap.releasecv2.destroyAllWindowsif ser:ser.close自定义模型

我们看看怎么自定义模型：

5 个核心步骤：

数据采集

按 “场景全覆盖” 原则收集（如缺陷检测需包含 “不同光照、不同角度、不同批次产品” 的图片）

数据标注

用 LabelImg 标注后，按 8:2 划分训练 / 验证集，同时检查 “标注准确率”（比如随机抽 100 张，人工复核标注错误率≤5%）；

标注工具

每张图片都会有相应的标注文件

具体标注内容格式

前面的序号代表不同的实体

模型训练

加载 YOLOv11 预训练模型，调整关键参数（如 Epoch=50、Batch Size=16），训练中监控 “损失曲线”（确保验证集损失不持续上升，避免过拟合）；

yaml配置文件

train.py

执行python train.py

等待几个小时；训练出来的结果

best.pt就是我们想要的模型

模型评估

用验证集评估精确度，召回率

执行python val.py

模型导出

导出为工业格式（如 ONNX或TensorRT），导出时可以设置一些参数

格式说明

ONNX: 通用格式，可在多种平台部署TorchScript: PyTorch优化格式，便于在生产环境部署TensorRT (.engine): NVIDIA GPU优化格式，推理速度最快CoreML: Apple设备部署OpenVINO: Intel硬件优化格式

执行预测推理

到此把如何自定义模型，以及如何在工厂制造场景如何用目标检测都已经介绍了，现在市面上有一些商业化产品，把采集、标注、训练、评估、导出、部署集成在一个产品中，一站式的解决方案；非常方便了让我们业务方进行使用，非常傻瓜式；业务方不需要了解太专业的知识，只需要按照步骤进行使用即可。他们的产品的核心思想其实就是老顾介绍的那些。

来源：老顾聊技术

标签：应用工厂 x1 frame helmet

本文地址：http://news.43b.com.cn/a/1254483.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!