芯片微缺陷检测数据集(YOLO格式)

张开发
2026/4/15 12:58:34 15 分钟阅读

分享文章

芯片微缺陷检测数据集(YOLO格式)
摘要本数据集针对芯片制造中微小缺陷检测难、人工检测效率低等问题构建了包含7810张图像、12119个标注框的YOLO格式数据集涵盖划痕、引脚、污染、封装四类缺陷支持5-7像素微小目标的高精度检测模型训练与评估。数据集简介本数据集包含7810张芯片图像和12119个缺陷标注框采用YOLO格式标注划痕、引脚、污染、封装四类微小缺陷支持高精度检测模型训练。数据集概述本数据集专为芯片微缺陷检测任务构建包含7810张高分辨率芯片图像共标注12119个缺陷目标。数据集采用标准YOLO格式涵盖划痕Scratch、引脚Pin、污染Contamination、封装缺陷Package四大类别按7:2:1比例划分为训练集5467张、验证集1561张和测试集782张。所有图像来自真实生产环境缺陷尺寸覆盖5-7像素的微小目标对检测算法的分辨率和精度提出了较高要求。数据集支持主流深度学习框架直接调用可用于目标检测模型的训练、验证和性能评估为芯片制造过程中的智能质量控制提供数据支撑。数据集来源本研究所使用的数据集为芯片微缺陷检测数据集图像数据来源于芯片生产线场景下芯片表面图像的采集、整理与筛选并在预处理后形成适用于目标检测任务的数据集。所有图像均采用YOLO格式进行边界框标注目标类别定义为划痕scratch、引脚pin、污染contamination、封装缺陷package四类共计标注了12119个缺陷实例。整个标注过程遵循统一规范以保证数据标注的一致性和准确性为后续YOLO11-P2-MDH模型训练、性能评估以及系统应用提供了可靠的数据支撑。类别定义标注规范标注采用 YOLO 格式每个目标一行字段为 class x_center y_center width height 坐标均为相对归一化0~1。图1 标注规范图数据规模与划分总图像数7,810张总标注框数12,119个图2 数据集在训练、验证和测试集上的分布数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集图3 数据集划分及用途说明质量控制标注采用双阶段质量控制流程首先进行规范化标注与自检 确保目标框贴合实例外接矩形且类别一致随后进行抽样复核 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认 以提高跨标注者一致性与总体标注可靠性。数据格式与使用数据集采用标准 YOLO 格式组织通过 data.yaml 配置文件即可快速集成到训练流程中。目录结构数据集采用标准 YOLO 格式组织图像和标注文件分别存放在 images/ 和 labels/ 目录下并按训练集、验证集、测试集划分。性能评测基于 YOLO11 模型在本数据集上进行训练和评测使用mAP0.5与mAP0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下训练过程综合指标曲线图图3 训练与验证指标随Epoch变化趋势图精确率-召回率PR曲线图图4 目标检测PR曲线Precision-RecallF1分数-置信度阈值曲线图图5 不同置信度阈值下的F1曲线归一化混淆矩阵图分类误判分析图6 归一化混淆矩阵person / leaflet应用案例案例1基于改进YOLO11算法的芯片微缺陷检测系统图7 应用案例基于改进YOLO11算法的芯片微缺陷检测系统免责声明与引用数据仅用于科研与教学用途。若用于商业场景请自行核验数据许可。 如需引用请在论文或报告中注明数据集名称与版本号。作者信息作者Bob (张家梁)项目编号Datasets-19数据大小886M原创声明本项目为原创作品

更多文章