logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习训练数据标注质量对计算机模型效果的影响

标注错误、模糊或不一致的标签会直接影响模型的训练过程,导致模型性能下降、泛化能力不足。标注质量与模型效果呈正相关关系,标注错误率每增加1%,模型准确率可能下降2-5%。标注一致率:不同标注者对相同样本给出相同标签的比例。标注不一致:相同样本在不同标注者手中得到不同标签。建立详细的标注规范和标准操作流程,确保标注一致性。标注质量影响合成数据的可靠性,进而影响模型训练。标注遗漏:部分样本未被正确标注,

#python
CI/CD:GitLab Pipeline的自动化测试覆盖率提升

在 GitLab Pipeline 中集成覆盖率分析工具(如 JaCoCo、Coverage.py、Istanbul 等),确保每次 Pipeline 运行都能生成覆盖率报告。在项目中定义最低覆盖率标准,并在 Pipeline 中检查是否达标,未达标时标记为失败。在 Merge Request 中检查新代码的覆盖率,避免新增代码降低整体覆盖率。在 Merge Request 中强制要求覆盖率检查通

#python
到底了