【AI-CAMP三期实践项目:万象城管项目/街头散发小广告检测】

项目信息

2021-08-14T16:00:00Z

  • 项目名称:街头散发小广告检测
  • 定义: 街头散发小广告
  • 真实价值:在城管业务中自动检测街头散发小广告检测,给城管业务提供功能项,满足客户需求
  • 相关wiki链接/文档/code:
    • 街头散发小广告检测清洗文档:[TODO]
    • 街头散发小广告检测标注文档:[TODO]
    • 相关code路径:[TODO]

小组成员

@licheng03 (负责:数据清洗/采集,模型训练)
@hejun0 (负责:模型训练,逻辑ppk, 算法仓)

项目现状

  • 正在进行数据爬取
  • 熟悉算法仓封装流程

需要重点考虑问题

  • 如何提高模型训练点数
  • 相关数据量少如何优化

研究计划细化目标

  • 采集/标注数据(1周) 2021-07-15T16:00:00Z
  • 训练集/验证集/测试集构建(半周) 2021-07-24T16:00:00Z
  • 扩充数据/数据增强(1周) 2021-07-31T16:00:00Z
  • 检测/分类模型训练(含优化,2周)2021-08-14T16:00:00Z
  • 逻辑ppl完成并在测试集上测试点数(含优化,1周) 2021-08-21T16:00:00Z
  • 算法仓封装,测试(1周) 2021-08-28T16:00:00Z

评价指标/结果

TODO

08-05:数据已经标注完,正在处理数据集,创建 codebase. 风险:数据集比较小,可能对模型训练有影响。

08-05

通过 Data++ 提了爬取数据的需求,总共爬取了8675张图,有标注框的图是957,数据可能有点少,1:1 构建训练,测试集。

使用 MegEngine retinanet 训练

可视化实验

通过 rlaunch 申请 GPU 资源,可视化训练中的 loss 变化,记录实验过程:

测试集

推理

通过 AIS 跑训练

当前问题

  • 数据量太小,可能需要再爬取,标注一批数据