这家上海AI企业CVPR挑战赛夺冠,能识别多种类木薯疾病

澎湃新闻记者 王心馨
2019-06-24 17:51
来源:澎湃新闻

对于研究人工智能的团队来说,一年一度的CVPR是最佳的展示舞台,也是检验自家技术水平的最佳场地。

在今年的CVPR上,来自上海的一家人工智能公司——深兰科技DeepBlue,在Cassava Disease Classification挑战赛中,从全球88个团队提交的超过1300份方案中脱颖而出,拿下冠军。

国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术,是世界顶级的计算机视觉会议之一。每年被收录的论文均来自计算机视觉领域顶级团队,代表着国际最前沿的科研技术,并指引着计算机视觉领域未来的研究方向。Cassava Disease Classification挑战赛由FGVC举办,作为计算机视觉顶会CVPR的Workshop,其全称为Fine-Grained Visual Categorization(细粒度图像分类),是机器视觉社区刚刚开始解决的最有趣和最有用的开放问题之一。

CVPR挑战赛冠军

据了解,深兰科技DeepBlueAI团队参赛的是FGVC6中的Cassava Disease Classification挑战赛,是一个根据木薯的叶子区分不同种类的木薯疾病的任务。本次参与者需要使用主办方提供的9436张标记和12595张未标记图片进行训练数据。目标是学习一个模型,使用训练数据中的图像将给定的图像分类为这4个疾病类别或健康叶子的类别。

关于细粒度图像分类及用途,简单来说,普通的分类问题只专注于区别出目标的大类,比如猫和狗,花和树等。但是细粒度分类需要识别并区分非常精细的子类别。例如深兰的商品识别模型中,不仅需要像一般识别问题那样检测出例如苹果,菠萝的大分类,同时还需要检测出具体属于哪一类苹果,如富士,烟台等。而通常属于不同子类别的识别是非常相似的,例如富士,秦冠,富寒等等,我们不仅需要整体信息来识别它是“苹果”,同时还需要局部信息来确定“苹果”的品种。

据深兰科技介绍,针对本次参赛训练样本较少问题,深兰科技AI团队除了利用交叉验证和传统的数据增强方式,还使用了RandomErasing和Cutout的方式,降低过拟合的风险并提高了模型鲁棒性,使用了Mixup和label smoothing的训练策略,将Top1准确率提高近一个百分点,使得计算损失函数时有效抑制过拟合现象。同时团队还利用SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照归一化后权重的融合,最终以0.95的阈值筛选出一半的数据作为添加到训练集的伪标签数据,通过实验证明了在训练集中添加伪标签后模型的泛化能力有显著提升。

综合以上种种策略,深兰科技AI团队最终成功完成Cassava病变细微差别区分任务,并以0.9386的分数获得冠军,领先第二名0.00309。

细粒度图像分类技术大量落地应用

虽然这样的差距看起来不大,在工业领域却可能是可用与否之别,放到医疗领域,甚至可能把“救命”AI向前推进一大步。

以深兰AI工业监测应用为例,细粒度图像分裂技术已经实现了零件表面粗糙度超标识别,机加毛刺识别,机加接刀痕识别,线切割过切识别,以及零件碰伤,折叠,机加后殘余黑皮,开裂,机加工崩刀痕等等复杂环境下的监测识别。

另外,细粒度图像分类研究方法还可以应用在高速公路上识别不同车辆的型号、在城市管理中识别不同车辆违规停放、在野外识别不同物种、在商店购物时识别不同的商品,细粒度图像分类在这些任务里面都扮演着极为重要的角色。

深兰科技于2014年诞生在上海,设立以来,该公司一直强调自己“致力于人工智能基础研究和应用开发”。此外,深兰科技还把自己定位为一家“平台型的AI MAKER”。官方资料显示,深兰科技在人工智能领域的布局极为广泛,公司的核心技术包括:计算机视觉、自动驾驶、生物智能、语义智能,所覆盖的应用领域有:智能驾驶、智能机器人、生物智能、智能零售、智能语音、安防、芯片、教育和智能城市。

    责任编辑:李跃群