2022年8月22日至25日,第23届IEEE工业技术国际会议(The 23rd IEEE International Conference on Industrial Technology, ICIT’22)传来喜讯,计算智能小组邓国伟和涂静正两位同学的合作论文“Knowledge-Based Scene Text Recognition for Industrial Applications”荣获最佳学生论文奖。
针对工业场景下拍摄的文字图像中存在背景杂乱、频繁遮挡、文字形变、文字磨损等问题,两位同学提出了一种将先验知识引入文字识别模型的方案,获得了评审委员会的肯定。该方案首先通过对现有工业标准的大量调研,从中抽象出两种具有普遍性的特点——文字序列分组特点以及先验字典分类特点,用于描述工业文字中的先验知识,并进一步设计了一种基于先验知识的语言模型,包含分组关联模块以及基于字典的预测模块,能够有效地协助视觉文字识别模型,显著降低识别错误。另外,该方案利用前述先验知识的特点,设计了一种新的针对工业场景文字的数据增强方法,有效地降低了算法对于数据标注的依赖性,在数据集规模受限的条件下进一步提高了算法的精度。
计算智能小组设立之初即面向“先进计算”与“人工智能”,探究创新性的智能算法与应用。未来,中心将继续在工业人工智能领域加大投入力度,招募更多优秀的教师与学生,鼓励交叉创新。 |