2018年10月22日至10月26日,信工所信息内容安全技术国家工程实验室博士研究生方山城赴韩国首尔参加了2018 ACM多媒体会议(ACM Multimedia 2018)。研究所文章《Attention and Language Ensemble for Scene Text Recognition with Convolutional Sequence Modeling》被本次会议接受,文章提出了一种基于编码器解码器的注意力机制模型用于自然场景文本识别任务,其中以卷积的方式应用于解码器以提高识别性能,避免循环解码器面临的瓶颈。此外,该方法分别从视觉线索及语言规则两方面集成识别文本,在多个基准场景文本识别数据集取得state-of-the-art精度。
会议期间,方山城通过会议报告和海报两种形式对该研究成果进行了介绍,并同与会专家进行了深入交流,对于同领域研究者提出的关于算法细节等问题进行了详细的回答与讨论。
ACM Multimedia是一年一度的学术会议,自1993年以来每年举办一次,是中国计算机学会(CCF)A类会议。ACM Multimedai有着较为严格的录用标准,今年ACM Multimedia会议长文整体的录取率约为27%。