NLPCC2019会议于敦煌成功举办
十一长假后第一周,由中国计算机学会中文信息技术专委会举办的 NLPCC2019 及系列学术活动在敦煌古镇成功举办。
NLPCC从2011年开始举办,至今已成功举办 8 届;尽管举办时间很短,但成长却很迅速,在今年4月最新的CCF推荐国际学术会议和期刊目录中 NLPCC被评选为 C类会议,这说明其质量已经在NLP领域具备国际影响力,已然成为国内(甚至国际)中文 NLP领域最为重要的会议之一。
本次会议参会人数达610人,汇聚了众多国内外NLP领域的知名学者。
一、录取情况及研究趋势
NLPCC 2019正会开始于10月13日,在此之前与会师生已经经过了为期3天的前沿科学讲习班ADL 107期(这也是CCF长期举办的一个特色活动)以及1 整天的workshop。
在开幕式上,作为主办方之一,敦煌研究院副院长张先堂首先简单介绍了莫高窟的基本历史情况和研究情况。随后大会联合主席 Ken Church发表了大会开幕致辞。Ken指出NLPCC虽然历史并不如敦煌那么悠久,但无论是在国内还是国外都具有重要的影响力。
联合PC Chair 靳民彦 & 唐杰
来自新加坡国立大学的Min-Yen Kan(靳民彦)教授作为本届会议的联合程序主席,介绍了本届会议的基本情况。
总投稿数是550篇,有效总投稿492篇;主会有效投稿451篇、workshop投稿41篇。
本届主会投稿数量相较去年增加了46%;其中英文投稿343篇(增长75%),中文投稿108篇(增长2%)。如此规模的投稿数量无论在国内还是国际上都屈指可数。 在451篇主会投稿中,接收长文(Full paper) 92篇,录用率为20.40%;接收短文(short paper)38篇,录用率8.4%。包括workshops投稿在内的NLPCC 2019投稿的长文录用率为20.93%;短文10.98%。从录取比例可以看出,NLPCC会议为保证会议质量,在文章录取上有非常严格的筛选过程。
有意思的是,在NLP应用等领域论文投稿论文数量非常多,而像机器翻译、知识图谱等却相对较少。对于论文投稿分析的高潮在于靳民彦教授根据关键词的分析。
值得一提的是,除了主会论文外,另有workshop投稿50多篇,其中由西湖大学张岳教授和中科院自动化所张家俊研究员组织的student workshop接收了4篇论文,由北大孙薇薇副教授和微软段楠研究员组织的Evaluation workshop 接收了14篇论文,另外Explainable AI workshop接收了9篇论文。
二、讲了什么
本届会议分为前后两个阶段。在NLPCC正会开始之前,从9日至11日在莫高窟研究院,由百度自然语言处理部首席科学家吴华、复旦大学张奇教授、北京大学万小军教授主持举办了为期三天的前沿科学讲习班ADL 107期。这也是CCF长期举办的一个特色活动,
京东AI研究院何晓冬博士
本次ADL共有6个报告,每个报告各半天。报告人分别为字节跳动AI实验室的周浩博士和李磊博士、微软亚洲研究院刘树杰研究员、伊利诺伊大学芝加哥分校的刘兵教授、京东AI研究院何晓冬博士、清华大学刘知远副教授、清华大学张敏副教授。详细的授课资料可回复「NLPCC2019」下载。 随后 12日在敦煌华夏国际酒店中进行了为期 3 天的 NLPCC 会议。12日,分别进行了Evaluation Workshop、Student Workshop、Explainable AI workshop。其中哈工大车万翔教授的《What is the core competence of NLPer?》:
车万翔报告
中科院自动化所宗成庆研究员的《Distributed Representations and Neural Decoding》:
宗成庆报告
以及苏州大学张民教授的《Natural Language Processing and Sentiment Analysis》:
张民报告
这些报告给听众极大的启发。
13日-14日,共进行了四场keynote演讲、四场工业演讲以及会议论文 oral 。
苏克毅Keynote演讲
作为首场报告,来自台北中央研究院信息科学研究院的苏克毅教授做了关于《 On Integrating Domain Knowledge into DNN》,在演讲中苏克毅教授指出了DNN存在的局限性,并针对给定任务提出了增强DNN的方法。
Mark Liberman Keynote演讲
宾夕法尼亚大学的Mark Liberman教授做了主题为《 Clinical Applications of Human Language Technology:Opportunities and Challenges》,介绍了利用NLP技术进行医疗数据挖掘的研究,以及一些非常具有启发性的初步结果,并讨论了未来研究的机遇和挑战。
夏飞 keynote 演讲
华盛顿大学的夏飞教授演讲的主题为《NN is great, but NLP is not equal to NN》。在演讲中,夏飞教授集中讨论了神经网络(NN)很少解决的两个问题:数据标注和专家知识的重要性,并用临床NLP为例进行了说明。她指出,仅靠神经网络并不能解决NLP的所有问题,因此对于NLP领域的研究者来讲,在顺应神经网络大潮的同时不应当放弃其他基础研究方向。
宋大为 keynote 演讲
来自北理工的宋大为教授的报告则更为新颖的角度,其主题为《A quantum cognitive perspective for informationaccess and retrieval》,即量子认知,借用量子力学的方法和语言来进行认知、信息获取等的研究。值得一提的是,宋大为以及天津大学的张鹏也是目前国内少数几位将量子力学与NLP结合起来研究的学者。
三、换届及来年举办地
由于CCF 中文信息技术专委会每四年一换届,因此本年度也将成为该专委会的换届年,同时专委会也将更名为“自然语言处理及中文计算专委会”。微软研究院常务副院长周明博士从2016年起担任专委会主任以来,在专委会秘书长赵东岩等人的支持下,短短数年将NLPCC会议提升到了一个新的高度,在今年年初成功进入CCF列表C类会议,为NLPCC会议作出了巨大的贡献。此外,在周明等人的牵头下,CCF 中文信息技术专委会与中国中文信息学会从2016年起联合举办了“语言与智能高峰论坛”,每年一次,已经成功举办了四届,这也迅速成为当前国内 NLP 领域最前沿思想交流与碰撞的一个大舞台。
接替周明和赵东岩,CCF 中文信息技术专委会下一届专委会主任是苏州大学周国栋教授,专委会秘书长是北京大学万小军教授。
去年经过专委会无记名投票决定NLPCC 2020在郑州举办,由郑州大学承办。来自我校自然语言处理实验室的穆玲玲副教授做了汇报。欢迎大家参加NLPCC 2020,期待明年的胡辣汤。