
双赢彩票 > 科学研究 > 学术看板 > 正文


供稿:    责任编辑:安果    时间:2018-05-18    阅读:





Title:Bridging image, language and knowledge: explorations into vision and language interactive tasks

摘要:语言是人类交流和储存知识的重要方式之一,自然语言理解在人工智能领域具有举足轻重的地位。作为机器智能水平的一个标志性测试手段,图灵测试就需要机器通过自然语言的方式与人进行互动。近期,图像与语言的交互问题受到计算机视觉和自然语言处理领域研究者的广泛关注,其中比较重要的问题包括“看图说话”(Image Captioning)、“视觉问答”(Visual Question AnsweringVQA)和“视觉对话”(Visual Dialog)等。在报告中,讲者将介绍在这些问题上的研究工作,特别是将图像内外的符号化的高层次语义信息引入图像与语言交互任务中的一些探索。

AbstractLanguage is one of the most important means that human use to communicate and encode knowledge. In artificial intelligence, natural language processing also plays a fundamental role. As a key measure of AI, Turing test is too based on question answering.

Recently, vision and language interactive problems has given rise to increasing attentions in the CV and NLP communities, key tasks including image captioning, visual question answering and visual dialog. In this report, I will introduce my work on these problems, in particular the efforts that try to incorporate symbolic semantic information into vision and language interactive tasks.

王鹏,2000~2011年在北京航空航天大学自动化科学与电气工程学院学习并获得学士和博士学位,博士毕业后在澳大利亚阿德莱德大学计算机学院从事科研工作,同年加入西北工业大学计算机学院担任教授。主要从事计算机视觉、机器学习与人工智能等领域的研究工作。在TPAMIIJCVCVPRICCV IJCAI等期刊和会议发表论文若干。研究兴趣包括图像与语言交互、目标检测与识别等。