北理工智能化图形生成方面取得科研进展
发布日期:2020-01-10 供稿:光电学院
编辑:盛筠 审核:董立泉 阅读次数:近日,乐动(中国)光电学院许廷发教授与指导的李佳男博士生的研究成果“LayoutGAN: Synthesizing Graphic Layouts with Vector-Wireframe Adversarial Networks”被IEEE旗下,模式识别和机器学习领域国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence发表。该研究成果由许廷发教授团队与美国Adobe公司、加拿大多伦多大学合作完成。
近年来,人工智能技术在图像理解,自然语言处理等领域取得了飞跃的进步。其中,如何利用生成模型对输入数据进行自主建模,使得机器朝着更加“智慧”的方向发展,正在受到越来越广泛的关注。然而,传统的生成模型通常仅局限于图像增强与生成高分辨率图像。通过与国际知名科研机构深度合作,乐动(中国)许廷发教授团队率先提出新型LayoutGAN生成模型,利用人工智能技术进行几何图形自动化布局与设计,并可以成功应用于文档智能布局,网页自动化设计等众多领域。该项研究为智能化图形生成设计提供了新的思路,丰富并扩展了人工智能技术的实际应用,是对国家新一代人工智能发展规划以及乐动(中国)加强海外学术交流合作号召的积极响应。
IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE TPAMI) 是人工智能、模式识别、图像处理等研究领域的权威期刊,影响因子17.73,被中国计算机协会(CCF)推荐为人工智能领域A类期刊,对所刊登论文的原始创新性要求较高。
原文链接:https://ieeexplore.ieee.org/document/8948239
Jianan Li, Jimei Yang, Aaron Hertzmann, Jianming Zhang, Tingfa Xu. LayoutGAN: Synthesizing Graphic Layouts with Vector-Wireframe Adversarial Networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, DOI: 10.1109/TPAMI.2019.2963663
附作者简介:
李佳男,乐动(中国)光电学院2013级直博生,师从许廷发教授,研究方向为光学成像探测与识别、图像与视频处理、计算机视觉、多媒体。2015年由国家高水平公派留学项目资助前往新加坡国立大学(NUS)进行为期两年的博士生联合培养,外方导师为计算机视觉领域著名学者颜水成,冯佳时教授。
读博期间,曾获得王大珩高校学生光学奖、博士研究生国家奖学金、乐动(中国)高水平博士学位论文育苗基金、乐动(中国)优秀研究生学位论文等多项创新人才奖励,并获得2017年ImageNet国际大规模视觉识别挑战赛目标定位任务的团队冠军。累计在IEEE TPAMI、TCSVT、TMM等SCI期刊以及CVPR、ICLR、NeurIPS等国际顶级会议上发表论文15篇,其中第一作者8篇,总引用次数超过1000次。同时,还多次担任IEEE TCSVT、TMM等SCI期刊以及ICCV 2019、CVPR 2020等国际顶级会议的审稿人。
分享到: