电子科技大学学报  2019, Vol. 48 Issue (5): 643-643   
本期“人工智能”专栏评述    [PDF全文]
程洪, 胡江平, 杨阳

评“基于深度学习的人体解析研究综述”       程    洪

人体解析(human parsing)是计算机视觉领域中一项热门的语义分割技术,其主要方法是通过彩色图像对人体身体部分进行分割,从而达到人体行为识别和行为预测的目的。从该项技术的潜在应用领域来看,我认为人体解析技术在康复医疗、老人监护、运动训练等领域都有很大的潜在应用价值。

我曾经在一个康复医疗论坛上和几位医学专家针对人体运动分析进行了探讨,其中一位康复医学专家就提出了这样一个问题:“医院康复科现有的患者运动评估方法都需要专业的医疗设备对患者进行检查和评估,其过程复杂且不能在患者不知情的情况下进行检查和评估”,于是我便想到了通过计算机视觉技术对患者进行运动评估,而其中人体解析就是实现该技术的关键环节。在行为预测的技术应用上,我认为在老人监护上有非常大的市场应用前景,只要能够基于人体解析技术实现一套老年人跌倒的预测系统,该技术和系统必将会受到各大养老院的青睐。当然,基于视觉信息的人体解析技术目前最大的困扰问题就是其分割和识别准确度,相信在不久的将来也能够应用于一些高精度需求的行业,例如专业运动员的运动分析。

本文主要对基于深度学习的人体解析研究进行了综述,从基础技术、数据集、评价标准的现状、趋势和挑战都进行了全面的分析,对于人体解析技术感兴趣的读者,本文将是你对人体解析技术研究现状进行全面了解的窗口。

评“上下文感知推荐系统:挑战和机遇”       胡江平

几天前刚在某电商网站上浏览了几件商品,这几天登录网站都是这些相关的推荐。哈哈,相信大家都有这样的体验。不懂推荐系统背后原理的人会觉得,“哇!这原来就是传说中的人工智能啊,好了解我哦”。比较懂行的人会问:“这个推荐系统用的是哪个算法啊?”

这篇论文给大家带来了耳目一新的推荐系统前沿技术介绍。我们知道,尽管大多推荐系统考虑了用户和物品的交互行为,但没有考虑到与用户和物品相关的上下文信息,难以提高推荐的准确度和用户的体验。上下文感知推荐系统可以更深入地挖掘用户的兴趣、活动规律、与其他用户的相似性以及和物品之间的关联性,从而实现针对用户个性化需求的主动推荐。这篇文章围绕上下文信息推荐算法,不仅详细介绍了上下文感知系统的主要概念,总结了可用于上下文推荐的六类主流技术,而且分析了上下文收集、动态上下文管理、上下文集成、可用的面向上下文数据集、对推荐系统基本问题的解决方案、验证标准的统一等方面的挑战性问题和研究趋势。相信本文会对有志于从事推荐系统研究的学者带来重要启发和思考。

评“基于对抗生成网络的多风格化的汉字”       杨    阳

5年前,生成对抗网络(GAN)在深度学习领域掀起了一场革命。这次革命取得了一些重大的技术突破。

首先,生成对抗网络是无人监督的,它不需要标记数据,这使得生成对抗网络功能很强大,因为不需要进行枯燥的数据标签工作。其次,潜在用例有很多。他们可以生成高质量的图像,可以增强照片,可以从文本生成图像,可以将图像从一个领域转换为另一个领域,随着年龄的增长可以改变脸部图像的外观等等。而汉字字体合成领域的研究,一直受限于汉字的结构复杂性以及汉字的字体多样性,这使得在GAN出现之前,汉字字体合成领域的研究都处于不温不火的阶段。随着生成对抗网络的到来,中文字体转换领域的研究越来越多。

该文即是一篇将汉字与对抗生成网络相结合的文章,文章由浅入深地讲述了通过对抗生成网络实现汉字的多风格转化。展示了通过一个生成对抗网络就产生了许许多多不同风格的汉字字体,相比以往的汉字转换模型有了很大程度的提高。该文至少有三点是非常值的一读的:1)文章提高了汉字图像的生成质量,解决了以往生成的图像模糊的问题;2)以往的模型一次只能学习和生成一种目标字体,而该文的模型一次可以生成多种目标字体;3)该文的模型由于可以一次转换成多种风格的字体,所以可以通过结合不同风格字体生成全新的字体。希望读者能从中感受到生成对抗网络带给汉字处理领域的奇妙变化。