中国电信AI手机标准进入2.0时代 AR成主流应用
人工智能的进展之快让人眼花缭乱。在今年5月发布《AI终端白皮书》后,中国电信近日又发布了新一版的《全网通AI手机白皮书》,中国电信AI手机标准进入2.0时代。在最新的2.0版中,新增了计算机视觉、语音处理、增强现实(AR)、用户学习等能力要求,同时提供更多的电信AI能力。
中国电信广州研究院(简称广研院)终端研发中心总经理李宝荣表示,真正意义上的AI手机一定要在终端侧实现深度学习,而对用户的隐私保护和利用5G提升AI终端性能是电信运营商在5G时代新的机遇。
在不久前召开的天翼智能生态博览会上,中国电信与13家厂商共同发布了22款AI手机,这是中国电信发布的第二批AI手机。今年5月17日,中国电信发布了首批18款AI手机。
支持GAN 必须学会“换脸”
今年5月17日,中国电信发布了《AI终端白皮书》,在业内首先明确了AI手机的定义,并对AI手机的平台、能力等方面提出了基本要求(详情请看7月20日《IT时报》报7版:《人工智能与手机结缘产生“化学反应”,看电信AI手机奇妙之处》),在9月14日发布的《中国电信全网通AI手机白皮书2.0》(以下简称2.0版白皮书)中,对AI手机的能力提出了许多新增要求。
计算机视觉是目前人工智能最主流的技术领域,主流的应用有人脸识别、图像分类、图像分割等,在2.0版白皮书中,特意强调必须要支持GAN(生成式对抗网络)模型。所谓GAN,是最近几年热门的深度学习模型,采用两个网络:生成网络(G)与判别网络(D)两者相互博弈,最终达到零和博弈。
简而言之,就是生成网络要通过大量数据生成一张假币骗过判别网络,而判别网络则是要让自己足够聪明,能够识别出生成的假币,这种训练方式与AlphaGo不同之处在于,不需要事先约定规则,是一种半监督或者无监督的人工智能学习模型。如果将GAN应用于手机中,有很多可想象的空间,比如图像风格转换、超分辨率图像构建、自动给人像添加胡子、切换头发颜色等等,或者可以让同一个场景的图片在不同季节和时间中切换,甚至可以将视频中的猫换成狗。
基于这些能力需求的提升,2.0版白皮书中,对视觉应用的场景需求也比1.0版本有了较多提升,比如需支持一键抠图、场景识别时间不超过100ms、图像修复等等。
AR渐成主流应用
1.0版本中,对AR的应用场景要求相对简单,只是提出应支持虚拟物体植入、实时美颜等功能需求,但在2.0版白皮书中,对AR视频的要求占据了相当篇幅。这与技术和应用的发展密不可分,随着苹果和安卓开放增强现实(AR)平台,基于AR的App渐成主流应用,前不久发布的华为麦芒7,便将AR量尺作为重要亮点。
根据2.0版白皮书,电信AI手机应该可以拍摄现实场景与虚拟物体叠加的AR视频,可以支持虚拟物体的遮挡、阴影投射等效果,可以做到实时美颜,而且还能定制表情,人脸移动时,可以做到表情实时追踪动作。
在AR识物方面,AI手机应该可以实时识别物品,同时显示增强信息,比如名称、品牌、价格等,也就是说,当用手机扫描一朵花时,这朵花的名字应该自动浮现出来。可以想象的场景是,逛超市时,手机自动变成扫描枪,只要轻轻对准商品一扫,它的价格、生产日期都会自动“浮”出屏幕。
除此之外,实时的AR翻译、场景识别、贴纸表情等等应用都是电信AI手机必须要具备的能力。这些能力的具备,对于整个产业链的开发者相当有利,他们不再需要担心自己的创意无法实现,通过调用这些能力,可以为消费者构建出不同场景下非同寻常的体验。
更加注重保护个人隐私
之所以对AI手机的技术和应用做更多要求,更强调手机端的深度学习能力,其根本原因在于,个人隐私的保护在人工智能时代变得越来越重要。
李宝荣表示,此前广研院对当前主流的深度学习算法做了研究,并提出了多种隐私保护的方法。比如更强调分布式学习,多台智能手机能够以协作的方式,学习共享的预测模型,然后各自把对模型的改进,概括成一个比较小的专门更新,该更新被加密发送至云端,和其他用户的更新及时整合。同时,由于手机本身有AI能力,所有训练数据都保存在终端设备,个人更新不会在云端保存,这种方式不仅向用户提供了更加个性化的使用体验,而且也让个人信息更加安全。
此外,GAN也是一种较好的保护隐私方法,通过在判断网络中加入隐私保护层,来保护敏感数据,从而使判断网络与生成网络博弈之后,生成一个满足差分隐私保护的数据集。
此外,中国电信的一些AI能力也被赋能于手机隐私保护。比如要求终端集成智能码号安全提醒能力,可以在来电振铃、通话、锁屏等不同场景下,对骚扰/诈骗电话进行闪信安全提醒,而天翼账号的免密登录也被要求置于底层网络路由中,将免密认证服务IP出口设置为移动数据网络。
5G与AI手机的天然耦合
技术驱动下,未来已来。尽管对手机侧AI能力的要求逐日提升,但李宝荣坦言,网络侧对于AI手机的辅助和协同作用将越来越重要,“在可预见的未来,手机的电池技术不会有太大的突破,这意味着手机在运行AI功能时会消耗较多的电量,这会使手机续航时间不长的矛盾更加突出。”
此外,终端芯片也会限制手机AI能力的提升,尽管“摩尔定律”即将被打破,类脑芯片、异构计算等新一代芯片技术在飞速提升,但从产业进展来看,手机AI芯片的计算能力仍然在较长的时间里弱于云端。如果在一定条件下,将手机AI的计算负载转移至网络侧,可以极大降低手机电量的消耗。
5G和边缘计算技术的逐渐成熟也让手机端与网络端耦合成为可能。据李宝荣介绍,与3G/4G网络不同,5G系统架构天然地支持移动边缘计算(MEC),也就是说,通过MEC,5G能够将业务平台下沉到网络边缘,这样AI手机在计算和数据缓存时,速度可以更快。
李宝荣认为,AI将加速通信网从CT(通信技术)到CT+IT(通信技术+信息技术)的融合方向演变,未来云计算和边缘计算将呈现双峰发展的格局,通信网络在AI终端发展大潮的推动下需要不断增强对计算和存储资源分配和调度的能力,发挥大型操作系统的作用。