我们的专业付出,值得您的永久信赖!为您量身定制,信誉第一!

订货热线:14916236864

推荐产品
  • 北京:南海子公园
  • 必富娱乐手机版-“2018年寒假春节”的旅游线路已经正式上线
  • 新疆发展全域旅游的“领头羊”
当前位置:首页 > 新闻中心 > 行业动态
华为诺亚方舟实验室计算机视觉首席科学家田奇:六大前沿CV技术探索_必富娱乐手机版

 


48380
本文摘要:在刚刚结束的2019国际智能科学技术峰会上,华为诺亚方舟实验室计算机视觉最高科学家田奇教授公开发表了以大计算力大数据时代计算机视觉最前沿探索为主题的演讲,并在之后的媒体交流中公开发表了AI算法、数据、计算力等观点。

在刚刚结束的2019国际智能科学技术峰会上,华为诺亚方舟实验室计算机视觉最高科学家田奇教授公开发表了以大计算力大数据时代计算机视觉最前沿探索为主题的演讲,并在之后的媒体交流中公开发表了AI算法、数据、计算力等观点。自2018年6月底加入华为诺亚方舟实验室以来,兼任视觉最高科学家,田奇教授后仍主导诺亚方舟实验室视觉方向的最先进研究,构筑华为在各视觉业务下的算法竞争力和护城河。但是,田奇教授和华为诺亚视觉实验室的成员仍然很高调,媒体曝光率很少。

华为诺亚视觉实验室的明确研究方向和最新进展等相关信息也不能从互联网上获得。以下是对诺亚方舟实验室在计算机视觉领域的主要研究方向、研究成果和诺亚方舟实验室对人工智能产业发展的看法的解释,以及诺亚方舟实验室积极开展的工作的多角度的解释。诺亚方舟实验室六大CV研究方向与挑战有关。

必富娱乐游戏官网

目前,华为拥有18万名员工,在世界170多个国家经营业务,2018年收入达到1085亿美元,财富500强排名第72位。在华为快速增长的企业财富和强大的业务布局能力背后,特别重要的力量是华为遍布世界各地的14个研发中心。作为华为的AI研究中心,华为诺亚方舟实验室是这14个研究中心不可或缺的一员,同时支持华为创造世界一流的人工智能实验室,协助公司,构筑整个产业AI战略变革的宏伟愿景。

以田奇教授为代表的AI研发人员主要专注于诺亚方舟实验室计算机视觉领域的研究。据田奇教授介绍,诺亚方舟实验室在计算机视觉领域的研究主要分为基础视觉、3D视觉、语义解读、数据分解、视觉计算、视觉和多模式的融合6个方向。第一个研究方向是底层视觉,该部分的研究课题主要致力于提高照片体验。

目前,低分辨率和噪声是影响照片体验的最重要因素,对已拍摄的照片展开过度和噪声可以有效地提高用户体验,但噪声统计资料的特性难以估计,多处理后完整的图像和噪声不能完全恢复,图像发育模糊后恢复第二个研究方向是语义解读。图片视频内容一般含有非常丰富的语义信息,如扔东西、盗窃等个人不道德、派对、吵架等集体事件。因此,语义解读技术的发展可以给五谷丰登城市、终端视觉等业务带来巨大的商业价值。

但是,现在关于技术的发展也没有挑战。另一方面,同类事件之间的差异表现出不道德,容易识别的另一方面,不同场合的差异不道德可能代表的语义不完全一致。第三个研究方向是3D视觉。与二维数据相比,三维数据包含了更丰富的信息,因此也完全一致地指出了计算机视觉的未来。

但是,三维视觉的发展也面临着很多挑战,以医疗影像为例:医疗影像的数据显示必须具有非常专业的科学知识,在大数据时代,提供具有正确显示的医疗数据困难、便宜的医疗影像中长时间的样品和不长时间的样品的可玩性很小,例如器官恶性肿瘤的微小另外,视频数据中没有大量的检验信息,从这样的大量检验信息中发掘简单的信息也是相当大的挑战。第四个研究方向是数据分解。非常丰富的数据是算法研究的确保和基础,但在实际场景中,版权和隐私等允许不会导致数据提供可玩性高、人工显示成本高等问题。如何以低成本提供简单的数据已成为行业发展的关键。

通过现有数据分解技术分解的数据大多不存在图像质量差、同质化现象相当严重等问题。第五个研究方向是视觉计算。

视觉计算是深度自学应用于落地最重要的一环,目前业内有两个研究较多的课题方向。一个是现有网络模型的传输和加速,另一个是自动搜索新的网络结构。由于目前边缘计算的算法是独立国家,行业缺乏统一的平台,调用非常困难,行业内缺乏特定视觉任务的网络传输和加速算法,因此该课题研究方向没有大的挑战。

另外,现在神经网络的人工构建战略需要时间,网络结构检索需要在一定程度上解决问题,但算法和效率仍有较小的变革空间。第六个研究方向是视觉和多模式。真实世界的数据没有声音、文字、照片、视频、雷达激光等不同的模式,不同模式的数据在计算机世界的相互切换已经成为专业学科。

目前,融合多模式信息的方案往往面临数据异质问题,即不同模式的信息无法统一应对,而且评价多模式数据之间切换性能的标准是主观的,无法很好地展开客观评价。这些方向是行业必须提高研究开发能力的地方。

五大CV技术革新,田奇队行业处方探讨计算机视觉研究的六个方向,面对行业明确提出的挑战和新难题,田奇教授及其队员大力克服难关,通过新算法和解法模式获得了新的行业处方诺亚方舟实验室神经网络结构搜索(NAS)、目标检查、行人再识别、网络传输、三维物体检查等技术解决方案在神经网络结构搜索中,现有方法的搜索网络与测试网络没有深度差异。例如,在CMU和DeepMind领导明确提出的DARTS方法中,搜索网络只有8个单元,但测试网络有20个单元。

必富娱乐手机版

但是,在深度搜索网络中搜索的结构不一定适合深度测试网络。如果需要减少搜索网络的深度,RAM就不会爆炸。

回应,华为明确提出了新的网络搜索方案。据报道,目前华为在该方案中搜索到的网络结构在CIFAR10测试中获得了2.55%的错误率,转移到ImageNet,在移动设置中获得了24.5%的Top-1错误率。该新方法与ICLR和2019公开发表的工作DARTS(搜索时间必须是4GPU日)相比,新方法的搜索过程只需要0.3GPU日,就能获得更好的性能。作为计算机视觉的基本技术,目标检查对大量应用具有普遍影响力。

目前的物体检测框架主要分为单级方法和两级方法,前者速度更慢,后者精度更高。目前最差的单阶段检测方法是基于关键点的检测,通过角点人群确认目标板。但是,这种方法很难感知物体内部的信息,网络分解了很多错误的目标板。因此,华为明确提出了利用物体中心点检测物体目标板的方法,引进中心点检测某个目标板。

如果在这样推的目标板的中心区域包括某个物体的中心点,则该目标板可能是正确的目标板,否则该目标框将被删除。实验结果表明,在目前最不具挑战性的MS-COCO数据集中,该方法达到所有未知的单阶段检测方法,大幅领先,领先幅度至少超过4.9%,完全超过目前最差的两阶段检测方法的精度。

该方法目前开源,受到业界同行的关注。行人再识别技术在五谷丰登城市、智能园区等领域得到普遍应用。目前行人轻视识别数据显示方法没有显示无能、成本高等问题,华为明确提出新行人轻视识别解决方案,大幅降低显示成本,需要在新场景中慢慢部署行人轻视识别模型。从实验结果来看,华为的行人再识别技术在弱监督场景下明显提高了精度。

网络传输对终端外侧设备的应用具有根本价值。目前行业内在不损失精度的情况下可以超过几倍的传输加速比,但是由于隐私、法律、传输等方面的原因,常常无法获作为传输训练的数据,进一步提高了该问题的可玩性。华为在没有原来的训练数据的情况下,使用分解网络获得训练数据,设计损失函数获得与现实图像完全相似的数据作为训练,实现网络传输。

从获得的结果来看,在MNIST中,LeNet-5架构的传输可以维持98.2%的精度,打破以前最差的算法的6%,在现实数据的压缩算法中获得精度相似。在无人驾驶中可以普遍使用的三维物体检查中,远处物体二维图像小偏移量不会导致三维空间的大偏移,但一些算法很难超过非常低的三维复盖率。华为明确提出利用增强自学方法开展轴向矫正。从实验结果来看,在KITTI鸟瞰图评价和三维物体检测数据集中,华为明确提出的方法比现在最差的算法Mono3D和Deep3DBox性能提高了6%左右。

深度自学还在变革,算法和算力是演讲结束后的媒体交流环节,田奇教授解释了技术和研究在明确场景中的运用,公开发表了自己对算力、算法等的意见。基于华为升级芯片、华为数据生态等多方面资源的支持,田奇教授率领诺亚方舟实验室在计算机视觉多个领域积极开展研究,最后将一系列研究成果应用于手机终端、智能医疗、五谷丰登城市、安全、数字娱乐等实际场景。田奇说:我们主要致力于通过我们的创造性研究,使机器具有感觉和解读周围世界的能力,最后构筑我们的商业价值。

最近一段时间以来,深度自学技术术发展缓慢,或者成为一定瓶颈的各种意见也成为各界人士讨论的话题。田奇教授显然,前两年的深度自学很热,只是和以前的多年积累,大家到了越来越激烈的阶段才引人注目,现在的深度自学也大大发展和变革。

由于计算能力的提高,人工智能技术的发展也发生了很大变化。目前,业内人工智能发展了重算力还是轻算法的辩论,田奇教授对这个问题说明了自己的意见,本人回答说:在终端的运用中,计算力的提高使大量的算法和数据运算变得方便,使更好的算法变得有用的同时,超大型算法的训练和解法依赖于计算力的发展。但是,没有明确提出好的算法,计算力的价值也无法反映。算力就像电,算法就像发明者的灯泡。

因此,全然算力平等主义和算法平等主义的不同意见是错误的,算法和算力的关系只是交错融合、互补的状态。只是从学术界和产业界来看,现在高中重视算法的研究,但是企业界没有很多计算能力,所以偏向于依赖计算能力。


本文关键词:必富娱乐手机版,必富娱乐游戏官网

本文来源:必富娱乐手机版-www.ufreelaw.com