2018北京人工智能产业高峰论坛:深度学习并非理论方法的突破

2月8日,在北京市经信委和海淀区人民政府共同主办的“2018北京人工智能产业高峰论坛”上,北京前沿国际人工智能研究院宣布成立,李开复任首任院长,陈东平为理事长。

2月8日,在由北京市经信委、海淀区人民政府共同主办的“2018北京人工智能产业高峰论坛”上,北京前沿国际人工智能研究院宣布成立北京前沿国际人工智能研究所。主席。

论坛上,北京市经信委相关负责人介绍了北京市人工智能产业的工作思路和新模式。旷视科技首席科学家孙健、腾讯人工智能实验室计算机视觉负责人刘伟等就人工智能产业落地和技术突破发表演讲。中国科学院副院长李树深,北京市委常委、副市长尹和军在大会上致辞。.

以下是新知源组织的论坛干货:

李树深:深度学习不是理论方法上的突破,人工智能仍处于起步阶段

人工智能仍然是2018年科技和互联网行业最热门的话题。过去几年,在国务院和各级地方政府的政策推动下,人工智能迎来了发展的黄金时期。中国科学院副院长李树深在论坛致辞中表示,在人工智能发展的热潮下,我们仍然需要保持清醒的认识。

李树深认为,尽管数据量呈爆炸式增长,但支撑人工智能发展的核心基础有两个:

在计算能力和算法方面仍然没有根本性的突破。

从计算产业的角度来看,在过去的50、60年里,摩尔定律自集成电路发展以来就一直遵循着,并且一直保持着非常惊人的发展趋势。但随着纳米级晶体管变得越来越小,面临物理极限的挑战变得更加明显。

在存储空间和计算速度方面,很难按照摩尔定律无限发展。

这需要材料科学的革命性突破。

从算法的角度来看,虽然深度学习算法近年来推动了人工智能的快速发展,

深度学习的成功不是理论方法上的突破,

它是基于大数据和大规模计算资源驱动的基于基础理论的技术突破,也证明了人工智能还处于比较初级的发展阶段。无论是基础理论的研究,还是产业技术的发展,都需要科技界和产业界共同做出更大的努力。

北京新机遇:成立北京前沿国际人工智能研究院,探索政产学研用合作

北京人工智能产业发展具有人才集中、产业集聚、政策导向明确等突出优势。北京市经济和信息化委员会主任张伯旭介绍,目前北京正在大力推进机制创新,积极探索政产学研应用,协同推进人工智能创新产业培育模式。

北京前沿国际人工智能研究院(以下简称“研究院”)是北京探索这一模式的重要实践。

其组织架构为研究院+N个创新中心+N个科研平台。它是一个三层开放的组织结构,可以动态承载不同的创新资源目标。

研究院

研究机构

是政府指导下的民营非企业法人,主要职能是做好行业顶层设计,协调政产学研各方面的利用。创新资源;

创新中心

是一家专注于人工智能不同领域,相互独立运作,具体承担和实施研究所规划的各项研究任务的企业。研究院首批设立了三个创新中心,分别是北京人工智能基础研究与创新中心、北京智慧社会创新中心和北京人工智能专利创新中心。

科研产业平台

主要是降低协同创新门槛,加快科技成果转化,为科技创新所需的共性科研要素搭建开放平台。中国科学院计算机网络信息中心负责建设人工智能计算与数据应用服务平台。

中国科学院计算机网络信息中心副主任迟学斌介绍,该平台具备高性能计算能力和分布式计算资源,支持主流开源人工智能开源工具,如Caffe、TensorFlow等.,主要解决计算机视觉、图像处理、智能语音和自然语言理解四个领域。

在论坛上,由创客天下、蓟门农工商公司联合打造的“中关村人工智能创新创业基地”由北京市海淀区区长戴彬彬授牌。

论坛上,创客天地与济门农工有限公司共建的“中关村人工智能创新创业基地”获得了北京市海淀区区长戴斌斌的授牌。

“中关村人工智能创新创业基地”是人工智能产业领域的垂直创新孵化平台。目前,已与微软、百度、英特尔、京东、IBM、北航等国内外企业、院校和机构携手推进人工智能领域的产业创新。以科技落地,为人工智能领域的创新企业提供人才培养、成果转化、企业服务、金融支持等领域的专业服务。

北京市海淀区区长戴彬彬(左)和创客天下集团总裁蒙洋

北京市海淀区区长戴斌斌(左)与创客世界集团总裁孟洋

据创客世界集团总裁孟洋介绍,“中关村人工智能创新创业基地”去年初进行了改造,总投资近亿元。目前已经成立了无人机研发和无人零售领域的初创企业,共同探索人工智能产业。海淀创新发展模式。

AI+行业案例:DNA计算机、智慧城市、智慧客服与想象

生物医学的发展需要人工智能技术的助力,而生物技术与人工智能的结合也为人工智能技术从另一个层面的落地提供了良好的基础。

例如,利用人工智能技术对扫描的视网膜图像进行分析,可以为视网膜病变提供更准确的结果。中国科学院院士陈润生表示,利用人工智能也可以用来分析基因组,已经建立了很多深度学习算法。

此外,生物科学家们也在研究DNA计算机,希望通过深度学习,以DNA为材料建立DNA计算机,将来有望成为跟常规的计算机并列的新型计算机。

此外,生物科学家也在研究DNA计算机,希望通过深度学习,构建出以DNA为材料的DNA计算机,有望在未来成为与传统计算机并列的新型计算机。

智慧城市也是人工智能技术落地的重要场景。北京智慧社会创新中心由商汤科技成立,重点关注人工智能在三大领域的城市功能:

1、城市治理创新。

商汤科技联合创始人兼CEO徐立介绍,智慧社会研究院的成立主要是为了解决大城市的疾病问题。人工智能涉及城市规划和服务。城市治理将从人治理向机器治理转变。有了这样一个更智慧的国家,整个城市的治理将迈上一个新的台阶。

2、城市规划创新。

目前,许多城市规划仍以专家的支持为基础。未来可以利用大量的大数据分析,通过天空遥感数据和卫星数据,对路面进行分析,提取路网。从而优化城市交通管理。除了利用城市土地面积,还可以进行实时分析给出建议。从当前的治理到未来的规划。

3、城市事业单位服务优化。

随着人口的大规模扩张,城市服务跟不上形势。现在,人工智能技术可以提高业务处理的效率。比如在北京西站出入口加入人工智能(摄像头),可以让你对整个城市的服务质量有一个整体的把握,可以更好地以统一的标准服务更多的人。

杨瑞刚,百度计算机视觉首席科学家,现任百度研究院3D视觉首席科学家、机器人与自动驾驶实验室负责人。他介绍了百度AI的发展历程和技术布局。

图片[1]-2018北京人工智能产业高峰论坛:深度学习并非理论方法的突破-老王博客

孙剑:计算机视觉存六大困难,很多问题很难用函数逼近解决

孙剑:计算机视觉存六大困难,很多问题很难用函数逼近解决

目前,人工智能可以对信息进行分类有理函数逼近及其应用,每天减少1亿多条低俗内容的分发,提高编辑效率60%以上。AI提供的个性化短视频推荐,通过视频分析的方法,视频分类正确率达到90%,节省人工成本80%以上。此外,百度与中国联通建立了智能客服系统,可与用户进行多轮对话,人工客服成本降低20%以上。

孙坚:很多问题很难用函数逼近来解决,计算机视觉有六大难点

旷视研究院院长孙健博士研发的“深度残差网络(ResNet)”和“Faster-RCNN基于区域的目标检测(Faster-RCNN)”技术已在学术界和工业界广泛应用有理函数逼近及其应用, AlphaGo Zero 也用于 ResNet。

不过,在论坛上,孙健博士认为,尽管依靠深度神经网络的计算机视觉技术取得了突破,但只能解决函数逼近的问题,还有很多问题是用函数逼近难以解决的。尽管视觉是一个感知问题,但视觉背后存在许多认知问题。目前主要存在以下问题:

1、定义对象(功能对象)。

首先,定义是困难的。如果定义不明确,就无法进行准确的物体识别。同时,有许多定义的概念具有包容性并且变化很大。只有对这些概念进行了很好的建模,才能进行场景理解。

2、遮挡。

今天的物体检测方法非常非常好,但是遇到遮挡还是不是很好。

3、上下文理解。

3、上下文理解。

下图中,两个红框是什么?对大多数人来说,它可能是人类,但机器尚不具备推理人类的能力。

4、物体跟踪。

4、对象跟踪。

下图中,物体的重叠非常严重,人类的跟踪能力很强,但是如果使用目前最好的跟踪系统,机器很难达到人类的水平。我们的检测方法没有很好的推理机制应用于 in。

5、手眼配合。

5、手眼协调。

为什么很多家用机器人卖不出去?因为今天的机器人不能做手眼协调,不能像人类一样做家务和做饭。

6、准确性问题。

不管是无人驾驶还是自动驾驶,在一定程度上要求的精度都非常高,甚至人工智能技术也只有高于目前的标准才能成功推广。

不过,目前孙剑团队也正在解决上述问题,并探索出几个有价值的方向。

不过,孙坚团队目前正在解决上述问题,探索几个有价值的方向。

例如,在物体识别领域,旷视研究院推出的业界首款多机(128卡)训练的MegDet,在国际权威图像识别大赛COCO中获得全球第一。

刘炜:腾讯AI Lab算法创新三大能力、多媒体AI探索六大应用

腾讯人工智能实验室计算机视觉负责人刘伟介绍了算法创新。

一是网络结构的创新,二是损失函数,三是优化技术。

这三个功能应用于六个实例:

1、OCR 打破了世界纪录。

OCR是除了人脸识别之外的一种非常基础的图像识别能力,它需要识别出图像中出现的所有字符。在权威的ICDAR上,腾讯AILab在在线图像识别和焦点识别方面创造了新的世界纪录,并保持了七项任务的冠军,位居国内外第一。

2、人脸识别。

2、人脸识别。

腾讯 AI Lab 在 MegaFace 挑战赛中,无论是常规任务还是跨年龄任务,都取得了长足的进步。该技术已应用于腾讯平台,预计腾讯平台日通话量超过6亿。

3、图像描述生成。

3、图像描述生成。

图像首先通过卷积神经网络将图像的所有和局部特征表示提取到 LSTM 数组中。腾讯AI Lab提出“多阶段注意力”,论文已在AAAI大会上发表。

4、视频滤镜。

4、视频过滤器。

视频过滤器首先确保高级语义信息,然后保持时间一致性,最后实时高效渲染。目前,该功能应用于影视特效、短视频拍摄、增强现实等领域。

5、视频人体姿态估计。

5、视频人体姿态估计。

目前国内有很多公司在做,但腾讯是比较早将这项技术商业化的公司。主要流程是:输入一个实时图像序列,经过基本模型,然后细化(Refinement),分组,去除噪声点,最后得到人体骨骼主要关键点。这项技术的难点在于它一直停留在PC端。腾讯 AL Lab 做了大量的网络剪枝和压缩,形成了移动网络模型,同时在 Android 和 iOS 上推出。

6、AR和3D。

6、AR 和 3D。

使用 3D 视觉算法估计相机的位置和方向,并在图像上插入和渲染虚拟对象。目前该产品还在研发中,未来将应用于移动应用、游戏娱乐等场景。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论