Uploads%2farticles%2f14063%2f%e6%88%aa%e5%b1%8f2020 05 21%e4%b8%8a%e5%8d%8812.21.32
|
2020-05-21

飞桨这一年的成绩单:35 项技术升级发布、更快的产业落地、更美好的开发者环境

百度深度学习交出了怎样的答卷呢?

产业智能化浪潮兴起、AI 基础设施建设加快推进为飞桨发展提供机遇,飞桨也秉承开源开放理念,坚持技术创新,与开发者共同成长和进步,发展深度学习和人工智能技术及产业生态,一同加速产业智能化进程。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在 WAVE SUMMIT 2020 开场谈到。

WAVE SUMMIT 深度学习峰会由深度学习技术及应用国家工程实验室与百度联合主办,算上 2019 年的两场峰会,本届峰会是峰会的第三场,因为疫情影响,本次峰会也是第一次采用线上直播的形式召开。

WAVE SUMMIT 2019 王海峰老师曾提到「深度学习推动人工智能进入工业大生产阶段,而深度学习框架是智能时代的操作系统」,而通过一年的耕耘与发展,百度深度学习交出了怎样的答卷呢?

先看一组数据:截至目前,飞桨已经聚合了 194 万开发者,服务了 8.4 万家企业,创造了 23.3 万模型。而继 2019 年 11 月 WAVE SUMMIT 秋季峰会后,飞桨全平台带来了 35 项全新发布和重要升级,其中包括 8 大新产品和 27 项升级。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰

相较于去年初出茅庐的态势,今年,我们更看到的是飞桨脚踏实地的前行。

# 飞桨三大新变化

飞桨深度学习平台作为百度「AI 大生产平台」的基础底座,以大规模分布式训练、全硬件平台支持、端到端全流程工具以及飞桨 Master 模式,加速着 AI 落地和生产。无需从头学习难度高、迭代快的前沿科技,让应用 AI 的门槛更低、成本更低、效率更高。

新全景发布

飞桨新全景由飞桨开源深度学习平台、飞桨企业版两大版块构成。飞桨开源深度学习平台,包含核心框架、基础模型库、端到端开发套件与工具组件,在持续保持开源核心能力的同时,为产业、学术、科研创新提供基础底座。

百度集团副总裁吴甜

而随着企业应用的需求越来越丰富和强烈,飞桨通过升级产品架构,推出飞桨企业版。基于飞桨开源深度学习平台,通过零门槛 AI 开发平台 EasyDL 向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台。而全功能 AI 开发平台 BML 又为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

通过更集成、应用更简单、操作更灵活的方式,分别为大中小企业提供不同层级的平台能力,让企业去尝试和体验 AI 创新。

新成员「量桨」发布

近年来随着深度学习的兴起,人们逐渐意识到以深度学习框架为代表的 AI 技术在解决量子计算问题中也扮演着极为重要的角色。

量桨, 即 Paddle Quantum,则是基于百度飞桨研发的量子机器学习工具集。作为百度未来技术布局的量桨目的则是建立起人工智能与量子计算之间的桥梁。

量桨的显著特点是易用性、通用性、拓展性,开发者可以轻松搭建简洁的量子神经网络,也可以根据丰富的量子机器学习案例一步步组建出自己喜欢的模型。而过去在飞桨中系统地扩展了包括复数变量、复数矩阵乘法在内的多项底层功能,也使得量桨可以完美地支持量子电路模型,从而也支持通用量子计算相关的研究。

而量桨最迷人的还有它的特色工具集,熟悉量子计算的朋友都知道,量子计算的核心应用集中在组合优化问题的求解以及量子化学系统模拟等方向。通过这些关键方向的工具集,开发者则可进行更有趣的开发探索。

开发、训练、部署全新体验

百度飞桨总架构师于佃海

从开发、训练到部署,飞桨开源深度学习平台在全流程上均作了体验提升。

飞桨官方模型库新增 39 个算法,算法总数达到 146 个,预训练模型达到 200 多个。同时全新发布了 3 个端到端开发套件:PaddleClas 图像分类、Parakeet 语音合成和 PLSC 海量类别图像分类,全面升级 PaddleDetection 目标检测开发套件的模型数量、性能和产业应用能力。

训练方面新增自动混合精度、重计算机制等底层的技术升级,提升了训练框架的速度,降低显存占用。同时扩展了模型并行、弹性训练等大规模分布式训练能力,全新发布 PaddleCloud 云上任务提交工具,可使得训练更快、更好、更省。

部署层面,飞桨则全面打通多平台、多场景的部署能力,持续夯实模型压缩 PaddleSlim、原生推理引擎Paddle Inference、在线部署框架 Paddle Serving、轻量化预测引擎 Paddle Lite 等端到端部署核心能力,全新发布国内首个开源 JavaScript 深度学习前端推理引擎 Paddle.js,用于小程序、网页端部署。

百度深度学习技术平台部高级总监马艳军

此外还有全新发布的 PaddleX 全流程开发工具,后端开源,可快速集成,支持多端部署和模型加密。飞桨 Master 模式也全面升级,预训练模型更多、迁移学习能力更强。企业开发者可以通过 PaddleHub 和 EasyDL 享用飞桨 Master 模式,实现多场景下的优异模型效果。

# 飞桨场景落地的身影

在前不久刚刚结束的百度云智峰会上,百度飞桨宣布将能力加持瑞芯微 RK18 系列,芯片适配飞桨开源深度学习平台,将能为端侧 AI 提供更强劲算力。

飞桨打造全球首个「濒危物种 AI 守护官」

像这样的合作案例,今年飞桨已经在产业不同场景下进行了落地。

用 AI 抗疫

在今年突如其来的疫情下,飞桨也积极投身抗疫前线。基于百度提供的 OCR 技术,仅用 6 天时间,山东中拓就推出了社区疫情防控系统,已经部署在当地的疾控中心。恢复正常的生活和生产之后,对于人流量密集的公共场合需要去进行更加有效的筛查和监控,飞桨和北京地铁通过三天时间,完成了口罩的人脸检测模型的快速部署,七天内进行了两次模型升级。

防灾、打击违法犯罪

飞桨的开发者普宙基于飞桨的深度学习技术,专门为森林巡检定制开发了一款无人机自主飞行平台 + 应用管理平台,在这个平台上可以实现大范围的自主巡逻和火情监测。同时在森林监控场景当中还可利用另一个视觉套件 PaddleSeg,实现森林区域高精度的实时拼图,进行智能的语义分割这样的一些功能,据悉,到目前为止已阻止了十余起的伐木行为。

除了以上的一些场景以外,飞桨还可以辅助对非法越境、贩毒等等这样一些非法行为的监测及取证调查。目前已经应用到东南亚 155 个森林分局。

分布式训练提升性能

分布式训练一直是飞桨的一个重要特色,通过数据并行、模型并行、流水线并行等等这些完整的技术体系,并结合云端研发了弹性训练技术。OPPO 已就飞桨大规模分布式训练能力,上线了一个可以支持 3 亿用户需求的大规模分布式训练的推荐系统,通过这个系统,训练速度能够提升 8 倍,模型可以扩大到 20 倍,整个推荐的精度也有 4% 到 5% 的提升,并且节约内存节省了90%。

# 飞桨产学研生态布局思路

深度学习推广与人才培养

在「学习-实践-比赛-认证-就业」开发者成长全周期服务体系下,飞桨规划及发起了多项课程及赛事。

例如已面向全球开发者推出的 PPDE(PaddlePaddle Developers Experts)计划,推动中国深度学习技术发展和人才培养生态。面向青少年的 AI 科普教育的「晨曦计划」,以及青少年人工智能评测与认证体系,都将于年内上线。为培育 AI 产业级人才,飞桨为企业开发者专门开设课程和培训体系,包括面向一线工程师的 AI 快车道、企业闭门课程 AI 私享会、「首席 AI 架构师培养计划」黄埔学院等,手把手助力企业智能化转型。

此次峰会,飞桨还重磅发布了百度「星辰计划」开发者探索基金的参与机制,将以 100 亿流量、1000 万基金、1000 万算力支持广大开发者和百度一起参与到用 AI 技术解决社会问题的理想和实践。

加快软硬件生态合作

飞桨联合众多优秀的硬件厂商,如英特尔、英伟达、arm中国、华为、MediaTek、寒武纪、浪潮、中科曙光等启动共建硬件生态合作圈。同时还分享了近一年飞桨在农林、医疗、工业制造、消费类电子、电力能源、交通、环保等领域的十多个最新案例,切实助力国计民生,促进经济恢复发展。

相信峰会上所展示的仅为飞桨的冰山一角,通过不断的技术打磨及优化,我们也正亲历着飞桨正脚踏实地一步一步夯实着自己在这个大生态机遇下的宏大蓝图。

>>
Back to top btn