百度上线深度学习可视化工具Visual DL 训练结果“所见即所得”

2,008 阅读4分钟

1月17日,百度PaddlePaddle & ECharts团队宣布上线深度学习可视化工具Visual DL,该工具可以使得深度学习任务变得生动形象,实现可视分析。百度希望能够借此为全球更广泛的用户提供更便捷高效的深度学习工具。


目前,大部分深度学习框架都提供了Python的用户界面,其训练过程的状态通常以日记的形式被记录下来,这种方式可以观察短期内的训练状态,但是难以从全局把握训练过程中的变化趋势,导致提取信息时受到较多限制。反观Visual DL,它改变了传统的日记式记录形态,便于用户将训练过程可视化,帮助更好地把控全局。

在具体使用上,Visual DL深度学习可视化工具功能全面。首先,它的“Scalar”功能支持Scalar打点数据展示,可将训练信息以折线图的形式展现出来,方便观察整体趋势,还能在同一个可视化视图中呈现多条折线,方便用户对比分析。其次,Visual DL的“Image”功能支持图片展示,用户可轻松查看数据样本的质量,也可以方便地查看训练的中间结果,例如卷积层的输出或者GAN生成的图片。同时,Visual DL还具有Histogram参数分布展示功能,方便用户查看参数矩阵中数值的分布曲线,并随时观察参数数值分布的变化趋势。最后,Visual DL中的“Graph”还能帮助用户查看深度神经网络的模型结构。据悉,Graph支持直接对ONNX的模型进行预览,由于MXNet,Caffe2,Pytorch和CNTK都支持转成ONNX的模型,这意味着Graph可间接支持不同框架的模型可视化功能,让用户便于排查网络配置的错误,帮助理解网络结构。详情可参照如下可视化案例:

下图是对参数分布和张量进行可视化:

下图是对张量和中间生成的图像进行可视化:

下图是展示训练过程中错误的出现趋势:

Visual DL除了功能全面以外,还具有易集成、易使用等优势。它可提供独立的Python SDK,若用户的训练任务基于Python,可直接安装Visual DL的WHL软件包,随后输入到项目中进行使用,使用方式简单便捷。为了满足用户的不同操作需求,用户在其Python代码中可加入Visual DL日志记录逻辑,启动Visual DL后即可通过浏览器查看日志的可视化结果。此外,Visual DL在底层使用C++编写,提供原生的C++ SDK,用户可将其深入集成到自己C++的项目,以实现更高效的性能。

值得一提的是,Visual DL现已完全开放,同时支持大部分的深度学习框架。其SDK层面可轻松集成到Python或者C++项目中,此外, Graph通过ONNX还可直接支持PaddlePaddle、TensorFlow、MxNet、PyTorch和Caffe2等流行的深度学习框架。对于开发者来说,Visual DL可以将深度学习任务的训练过程可视化,减少用户的观察比对时间,让整个训练过程更高效。

近年来,深度学习受到各领域的大力追捧,在国家层面上,深度学习框架成为了国家人工智能战略的重要组成部分。据悉,百度也在深度学习领域深耕多年,2016年,百度开源PaddlePaddle分布式深度学习平台,并在开源社区Github及百度大脑平台开放,供广大开发者下载使用。百度PaddlePaddle具有易学易用、高效灵活等特征,同时因更适应中国国情而深受中国开发者喜爱。目前,百度PaddlePaddle已在社区活跃度、易学易用及工业应用三方面取得了突破性进展。

不仅如此,百度为了培养更多深度学习人才,不仅组建了PaddlePaddle训练营,为开发者和初创企业提供大量资源,帮助他们的产品行业内部快速落地,同时,还发起了国内首个深度学习教育联盟,全方位支持深度学习人才培养。

百度相关负责人表示,人工智能作为国家战略的一部分,已成为各大行业巨头的必争之地。深度学习作为其中最热门的研究领域,关系到中国人工智能行业整体的发展后劲。百度作为中国领先的人工智能公司,将继续致力于为开发者提供最适合中国国情的开源深度学习平台,及各种深度学习工具等,最大程度地满足中国开发者的需要,让深度学习为各行各业带来巨大变革。