可视化技术的应用实例
可视化(Visualization)技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术,包括科学计算可视化和信息可视化。
在制造业中,广泛应用了各类可视化技术。通过三维CAD软件,设计者不仅可以设计出产品的三维形状和拓扑关系,还可以表达出零件的装配次序;通过数字化工厂(Digital Factory)仿真技术,可以对整个车间和生产线的布局进行仿真,并可以进行人机工程仿真;通过应用三维轻量化技术,可以建立立体的、互动式、多媒体的产品使用与维修手册;而虚拟现实技术能使人们进入一个三维的、多媒体的虚拟世界,在汽车、飞机等复杂产品的设计和使用培训过程中,得到了广泛的应用。
随着科技的蓬勃发展,可视化技术的应用领域越来越广阔。从CT技术到数字人体,可视化技术在医疗与生命科学得到广泛应用;空间信息的可视化,在地理、军事等领域应用日益普遍。
如您所见, 信息可视化 可以产生令人难以置信的美丽图像,高效的传达信息。下面的图像是现已解散的安然集团的通信组织图。
作者/版权所有者:Kitware Inc版权条款和许可:CC BY-ND 20
Ben Shneiderman说: “可视化的目的是洞察力,而不是。”
那么,可视化是否有设计诀窍呢?Riccardo Mazza在他的书“Introduction to Information Visualization”中,为我们提供了一种信息可视化的5步设计法,我们一起来看看吧。
整个设计过程很简单,一旦你审查了这个过程,它应该是常识:
1、定义问题
2、定义要表示的数据
3、定义表示数据所需的维度
4、定义数据的结构
5、定义可视化所需的交互
1定义问题
与任何用户体验工作一样; 第一步是定义信息可视化将解决的问题。这通常需要一些 用户研究 来回答问题; “我的用户需要什么呢?”、“他们将如何使用它?”
您可能正试图向用户解释某些内容,或者您可能正试图让他们建立新的联系或观察;为了将问题定义清楚,您还应考虑用户群特有的任何特定因素,比如:他们的教育水平或数据处理能力如何?他们过去的数据有什么样的经验?这将指导输出的复杂程度,并阐明用户的整体需求。
2定义要表示的数据
有三种主要类型的数据可以通过信息可视化来表示,它们的映射方式可能会有很大差异- 因此,在开始设计之前,在您的脑海中清楚地了解数据,您将使用哪些数据?
1、 定量数据 - 这是数值类的数据。
2、 有 序数据 - 非数值的,但具有内在顺序的 数据 。(例如,想想一周中的几天。)
3、 分类数据 - 既没有数字也没有内在顺序的数据。(例如商业名称或地名)。
3定义表示数据所需的维度
必须仔细考虑数据集的维度或属性的数量,因为它将在很大程度上确定哪些数据可用于进行信息可视化。数据中表示的维度越多- 理解信息可视化就越混乱。因此值得注意的是,具有大量维度的数据可能更适合使用高度交互式表示,不适合静态图形展示。可以根据要研究的相关维度的数量将分析分成四种类型:
1、 单变量分析 - 针对自变量研究单个因变量
2、双变量 分析 - 其中两个因变量针对自变量进行研究
3、三变量 分析 - 其中三个因变量针对自变量进行研究
4、 多变量分析 - 针对自变量研究三个以上的因变量
作者/版权所有者:Chire。版权条款和许可:CC BY-SA 30
多变量分析的图像,其中数据点之间的关系很多且相关。
4定义数据的结构
这是关于检查数据集如何相互关联的全部内容,常见的关系结构包括:
1、 线性关系 - 数据可以以线性格式显示,例如表格,向量等。
2、 时间关系 - 数据随着时间的推移而变化
3、 空间关系 - 与现实世界相关的数据(例如地图数据或办公室平面图)这有时也被称为地理关系
4、 分层关系 - 与定义的层次结构中的位置 相关的 数据(从办公室管理结构到简单的流程图)
5、 网络关系 - 数据与同一数据中的其他实体相关
作者/版权所有者:Nathanael Crawford。版权条款和许可:CC BY-SA 30
以上示出了分层网络模型的示例。
5从可视化中定义所需的交互
设计过程的最后一部分要求您了解用户信息可视化所需的交互级别。有三类互动:
1、 静态模型 - 这些模型按“原样”显示,例如您保存在汽车中的道路地图集中的地图。用户无法修改它们。
2、 可转换模型 - 这些模型使用户能够转换或修改数据。它们可以允许用户改变用于分析的参数或者为数据集选择不同形式的 视觉映射 。
3、 可操作模型 - 数据有时候是高度关联的,通过操作部分数据图形,可以获得关联数据的变化,从而产生新的见解是一种常见的互操作方法。例如:我们可以通过DataFocus快捷创建图形的联动操作。
作者/版权所有者:DataFocus 版权条款和许可:CC BY-SA 30
小贴士: 设计信息可视化的过程可能与您的最终输出并不直接相关,但可以使您更加明智地决定何种表示形式最适合您的用户。通过充分了解用户的需求,以及他们需要展示的数据、数据中的关系和模型类型,信息可视化设计师可以提供充分满足这些需求的可视化作品。
业内数据可视化可圈可点的案例越来越多了,简单的分享几个:
1 “美国大选”数据可视化
在美国大选期间,美国媒体做了不少与之相关的数据报道,让我们来回顾一下,他们是如何将美国大选的数据可视化的吧!
下图为各洲“选举人票”的占比情况。作者设计了两种表现方法,一是以“选举人票”的分布做为底图,一是直接以美国地图作为底图。除此图上方双方选举人票总体数量对比外,鼠标移至各洲上方还能显示各洲“选举人票”数量及对希拉里与特朗普的支持比例。
2、地理信息可视化
百度迁徙图是近年来非常流行的一种地理信息可视化,可以通过连线动态查看人口流向。此处给大家绘制一幅动态航班图的地理信息可视化图,可查看动态效果。
3、企业经营数据可视化
袋鼠云联合中国美术学院一起,为中国最知名的品牌之一——贵州茅台集团定制的大数据可视化展示解决方案,亮相2018年数博会,实时展示茅台集团各电商平台经营概况、茅台消费者的用户画像、电商订单实时物流状态等。
毫无疑问,你是没有第二次机会来给人以“第一印象”。每个网站从首页到子页面都是介绍产品、提供服务、探讨功能,唯有“关于我们”这个页面是关乎产品和服务的创建者——我们自己,也是为什么它如此的重要。
一个成功的“关于我们”不仅仅是将品牌、公司和团队信息填满一个页面那么简单粗暴,你需要将团队和品牌视作一个整体,呈现出独有的风格,不同的个性,让用户记住。
这听起来似乎是一件特别棘手的事情,但是仔细推敲整理,实际并不复杂。选择走肾的设计技巧,挑个或现代或简约的匹配自家品牌的风格,用最走心的方式展现自己的团队,这就够了。
听起来玄乎,不如看看别人家的案例来的直观。
01 醒目的色彩和鲜亮的配色
严格的色彩搭配和醒目的色调选取,使得Rook 的“关于我们”页面的设计看起来简单而突出。醒目的金色贯穿整个设计,从LOGO到图像、排版都保持着一致性。
在和成员照片的处理上,设计师采用了单色的色彩滤镜,这让关于我们页面在色彩上更加严格也更加统一,品牌化的设计在这里一览无余。
02 手绘排版和简单的
Madebyband 的“关于我们”页面的设计比较不同,结合品牌的特征,当然也是为了表现个性,他们的页面运用了许多手绘的字体和排版,配合手工制作品的,传达品牌的个性。整个页面设计简洁,大量的留白也平衡了页面的结构。
所以,无论是自定义的字体还是自定义的,都是呈现品牌性格表现团队差异化的可靠手段。
03 俏皮的插画和活泼的配色
“关于我们”的页面中最常见的信息就是团队的照片和地点等内容,那么为什么要用传统而死板的方式来呈现呢?Pulp Fingers 就没有这么做,设计师挑选了三种色彩来制作尖锐而极具风格的插画,这种风格不仅漂亮而且有趣,独特而足够引人入胜。作为企业的“关于我们”页面绝对独具一格,令人难忘。
04专业的团队合影和整饬的排版
“关于我们”的页面中,团队成员照片非要是单独个人的么?并不一定,专业的合影也是不错的选择(一群人随意地站在某栋楼门口的楼梯上拍摄,这样的合影中国人有过太多,谈不上专业,放这里通常都非常的违和)。这种专业的团队成员摄影有不少企业做过,很容易做得过于“商业风”,做得有风格也恰到好处的并不多,有兴趣的同学可以找找锤子科技团队的男神合照,大概也有Jam3团队合影的风格。
Jam3 团队选择的是统一的黑色服装,在深色背景衬托下逼格四射,质感十足,成熟而精美,是绝对的焦点。搭配这个的排版和背景都非常的现代而清爽,主次分明。
当然,这种合照存在的问题在于,团队成员如果变动的话,你得重新照一次……如果这个不是问题的话,那就来一发吧。
05 醒目的标题和有趣的动画
如果想让客户、未来的员工和同事们确切地了解你们的品牌价值的所在,那么为什么不把这些核心的内容直接醒目地写出来呢?Purple, Rock, Scissors 就是这么做的。这个“关于我们”的页面还有两个地方非常贴心,一个是短视频背景,它很好地展现了工作环境和整体氛围;另外一个是团队成员头像的设计,鼠标悬停的时候,你可以看到其中人物表情变化的动效,不仅贴心而且有趣。
06 双色搭配和大胆的插画
Mike Kus 的“关于我们”的页面设计采用了独特的双色配色,前景色是**,背景色是红色,双色搭配的优势在于它极强的凝聚力,这样的风格通常厚重而复古,而且可以很好地强化品牌色给人的感觉。另外一个引人入胜的地方就是其中大胆的插画——大脑。
当然,配设在整个设计中起到了决定性的作用,要作出靠谱的配色并不容易,不妨在优设首页的搜索框中搜搜配色,会有惊喜哦。
07 整洁的图形和信息可视化
是否你也会更喜欢视觉突出的图形而非整片的文字呢?那么你看看Huge公司的“关于我们”页面吧。这家公司用先锋而大胆的配图来呈现他们的独特之处,硕大而简洁的标题文字让这些配图更加富有张力,同时还传达出他们的企业价值观。
如果图形化是设计的核心的话,信息图的使用就顺理成章了。关键的信息用信息图来表现,不仅贴合网站的整体风格,还能让用户更轻松地接受网站传递的信息。
08 整齐的排版和温暖的色调
坦率的讲,栅格运用的最多的地方还是传统媒体,网络媒体运用栅格的方式与之还是有差别的。不过Studio Alto的网页证明了一点:网页排版一样可以借助栅格做到类似传统屏幕印刷行业的排版样式。页面中暖色调的运用,让整个页面的更加风格化,这种类似牛皮纸的色彩令整个页面的质感更上一层楼了。
09 简单的布局和干净的留白
设计网页的时候,留白是重要的工具和元素,掌控留白的使用技巧非常有必要。Made By Shape的“关于我们”页面的设计就是这样的一个案例,棱角分明的形状和不同的区块被留白清晰地分割开,柔和的色调赋予页面以时尚感和生命力。如果你所设计的页面内容信息量很大,不妨好好运用留白吧。
10 可视化的时间轴和吸引人的配色
如果要展现一个产品的发展历程,没有什么比时间轴更加合适了。Moz 的这个关于我们的页面设计就充分运用了这一元素。时间轴并非是固定的,其中的事件和内容是可以同用户进行交互和互动的。如此一来,整个时间轴便可以向用户讲述整个故事,让用户也感受到参与感。整个设计的另外一个亮点是它的配色。
11 插画式和温暖的基调
你们是否拥有一个强大的幕后团队呢?如果是,不妨在“关于我们”页面中好好地展现他们。其实Food Studio 的这个页面的设计并不涉及过于复杂的技巧,他们只是将团队成员的头像更换为插画风,配合温暖的基调,让整个页面的风格一下就脱颖而出。这样的设计最重要的一点是统一,一致性是风格化的基础。
12 大胆的用色和超大的团队照片
如果你想让你的设计更加突出更有影响力,不妨试着让一些元素更大,让配色更加亮眼。正如Mixd 所设计的,用高清的团队成员大图来突出每个成员的存在感,加上高对比度的色彩搭配,整个设计看起来也非常不错。值得注意的是,挑选合适的元素放大,不要全都放大,这样就没有重心了。
13 时尚的和简约的布局
Kingdom Coffee and Cycles 的整个设计可以说是现代风设计的典范,布局简单,时尚的,干净整齐,色彩明亮。是整个页面的视觉设计的重心,、视频、地图的混合搭配消解了页面的单调和简单的特质。技巧上,设计师使用了团队的Instagram的作品做成拼贴置于页面底部,看起来也非常时尚有趣。
14 简洁的图形和锋锐的线条
这种类型的网页设计走的是时尚现代风,干净的外观,轻量级的选取,大量的留白和整齐的排版,非常专业也非常的养眼,堪称完美的框架可以承载多种多样的内容。同时,这个页面的设计案例也同样展现出留白的重要性。
15 大胆的提亮色和高亮信息
6tematik 的关于我们页面设计非常有意思。黑白配色永远不会过时,但是在某些情况下黑白并不足以满足全部的需求,这个页面就使用了高饱和度的红色来蓝色来作为提亮色,大胆而有效。要注意的地方在于,你高亮的信息越多,高亮的效果就越差,因为高亮的地方越多,用户越难于发现真正重要的地方。所以,你要做的是标记出真正重要的事情。
16 大留白和小元素
大和小在很多情况下都是对比出来的。Margin 通常指的是主体周围的边缘、留白和边界。较小的边界可以让主体更有张力,覆盖更大的范围。但是Alfred 的关于我们页面并没有这么做,大量的留白、宽广的边缘让整个页面看起来文艺气息十足,简约而轻松。虽然这样的设计并不常规,但是也正是这种非常规的设计让整个页面充满了独特的风格与调性。
17 独特的字体和个性化的档案
独特的手写字体赋予Big Cartel的页面以一种不同凡响的张力,虽然简单,但是让设计大放异彩。个性化的员工档案同上方别具一格的字体一样独特,参差多态的设计让整个页面在气息上保持了一致性。当你点击员工头像的播放按键的时候,会播放一段颇有性格的视频,独树一帜。
18 模块化布局和温暖的色彩
当你看到这个页面的时候,我想你也会注意到它独特的设计:页面的区块是精心分割出来的,从上到下每一块的内容都会承上启下,上一块引出下一块,就像梯子一样。这样一来,模块化的页面也显得很有条理,整齐而又自由。页面的配色和用图也是非常讲究的,黑白的基调配合温暖的棕色,创造出温馨的氛围。
19 醒目的色彩和大胆的
Visionaire的用色简直是大胆的典型,红色Banner的使用极为抓人眼球,还和品牌用色相互呼应。错落的排版和别具一格的使用让用户不会轻易忘记这个不同一般的网站。信息图的使用也是这个关于我们页面的特色。
20 强对比和复古插画
Woah Nelly Catering 的关于我们页面并没有追随最流行的设计手法,而是采用了温暖怀旧的色调和设计元素来营造氛围,鲜艳漂亮的插画不仅让页面充满活力,而且也简单直观。复古插画的微妙之处在于其中添加了纹理,让它质感非常不错,这也让白底黑字的元素可以更加显眼突出,构成对比。
21 整洁的配色和均衡的排版
漂亮的无衬线字体、均衡的排版和均匀光洁的配色让EB Pearls 的关于我们页面看起来专业无比。合理的留白和浅色的的使用给人一种优雅的感觉。
22 柔和的色彩和简单的插画
很多时候设计并不是越复杂越好,EVA Black Design的关于我们页面使用简单的设计反而更容易营造时尚现代的感觉。简约的暖色调同黑白灰配合在一起,给人以柔和的感觉,点缀以简单的插画,让整个页面在整饬的设计之下还拥有了些许个性。
23 动效和富有冲击力的排版
想让你的设计栩栩如生富于生命力?那么让它们动起来好了!用短视频替代,或者使用GIF,这也都是目前流行的设计手法。纯黑色的文本和红色的元素的使用,让整个页面充满了个性,也让排版充满了冲击力。
24 创意排版和吸引力十足的
居中的独特排版是这个关于我们页面的有趣之处,而团队成员的照片也正好居于这样的位置,这使得两边的档案信息排版需要向中间对齐。复古元素和配色的使用则支撑起了整个页面的设计,值得学习哦。
25 大胆的布局和色彩滤镜
大胆使用独特的、先锋的布局是令人难忘的重要手段,同时搭配以个性十足的配色,效果绝对不错。干净的无衬线体的选择,色彩滤镜下的,都是这个关于我们页面的突出之处。
本文地址: 思维素材
这篇学习笔记是对数据可视化的一个较为全面的总结。大部分的内容来自于自己之前所学过的数据分析知识,还有一部分内容来自于我收集的一些资料,我将在这篇学习笔记中回答如下几个关键问题:
数据可视化(Data Visualization)是涉及信息技术、自然科学、统计分析、图形学、交互、地理信息等多种学科交叉领域,通过将非数字的信息进行可视化以表现抽象或复杂的概念和信息的技术。简单的说,这种技术将数据以图表的方式呈现,用以传递信息。人类有五官,能通过5种渠道感受这个物质世界,那么为什么单单要青睐可视化的方式来传递信息呢?这是因为人类利用视觉获取的信息量巨大,人眼结合大脑构成了一台高带宽巨量视觉信号输入的并行处理器,具有超强模式识别能力,有超过50%功能用于视觉感知相关处理的大脑,大量视觉信息在潜意识阶段就被处理完成,人类对图像的处理速度比文本快6万倍,所以数据可视化是一种高带宽的信息交流方式。
如果我们的视野再开阔些,数据可视化从广义上来说包含了三个分支:科学可视化(Scientific Visualization),信息可视化(Information Visualization)和可视分析学(Visual Analytics)。科学可视化是跨学科研究与应用领域,关注三维现象的可视化,在建筑学、气象学、医学或生物学方面的各种系统中有广泛的应用,这个领域研究的数据具有天然几何结构(如磁感线、流体分布等)。
信息可视化则研究抽象数据的交互式视觉表示以加强人类认知。抽象数据包括数字和非数字数据,如地理信息与文本,这个领域研究的数据具有抽象的结构,比如柱状图,趋势图,流程图和树状图,这些图表将抽象的概念转化成为可视化信息,常常以数据面板的形式体现。
可视分析学结合了交互式视觉表示以及基础分析过程(统计过程、数据挖掘技术),执行高级别、复杂的活动(推理、决策)。
数据科学的主要组成部分包含三个大的阶段:数据整理,探索性数据分析和数据可视化。站在一个更高的位置来看,数据可视化在数据科学中的位置是比较靠后的,是属于最后的成果展示阶段。如果要从头说起的话,首先,在 数据整理 阶段,我们的主要任务是数据的获取和解析,包括一系列对原始数据的清洗和加工工作,这一块的知识领域主要涉及计算机科学。紧接着是 探索性数据分析 阶段,这个阶段要大量使用统计和数据挖掘方面的专业知识,也需要绘制图表来解释数据和探索数据,这个阶段的主要任务是过滤和挖掘。但这个阶段的可视化分析只是你和数据之间的“对话”,是数据想要告诉你什么,而数据可视化则是数据和你的读者之间的对话,是你通过数据想要告诉读者什么,这是它们之间最大的区别。完成了上面两个阶段的内容,才到了我们最后的 数据可视化 阶段,这是一个多学科交叉的领域,涉及到图形设计,信息可视化和人机交互,我们的主要任务是对信息进行精炼,然后通过可视化表示出来,并与读者产生交互。然而,如果将数据科学的这三个阶段理解为按严格顺序进行的“线性”的模型那就大错特错了,它经历的是一个迭代的,非线性的过程。后面的步骤会让你更了解之前所做的工作,可能到了数据可视化阶段,才意识到还有太多疑点要弄明白,我们需要回到上一步重新进行之前的工作,就像画家翻来覆去才能最终完成一幅杰作一样,数据可视化的过程并不是给数据分析这个刚出炉的蛋糕加点糖霜,,而是有一个反复迭代,不断优化的过程。
数据可视化是一个再典型不过的多学科交叉领域了,可以说数据可视化所需要用到的知识,就是数据科学庞大知识体系的一个剪影。你会感受到数据科学理性的一面,同样也会感受到她感性的一面。你可以穷尽自己的一生,在这个浩如烟海的领域中尽情的探索,常学常新,其乐无穷。
数据可视化的本质,是充分理解业务的基础上对数据进行深入分析和挖掘,然后将探索数据所得到的信息和知识以可视化的形式展现出来。也就是说我们做的工作其实就是从数据空间映射到图形空间。我们要做的第一步工作是充分的结合业务理解数据,然后采用某些方法选择合适的图表类型,这又要求我们先对图表类型有个比较全面的了解。绘制完图表是不是就完成了呢?其实不是。我们还要对图表进行优化,优化所针对的对象是各种图表元素,对此我们有一系列的设计技巧,下面将一步一步的来介绍这些知识。
离开对业务的理解谈数据分析都是耍流氓。这里介绍一种快速了解数据与业务以开展进一步的探索与分析的方法,叫“5W2H法”。步骤一:WHAT,这是关于什么业务的什么事?数据所描述的业务主题是什么?步骤2:HOW,即如何采集的数据?采集规则会影响后续分析,比如如果是后端数据埋点,那么数据一般是实时的;而如果是前端数据埋点,那么就要进一步弄清楚数据在什么网络状态会上传?无网络状态下是如何处理的?这些都会影响最后数据的质量进而影响分析质量。步骤三:WHY,为什么搜集此数据?我们想从数据中了解什么?数据分析的目标是什么?步骤四:WHEN,是何时段内的业务数据?步骤五:WHERE,是何地域范围内的业务数据?步骤六:WHO,谁搜集了数据(Who)?在企业内可能更关注是来自哪个业务系统。步骤七:HOW MUCH,各种数据有多大的量,足够支持分析吗?数据充足和不足的情况下,分析方法是有所不同的。如果七个问题中有一个答复不能令人满意,则表示这方面有改进余地。
用简单的三个步骤就可以选择合适的图表类型:一看数据类型,二看数据维度,三看要表达的内容。
我们有两种数据类型,每种数据类型又有两个子类别。首先,我们有 分类数据 和 定量数据 。分类数据用来表示类别,比如苹果,香蕉,梨子和葡萄,就是水果的4种类别,称为 分类定类 ;有的分类变量是有一定顺序的,比如可以把红酒的品质分为低,中,高三档,人的身材有偏瘦,正常和肥胖等等,这种特殊的分类变量称为 分类定序 。定量数据也可以进一步分为两类,一类叫 连续值数据 ,比如人的年龄;一类叫 离散值数据 ,比如猫咪的数量。选择图表的第一步就是要看我要展示的数据是什么类型,最典型的例子就是相关性分析,如果要分析定量数据和定量数据之间的关系,那么散点图无疑是最佳选择,但如果有其他情况出现该怎么选择呢?数据类型直接影响你能选择的图表类型:
举几个例子来说明大家可能就明白了。
首先来看一个散点图的例子,比如我要分析一下汽车每加仑行驶的英里数和汽车重量之间的关系,因为两个都是定量数据,那么我们就应该选择散点图:
从散点图中我们可以看到每加仑行驶的英里数和汽车重量之间是呈线性负相关关系的,车的重量越重,每加仑行驶的英里数就越小。
下面这个马赛克图分析了《冰与火之歌》中五王之战各战争与战争类别之间的关系:
五王之战中总共有这样几种战争类别:
战争类型是分类变量,战争的胜负也是分类变量,马赛克图(也就是下面要介绍的“不等宽柱状图”)分析了战争类型和战争胜负的关系,可以很明显的看出ambush,siege和razing类型的战争,进攻方的胜率都是很高的。这意味着什么?如果我要建立一个预测战争胜负的模型,那么战争类型就是一个非常好的特征。
如果要分析分类数据和定量数据的相关性,那么箱线图就是一个比较好的选择了,请看下面这个例子:
这个箱线图展示了汽车的气缸数量和每加仑行驶的英里数之间的关系,气缸数量越多,每加仑汽油行驶公里数越少,说明相应的油耗越高,间接说明气缸数量和油耗具有相关性。这里可以将气缸数量这个离散型数值变量当做分类变量来看待。
看完了数据类型,接着看维度,要展示的数据是一维,二维还是多维的?如果是一维或者二维,那么一般的统计图表都能满足要求,但如果我们有多维的数据,我们就要把第三维开始的数据映射到上面提到的那7大视觉编码中。比如散点图表示了两个定量数据之间的关系,如果还存在第三个定量数据,那么我们就可以用点的大小来表示,那么散点图就变成了气泡图,如果第三个数据是分类数据,那么我们可以在散点图的基础上标记颜色来表示。
最后,还要考虑可视化主要想表达的内容是什么。对于4大内容:比较,分布,组合和关系,下面这张图给出了一份简单的指南。比如我想表达的是数据的分布,如果是单变量且只有比较少的数据点时,可以选择直方图。比如想表达数据之间的关系,如果是两个变量,则使用散点图,如果有第三个变量,那么如果编码成大小,则得到气泡图。
这也是当初一个比较困扰我的地方,到底有多少种图表可供我选择?作为数据分析师,我们得先对自己的武器库有个基本的认识和了解,才能在使用的时候挑选趁手的武器,下面将介绍一些常见的图表。
也称为「棒形图」或「柱形图」。条形图 (Bar Chart) 采用水平或垂直条形(柱形图)来比较不同类别的离散数值。图表其中一条轴代表要比较的具体类别,另一条则用作离散数值的标尺。条形图与直方图不同,前者不会显示数值在某时间段内的持续发展。条形图的离散数据是分类数据,针对的是单一类别中的数量多少。条形图其中一个缺点是当有大量条形时,将难以标签图表。
条形图有两种常见的变种: 多组条形图 和 堆叠式条形图 。多组条形图也称为“分组条形图”或“复式条形图”,在同一轴线上将两个或多个数据集并排,绘制数据并进行分类。跟条形图同样,每个条形的长度用来显示不同类别之间的离散数值比较。每个数据系列将获分配一种颜色(或同一颜色的其中一种深浅度)以进行区分,然后每组条形将独立放置,并与其他条形组分隔开。多组条形图通常用来将分组变量或类别与其他数据组(具有相同变量或类别种类)进行比较,也可用来比较迷你直方图,每组内的每个条形将表示变量的显著间隔。多组条形图的缺点:当有太多条形组合在一起时将难以阅读。
跟多组条形图不同(并排显示条形),堆叠式条形图 (Stacked Bar Graph) 将多个数据集的条形彼此重迭显示,适合用来显示大型类别如何细分为较小的类别,以及每部分与总量有什么关系。堆叠式条形图共分成两种:简单堆叠式条形图将分段数值一个接一个地放置。条形的总值就是所有段值加在一起。适合用来比较每个分组/分段的总量。100% 堆叠式条形图会显示每组占总体的百分比,并按该组每个数值占整体的百分比来绘制,可用来显示每组中数量之间的相对差异。堆叠式条形图的一个主要缺点:条形分段越多,图表就越难以阅读。另外,我们也较难比较不同分段,因为它们不在同一基线之上。
径向/圆形条形图只是在极座标系(而非笛卡尔座标系)上绘制的条形图。虽然看起来很美观,但径向条形图的问题在于条形的长度可能会被人误解。即使所代表的数值相同,但外围的条形看起来还是会比较长。由于每个条形都必须处于不同的半径,所以只能用角度来判断数值多少。我们的视觉系统比较擅于理解直线,因此笛卡尔条形图是比较数值的更好选择。因此,使用径向条形图通常只是为了美观。
也称为“圆形柱图”或“星图”。这种图表使用同心圆网格来绘制条形图。每个圆圈表示一个数值刻度,而径向分隔线(从中心延伸出来的线)则用作区分不同类别或间隔(如果是直方图)。刻度上较低的数值通常由中心点开始,然后数值会随着每个圆形往外增加,但也可以把任何外圆设为零值,这样里面的内圆就可用来显示负值。条形通常从中心点开始向外延伸,但也可以别处为起点以显示数值范围(如跨度图)。此外,条形也可以如堆叠式条形图般堆叠起来。
子弹图 (Bullet Graph) 能显示表现数据,功能类似于条形图,但加入更多视像元素,提供更多补充信息。子弹图最初由 Stephen Few 开发,用来取代仪表盘上如里程表或时速表这类图形仪表,解决显示信息不足的问题,而且能有效节省空间,更可除掉仪表盘上一些不必要的东西。主要数据值由图表中间主条形的长度所表示,称为“功能度量”(Feature Measure);而与图表方向垂直的直线标记则称为“比较度量”(Comparative Measure),用来与功能度量所得数值进行比较。如果主条形长度超越比较度量标记的位置,则代表数据达标。功能度量背后的分段颜色条形用来显示定性范围得分。每种色调(如上面示例中三种不同深度的灰色)表示不同表现范围等级,如欠佳、平均和良好。当使用子弹图时,建议最多使用五个等级。
平行座标图 (Parallel Coordinates Plots) 能显示多变量的数值数据,最适合用来同一时间比较许多变量,并表示它们之间的关系。举个例子:比较具有相同属性的一系列产品(比较不同型号的计算机或汽车规格)。在平行座标图中,每个变量都有自己的轴线,所有轴线彼此平行放置,各自可有不同的刻度和测量单位;或者我们也可以统一处理所有轴线以保持所有刻度间隔均匀。然后我们绘制一系列的直线穿越所有轴线来表示不同数值。轴线排列的顺序可能会影响读者如何理解数据,其中一个原因是相邻变量之间的关系会比非相邻的变量容易进行比较。因此重新排列轴线可以帮助了解不同变量之间的模式或相关性。平行座标图的缺点是容易变得混乱,当数据密集时更加难以辨认。解决这个问题的最好办法是通过一种名为「刷理」的互动技术,突出显示所选定的一条或多条线,同时淡化所有其他线条,让我们能更集中研究感兴趣的部分,并滤除干扰数据。
又称为“蜘蛛图”、“极地图”或“星图”。雷达图 (Radar Chart) 是用来比较多个定量变量的方法,可用于查看哪些变量具有相似数值,或者每个变量中有没有任何异常值。此外,雷达图也可用于查看数据集中哪些变量得分较高/低,是显示性能表现的理想之选。每个变量都具有自己的轴(从中心开始)。所有的轴都以径向排列,彼此之间的距离相等,所有轴都有相同的刻度。轴与轴之间的网格线通常只作指引用途。每个变量数值会画在其所属轴线之上,数据集内的所有变量将连在一起形成一个多边形。
然而,雷达图有一些重大缺点:在一个雷达图中使用多个多边形,会令图表难以阅读,而且相当混乱。特别是如果用颜色填满多边形,表面的多边形会覆盖着下面的其他多边形。此外,过多变量也会导致出现太多的轴线,使图表难以阅读和变得复杂,故雷达图只能保持简单,因而限制了可用变量的数量。雷达图的另一缺点是它未能很有效地比较每个变量的数值。即使借助蜘蛛网般的网格指引,在直线轴上比较数值始终较为容易。
也称为「象形统计图」。使用图案来显示数据量的象形图 (Pictogram Chart) 让人可以更全面地了解小型数据集,而且所用图案通常切合数据主题或类别,例如关于人口数据的图表将使用人物图案。每个图案可以表示一个单位或任何数量或单位(例如每个图案表示 10 个)。通过了解列或行中的图案多少,我们可以对数据集的每个类别进行比较。使用图案能克服语言、文化和教育水平方面的差异,是更具代表性的数据显示方法。举个例子,如果数据是「5 辆车」,图中便会显示 5 个汽车图案。使用象形图时有两点要避免:用于大型数据集,令人难以计数。只显示部分图案,令人混淆它们到底代表什么。
也称为“范围条形/柱形图”或“浮动条形图”。用来显示数据集内最小值和最大值之间的范围,适合用来比较范围,尤其是已分类的范围。跨度图只集中显示极端数值,不提供任何关于最小值和最大值之间的数值、整体平均值或数据分布等其他信息。
点阵图表 (Dot Matrix Chart) 以点为单位显示离散数据,每种颜色的点表示一个特定类别,并以矩阵形式组合在一起。适合用来快速检视数据集中不同类别的分布和比例,并与其他数据集的分布和比例进行比较,让人更容易找出当中模式。当只有一个变量/类别时(所有点都是相同颜色),点阵图表相等于比例面积图。
又称为“极面积图”。统计学家和医学改革家佛罗伦萨‧南丁格尔 (Florence Nightingale) 曾在克里米亚战争期间使用这种图表传达士兵身亡情况,故得名。南丁格尔玫瑰图 (Nightingale Rose Charts) 绘制于极座标系之上。每个数据类别或间隔在径向图上划分为相等分段,每个分段从中心延伸多远(与其所代表的数值成正比)取决于极座标轴线。因此,从极座标中心延伸出来的每一环可以当作标尺使用,用来表示分段大小并代表较高的数值。在南丁格尔玫瑰图中,代表数值的是分段面积,而不是其半径。南丁格尔玫瑰图的主要缺点在于面积较大的外围部分会更加引人注目,这跟数值的增量成反比。
非常适合用来比较数值和显示比例(尺寸、数量等),以便快速全面地了解数据的相对大小,而无需使用刻度。这种图表的缺点在于使用面积图难以得出估值,也就是说它们几乎只能用于通信目的,而不能作分析用途。虽然比例面积图通常使用正方形或圆形,但其实也可以使用任何形状,只要所使用的形状面积是表示数据即可。这种面积图的常见技术错误是,使用长度来确定形状大小,而非计算形状中的空间面积,导致数值出现指数级的增长和减少。
也称为“标签云图”。通过使每个字的大小与其出现频率成正比,显示不同单词在给定文本中的出现频率,然后将所有的字词排在一起,形成云状图案,也可以任何格式排列:水平线、垂直列或其他形状。字云图 (Word Cloud) 也可用于显示获分配元数据的单词。举个例子,我们把世界各地所有国家的名称加到字云中,再将人口数量分配给每个国家,以确定其名称的字体大小。在字云图上使用颜色通常都是毫无意义的,主要是为了美观,但我们可以用颜色对单词进行分类或显示另一个数据变量。字云图通常用于网站或博客上,以描述关键字或标签使用,也可用来比较两个不同的文本。
虽然简单易懂,但字云图有着一些重大缺点:较长的字词会更引人注意。字母含有很多升部/降部的单词可能会更受人关注。分析精度不足,较常是为了美观。
饼形图 (Pie Chart) 获广泛应用于项目演示和办公室,把一个圆圈划分成不同比例的分段,以展示各个类别之间的比例和百分比。每个圆弧的长度代表每个类别的所占比例,而全圆则表示所有数据的总和,相等于 100%。
饼形图适合用来快速展示数据比例分布,但主要缺点是:
尽管如此,如要在单一饼形图中比较给定类别在整体中所占的比例,这仍是有效之选。
圆环图 (Donut Chart) 基本上就是饼形图,只是中间的部分被切掉。然而,圆环图比饼形图略有优势,因为后者不时被人批评,说它只将重点放在不同部分彼此或相对于整体的大小关系,但当与其他饼形图作整体比较时,却不能显示出任何变化。圆环图算是解决了这个问题的其中一部分,让人不再只看“饼”的面积,反面更重视总体数值的变化:专注于阅读弧线的长度,而不是比较“饼与饼”之间的比例不同。另外,圆环图中间的空白处更可以用来显示其他信息,因此更能节省空间。
桑基图 (Sankey Diagram) 用来显示流向和数量(彼此之间的比例)。箭头或线的宽度用于显示大小,因此箭头越大,流量也越大。在每个流程阶段中,流向箭头或线可以组合在一起,或者往不同路径各自分开。我们可用不同颜色来区分图表中的不同类别,或表示从一个阶段到另一个阶段的转换。桑基图通常用于显示能量、金钱或材料数据的转移,但也可用于显示任何独立系统的流程。
热图 (Heatmap) 通过色彩变化来显示数据。当应用在表格时,热图适合用来交叉检查多变量的数据,方法是把变量放置于行和列中,再将表格内的不同单元格进行着色。热图适用于显示多个变量之间的差异;显示当中任何模式;显示是否有彼此相似的变量;以及检测彼此之间是否存在任何相关性。通常所有水平行都同属一个类别(在左侧或右侧显示的标签);而所有垂直列将被分配为另一类别(在顶部或底部显示的标签)。每行或每列会再被分成子类别,全都以矩阵形式相互匹配。表格中的单元格内有不同颜色编码的分类数据,或是基于颜色标度的数字数据。单元格内的数据是基于相连行和列中两个变量之间的关系。我们需要图解来帮助阅读热图。分类数据采用不同颜色编码表示,而数字数据则需要一个颜色标度(从一种颜色转到另一种颜色)来帮忙表示高低值之间的差异。我们可以使用一系列的纯色来表示多个范围的数值(0-10、11-20、21-30等),或者可以将两种或多种颜色混合在一起,使用渐变标度来表示单一范围(例如 0 - 100)。由于热图依赖颜色来表达数值,它比较适合用来显示广泛数值数据,因为要准确地指出色调之间的差异始终有难度,也较难从中提取特定数据点(除非在单元格中加入原始数据)。如果将其中一行/列设为时间间隔,热图也可用于显示数据随时间的变化。其中一个例子就是使用热图来比较全年多个城市的温度变化,看看最热或最冷的地方在哪儿:我们可以把要比较的城市在水平行中列出,而垂直列则是月份,然后在单元格内填上温度值。
也称为“集合图”。文氏图 (Venn Diagram) 显示集与集之间所有可能存在的逻辑关系,每个集通常以一个圆圈表示。每个集都是一组具有共同之处的物件或数据。当多个圆圈(集)相互重迭时,称为交集 (intersection),里面的数据同时具有重迭集中的所有属性。这里只显示了由 2 个数据集组成的文氏图,但也有 3、4、5、6 甚至 7 个数据集相互重迭的例子。
弧线图 (Arc Diagram) 是二维双轴图表以外另一种数据表达方式。在弧线图中,节点 (Nodes) 将沿着 X轴(一维轴)放置,然后再利用弧线表示节点与节点之间的连接关系。每条弧线的粗幼度表示源节点和目标节点之间的频率。弧线图适合用来查找数据共同出现的情况。弧线图的缺点:不能如其他双轴图表般清楚显示节点之间的结构和连接,而且过多连接也会使图表难于阅读。
弦图 (Chord Diagram) 可以显示不同实体之间的相互关系和彼此共享的一些共通之处,因此这种图表非常适合用来比较数据集或不同数据组之间的相似性。节点围绕着圆周分布,点与点之间以弧线或贝塞尔曲线彼此连接以显示当中关系,然后再给每个连接分配数值(通过每个圆弧的大小比例表示)。此外,也可以用颜色将数据分成不同类别,有助于进行比较和区分。弦图的缺点是过于混乱,尤其是当要显示太多连接的时候。
非彩带弦图 (Non-ribbon Chord Diagram) 是弦图的一个精简版本,仅显示节点和连接线,更加强调数据之间的连接关系。
也称为“网络地图”或“节点链路图”。这种图表使用节点/顶点和连接线来显示事物之间的连接关系,并帮助阐明一组实体之间的关系类型。这些节点通常是圆点或小圆圈,但也可以使用图标。节点之间的连接关系通常以简单的线条表示,但在某些网络图中,并非所有节点和连接都有相同属性,故可藉此显示其他变量,例如通过节点大小或连接线的粗幼来表示其与数值之间的比例。通过描绘出链路连接系统、查找任何节点集群、节点连接的密度或图表布局,网络图可以用来解释各种网络结构。两种主要网络图分别为“不定向”和“定向”网络图;不定向网络图仅显示实体之间的连接,而定向网络图则可显示连接是单向还是双向(通过小箭头)。网络图数据容量有限,并且当节点太多时会形成类似“毛球”的图案,使人难以阅读。
后续内容,请查看 一图胜千言:数据可视化不完全总结(二)
大数据可视化是个热门话题,在信息安全领域,也由于很多企业希望将大数据转化为信息可视化呈现的各种形式,以便获得更深的洞察力、更好的决策力以及更强的自动化处理能力,数据可视化已经成为网络安全技术的一个重要趋势。
文章目录
一、什么是网络安全可视化
11 故事+数据+设计 =可视化
12 可视化设计流程
二、案例一:大规模漏洞感知可视化设计
21整体项目分析
22分析数据
23匹配图形
24确定风格
25优化图形
26检查测试
三、案例二:白环境虫图可视化设计
31整体项目分析
32分析数据
33 匹配图形
34优化图形
35检查测试
一、什么是网络安全可视化
攻击从哪里开始?目的是哪里?哪些地方遭受的攻击最频繁……通过大数据网络安全可视化图,我们可以在几秒钟内回答这些问题,这就是可视化带给我们的效率 。 大数据网络安全的可视化不仅能让我们更容易地感知网络数据信息,快速识别风险,还能对事件进行分类,甚至对攻击趋势做出预测。可是,该怎么做呢?
11 故事+数据+设计 =可视化
做可视化之前,最好从一个问题开始,你为什么要做可视化,希望从中了解什么?是否在找周期性的模式?或者多个变量之间的联系?异常值?空间关系?比如政府机构,想了解全国各个行业漏洞的分布概况,以及哪个行业、哪个地区的漏洞数量最多;又如企业,想了解内部的访问情况,是否存在恶意行为,或者企业的资产情况怎么样。总之,要弄清楚你进行可视化设计的目的是什么,你想讲什么样的故事,以及你打算跟谁讲。
有了故事,还需要找到数据,并且具有对数据进行处理的能力,图1是一个可视化参考模型,它反映的是一系列的数据的转换过程:
我们有原始数据,通过对原始数据进行标准化、结构化的处理,把它们整理成数据表。
将这些数值转换成视觉结构(包括形状、位置、尺寸、值、方向、色彩、纹理等),通过视觉的方式把它表现出来。例如将高中低的风险转换成红黄蓝等色彩,数值转换成大小。
将视觉结构进行组合,把它转换成图形传递给用户,用户通过人机交互的方式进行反向转换,去更好地了解数据背后有什么问题和规律。
最后,我们还得选择一些好的可视化的方法。比如要了解关系,建议选择网状的图,或者通过距离,关系近的距离近,关系远的距离也远。
总之,有个好的故事,并且有大量的数据进行处理,加上一些设计的方法,就构成了可视化。
12 可视化设计流程
一个好的流程可以让我们事半功倍,可视化的设计流程主要有分析数据、匹配图形、优化图形、检查测试。首先,在了解需求的基础上分析我们要展示哪些数据,包含元数据、数据维度、查看的视角等;其次,我们利用可视化工具,根据一些已固化的图表类型快速做出各种图表;然后优化细节;最后检查测试。
具体我们通过两个案例来进行分析。
二、案例一:大规模漏洞感知可视化设计
图2是全国范围内,各个行业漏洞的分布和趋势,橙黄蓝分别代表了漏洞数量的高中低。
21整体项目分析
我们在拿到项目策划时,既不要被大量的信息资料所迷惑而感到茫然失措,也不要急于完成项目,不经思考就盲目进行设计。首先,让我们认真了解客户需求,并对整体内容进行关键词的提炼。可视化的核心在于对内容的提炼,内容提炼得越精确,设计出来的图形结构就越紧凑,传达的效率就越高。反之,会导致图形结构臃肿散乱,关键信息无法高效地传达给读者。
对于大规模漏洞感知的可视化项目,客户的主要需求是查看全国范围内,各个行业的漏洞分布和趋势。我们可以概括为三个关键词:漏洞量、漏洞变化、漏洞级别,这三个关键词就是我们进行数据可视化设计的核心点,整体的图形结构将围绕这三个核心点来展开布局。
22分析数据
想要清楚地展现数据,就要先了解所要绘制的数据,如元数据、维度、元数据间关系、数据规模等。根据需求,我们需要展现的元数据是漏洞事件,维度有地理位置、漏洞数量、时间、漏洞类别和级别,查看的视角主要是宏观和关联。涉及到的视觉元素有形状、色彩、尺寸、位置、方向,如图4。
23匹配图形
24确定风格
匹配图形的同时,还要考虑展示的平台。由于客户是投放在大屏幕上查看,我们对大屏幕的特点进行了分析,比如面积巨大、深色背景、不可操作等。依据大屏幕的特点,我们对设计风格进行了头脑风暴:它是实时的,有紧张感;需要新颖的图标和动效,有科技感;信息层次是丰富的;展示的数据是权威的。
最后根据设计风格进一步确定了深蓝为标准色,代表科技与创新;橙红蓝分别代表漏洞数量的高中低,为辅助色;整体的视觉风格与目前主流的扁平化一致。
25优化图形
有了图形后,尝试把数据按属性绘制到各维度上,不断调整直到合理。虽然这里说的很简单,但这是最耗时耗力的阶段。维度过多时,在信息架构上广而浅或窄而深都是需要琢磨的,而后再加上交互导航,使图形更“可视”。
在这个任务中,图形经过很多次修改,图7是我们设计的过程稿,深底,高亮的地图,多颜色的攻击动画特效,营造紧张感;地图中用红、黄、蓝来呈现高、中、低危的漏洞数量分布情况;心理学认为上方和左方易重视,“从上到下”“从左至右”的“Z”字型的视觉呈现,简洁清晰,重点突出。
完成初稿后,我们进一步优化了维度、动效和数量。维度:每个维度,只用一种表现,清晰易懂;动效:考虑时间和情感的把控,从原来的15ms改为35ms;数量:考虑了太密或太疏时用户的感受,对圆的半径做了统一大小的处理。
26检查测试
最后还需要检查测试,从头到尾过一遍是否满足需求;实地投放大屏幕后,用户是否方便阅读;动效能否达到预期,色差是否能接受;最后我们用一句话描述大屏,用户能否理解。
三、案例二:白环境虫图可视化设计
如果手上只有单纯的电子表格(左),要想找到其中IP、应用和端口的访问模式就会很花时间,而用虫图(右)呈现之后,虽然增加了很多数据,但读者的理解程度反而提高了。
31整体项目分析
当前,企业内部IT系统复杂多变,存在一些无法精细化控制的、非法恶意的行为,如何精准地处理安全管理问题呢?我们的主要目标是帮助用户监测访问内网核心服务器的异常流量,概括为2个关键词:内网资产和访问关系,整体的图形结构将围绕这两个核心点来展开布局。
32分析数据
接下来分析数据,案例中的元数据是事件,维度有时间、源IP、目的IP和应用,查看的视角主要是关联和微观。
33 匹配图形
根据以往的经验,带有关系的数据一般使用和弦图和力导向布局图。最初我们采用的是和弦图,圆点内部是主机,用户要通过3个维度去寻找事件的关联。通过测试发现,用户很难理解,因此选择了力导向布局图(虫图)。第一层级展示全局关系,第二层级通过对IP或端口的钻取进一步展现相关性。
34优化图形
优化图形时,我们对很多细节进行了调整: – 考虑太密或太疏时用户的感受,只展示了TOP N。 – 弧度、配色的优化,与我们UI界面风格相一致。 – IP名称超长时省略处理。 – 微观视角中,源和目的分别以蓝色和紫色区分,同时在线上增加箭头,箭头向内为源,向外是目的,方便用户理解。 – 交互上,通过单击钻取到单个端口和IP的信息;鼠标滑过时相关信息高亮展示,这样既能让画面更加炫酷,又能让人方便地识别。
35检查测试
通过调研,用户对企业内部的流向非常清楚,视觉导向清晰,钻取信息方便,色彩、动效等细节的优化帮助用户快速定位问题,提升了安全运维效率。
四、总结
总之,借助大数据网络安全的可视化设计,人们能够更加智能地洞悉信息与网络安全的态势,更加主动、弹性地去应对新型复杂的威胁和未知多变的风险。
可视化设计的过程中,我们还需要注意:1、整体考虑、顾全大局;2、细节的匹配、一致性;3、充满美感,对称和谐。
[what]什么是数据可视化?
塔夫特所说,“图形表现数据。实际上比传统的统计分析法更加精确和有启发性。”对于广大的编辑、设计师、运营分析师、大数据研究者等等都需要从不同维度、不同层面、不同粒度的数据处理统计中,借助图表和信息图的方式为用户(只获得信息)、阅读者(消费信息)及管理者(利用信息进行管理和决策)呈现不同于表格式的分析结果。数据可视化技术综合运用计算机图形学、图像、人机交互等,将采集、清洗、转换、处理过的符合标准和规范的数据映射为可识别的图形、图像、动画甚至视频,并允许用户与数据可视化进行交互和分析。而任何形式的数据可视化都会由丰富的内容、引人注意的视觉效果、精细的制作三个要素组成,概括起来就是新颖而有趣、充实而高效、美感且悦目三个特征。
[why]为什么要进行数据可视化?
无论是哪种职业和应用场景,数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。并且利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。而人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加深和强化受众对于数据的理解和记忆。
[how] 如何实现可靠的数据可视化
数据可视化包括数据的采集、分析、治理、管理、挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式,或许是二维图表、三维立体视图,不管是什么样的信息图,最后由前端工程师创建对应的可视化算法及前端渲染和展现的实现。如果仅仅是能够将数据转化成漂亮的图表,设计出固定维度、不同式样的图表来解释你的观点,并不说明这样的结局就足够好。这只是一个简单的开始,只是一个美好愿望的萌芽。如果要成功报告结果,将你所分析的度量和数据有效地转化为有商业价值的见解,使其能够为基于事实所做的决策提供支持,那么还需要做更多的功课。
色彩提升信息可视化的视觉效果。在信息可视化通过造型元素明确传达信息及叙述的基础上,把握好视觉元素中色彩的运用,使图形变得更加生动、有趣,信息表达得更加准确和直观。色彩可以帮助人们对信息进行深入分类,强调和淡化、生动而有趣的可视化作品的表现形式,常常给受众带来视觉效果上的享受。当然,视觉效果要将企业品牌的色调融合进去,和企业的品牌文化保持高度的一致,这是一个最基本的常识。比如,如果企业的品牌色调比较热衷红色,你设计的可视化效果,就要有意识地朝着这个基调靠拢。但没有必要吻合,因为红色的可视化效果,通常都包含警示的韵味,所以,红色适合做预警、提醒和突出信息的功能。
排版布局增强信息可视化的叙事性。我有酒,你有故事吗?排版布局四大基本原则:
(1)对比(Contrast): 如果两个项不完全相同,就应当使之不同,而且应当是截然不同。
(2)重复(Repetition):设计的某些方面在整个作品中重复。
(3)对齐(Alignment):任何元素都不能在页面上随意安放。每一项都应当与页面上的某个内容存在某种视觉联系。
(4)亲密性(Proximity):将相关的项组织在一起,使它们的物理位置相互靠近相关的项将被看作凝聚为一体的一个组。
动态增加信息可视化的视觉体验。在信息可视化的视觉表达中,动态地将相互分离的各种信息传播形式有机地融合在一起,进行有关联、有节奏的信息处理、传输和实现。最终的目的是,为了实现数据之间的联动,解释数据表现之间驱动和联系的关系。通过图表样式和色彩的运动,满足受众的视觉感受,同时将信息内容更加深刻而精简地传达给阅读者,使整个信息传达的过程更加轻松便捷。对于数据可视化有诸多工具,如:ECharts、iCharts、D3js、Flot、Raphaël等功能都十分强大,但对于非专业可视化而又经常与图表打交道的职场人士来说,一款轻便易学而又实用的可视化软件则显得十分重要。比如cognos、tebleue等。如果需要展现的数据结构不是特别复杂,而又要把数据展现的绚丽多彩,而且具有交互性,那么水晶易表是不二之选。
1.谁是你的阅读者?
无论你是否在做一份传统的报表还是新式的信息图,首先问问自己有哪些阅读者看到这份报告?他们对将要讨论的事项了解多少?他们需要什么?、还有,他们会如何利用你要展示的信息和数据呢?而我在 《一份靠谱的数据分析报告都有什么套路?》 里讲过,明确清晰的分析目标和方法会有多重要,因为只有明确分析目标,才能有一个良好的驱动过程。无论是目标驱动还是分析过程驱动,后续的数据分析工作和分析报告里所要呈现的全部内容事项都是紧紧围绕着这个目标主题而服务的。
2.规划数据可视化方案
数据可视化方案,是一定是能够解决用户特定问题的。既然是能够解决用户特定的问题,那么这样的高度,是在基于你在深入地理解了这些数据的现象和本质的基础之上。简单来说,就是你的可视化方案,不仅懂得并且能够很好地解释数据分析的结论、信息和知识。并且管理者能够沿着你规划的可视化路径能够迅速地找到和发现决策之道。
举例来说,当企业的业绩不达标时(企业的业绩是否达标,关系到企业最关键的利益和存亡。)可视化方案的设计路径应该是这样的:
Step1,从整体运营出发,明确有哪些关键因素会影响成交和业绩。
比如:有效名单、demo品质、客服服务、产品属性等,相应地去看这些关键因素对应的KPI的表现,对整体的业绩来讲,这些因素都会是驱动因素,这些因素对应的KPI都会是对STV有直接驱动和影响作用的。这些驱动数据的可视化是基础,也是寻找解决方案最终的出发点和落脚点。因为,这些数据的表现,是关乎运营成功与否的最直接视图。
Step2,对关键因素深入分析确定是什么因素导致了业绩没达成,发现和挖掘导致业绩未达标的根本原因和问题。
比如:
1、对比分析,逐一观测201601月-201612月全部关键因素对应的KPI的表现,对比成交业绩最高的月份和成交业绩最差月份的关键因素对应的KPI差异在哪里,能够快速定位出哪些方面、哪些因素导致业绩未达标。然后能够有针对性地驱动和帮助业务部门去改善。
2、追踪对成交和业绩有驱动和改善的行动方案的落地和实施进度,存在什么样的问题,是否存在行动方
可视化技术的应用实例
本文2023-10-25 13:20:18发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/168370.html