摘要:AI 时代的浪潮下,数据可视化与 AI 碰撞出耀眼火花。本文将带你领略这场变革中,数据分析师如何借助 AI 提升工作效率,挖掘数据深层价值,以及掌握数据可视化核心原则的重要性。
AI 时代的浪潮下,数据可视化与 AI 碰撞出耀眼火花。本文将带你领略这场变革中,数据分析师如何借助 AI 提升工作效率,挖掘数据深层价值,以及掌握数据可视化核心原则的重要性。
在数据爆炸的 AI 时代,数据可视化不再只是展示,而是洞察的催化剂。
当数据可视化遇见 AI,我发现数据分析师的工作方式正在经历一场前所未有的变革。
最近,我在思考 AI 时代怎么做好数据可视化,通过 https://clauswilke.com/dataviz 阅读了《Fundamentals of Data Visualization》这本书。
书中内容源于作者过去成千上万的数据可视化经验,主要讲了数据可视化的一般原则,而不是具体工具的应用。
我觉得无论 AI 技术怎么发展,理解数据可视化的基础知识,仍然是有价值的。
如果掌握了数据可视化的底层逻辑,就能更好地举一反三,把它应用到实际工作和生活中,去创造更大的价值。
反之,如果一个人缺乏数据可视化的基本常识,虽然用 AI 提升了制作图表的效率,做出了看起来很漂亮的数据仪表盘,但是无法判断 AI 生成结果的好坏,不能从数据中洞察有价值的信息,甚至把一些花花绿绿的垃圾当成宝贝,就会让人觉得不够专业。
数据可视化的质量,可能决定了数据分析成果的影响力:是赢得尊重?还是默默无闻?
作者在引言中举了一个例子,其中包括 4 个图表:
(a)合理的图表(Reasonable):看起来可能平平无奇,但至少是可以接受的,没有明显的缺陷。
(b)丑陋的图表(Ugly):虽然技术上没问题,但是视觉上不够美观。例如,颜色过于鲜艳、字体混乱、背景网格过于突出等。
(c)糟糕的图表(Bad):第二个图表存在感知方面的缺陷,可能不够清晰、过于复杂或令人困惑。例如,使用不同的 Y 轴刻度展示多个数据系列,容易让人误以为数据差异小于实际情况。
**(d)错误的图表(Wrong)****:存在数学方面的问题,在客观上是错误的,无法正确体现真实数据。例如,没有明确的Y轴刻度,使得数据的实际值无法确定。
审美是一种主观的感受,对于同一个图表,有些人认为是丑陋的,而有些人则认为可以接受,但无论如何,只有提升自己的审美能力,才能做出更加好看的图表。
所有数据可视化图表都是一些基本元素的排列组合,包括:位置、形状、大小、颜色、线宽、线型等,其中有些元素可以同时表示连续数据和离散数据(位置、大小、颜色、线宽),而另一些元素只能表示离散数据(形状、线型)。在不同的语境中,大小包含长度、角度和面积等。
例如,下面这个图表,用位置和方块表示每个月不同的地区,用颜色的亮度对应温度的高低。
颜色是数据可视化中最强大的、也是最容易被滥用的视觉元素。
合理使用颜色,可以增强信息传递,而不当使用颜色,则可能导致混淆或误导。
颜色主要有 3 种基本用途:区分数据组、表示数据值、突出重点。
(1)区分数据组
使用不同颜色来区分不同类别,确保颜色之间有足够的对比度。
例如,下图用颜色区分不同的地区。
(2)表示数据值
使用一种颜色的不同饱和度,或者使用不同颜色的渐变来表示数值的变化。
例如,下图用颜色表示不同的百分比数值,蓝色表示白人占多数。
(3)突出重点
为了避免分散受众的注意力,可以把重点突出的类型设置为深色,而把其他类型设置为浅色或灰色。
例如,下图用红色强调径赛运动员的身高和体脂率是相对比较低的。
数据可视化的类型有很多,包括:对比、分布、比例、关系、时间序列、地理空间和不确定性。
(1)展示对比的图表有常见的柱形图、条形图、点图、热力图等。
(2)展示分布的图表有直方图、密度图、累计密度图、Q-Q 图、箱线图、小提琴图、带状图、Sina 图等。
(3)展示比例的图表有饼图、柱形图、条形图、堆积柱状图等。
(4)展示关系的图表有散点图、气泡图、配对散点图、斜率图等。
(5)展示时间序列的图表有折线图、面积图、堆积面积图、扇形预测图等,下图源自《Python 数据可视化之美》。
(6)展示地理空间的图表有地图、分级统计地图、变形地图、 变形热力地图等。
(7)展示不确定性的图表有水平误差图、垂直误差图、二维误差图、渐变误差图等。
在实际工作中,面对纷繁复杂的问题和图表类型,我们还是需要具体问题具体分析,选择合适的图表类型,并利用 AI 和高效的图表制作工具,做出更具有洞察力的数据可视化图表。
AI 不仅能够快速生成漂亮的数据可视化图表,还能通过人工智能算法,提供更有价值的数据洞察,比如识别数据中的异常模式、相关性和趋势等。
在 AI 时代,我们可以借助 AI 工具,从繁琐的细节处理工作中解放出来,专注于更深层次的思考和决策,但一些基础理论和原则仍然是数据可视化的核心。
区别在于,AI 可以帮助我们更智能地应用这些原则,自动选择最合适的可视化方式,并优化视觉效果,从静态的数据展示,转变为动态可交互的信息探索,让数据故事变得更有说服力。
数据可视化的真正价值,不在于图表有多美,而在于能否揭示真相、启发思考、驱动行动。
在 AI 技术飞速发展的今天,我们不仅要有制作图表的能力,更要有洞察数据的眼光。
掌握数据可视化的基本原则和底层逻辑,是我们在信息洪流中保持清醒、做出正确决策的关键。
AI 能帮我们快速制作图表,但判断图表质量的责任,依然落在我们自己身上。
具体如何用 AI 快速制作动态可交互的图表,可以查看我的专栏:数据化分析案例库。
愿你用数据可视化的方法,讲好数据故事,让分析成果被看见、被理解、被采纳。
来源:人人都是产品经理