如何做高网站的浏览量,做网站接活全流程,质量好网站建设价格,外企网站建设服务公司目录
散点图
气泡图
时序图
关系图
散点图
Scatterplot#xff08;散点图#xff09;是一种用于展示两个变量之间关系的图表类型。在散点图中#xff0c;每个观测值#xff08;或数据点#xff09;都被表示为一个点#xff0c;其中横轴#xff08;…目录
散点图
气泡图
时序图
关系图
散点图
Scatterplot散点图是一种用于展示两个变量之间关系的图表类型。在散点图中每个观测值或数据点都被表示为一个点其中横轴X轴代表一个变量的值而纵轴Y轴代表另一个变量的值。这些点的位置即它们在图表上的x和y坐标反映了两个变量之间的关系。
散点图非常适合于初步探索两个变量之间是否存在关系以及这种关系的强度和方向。通过观察点的分布模式可以识别出正相关、负相关、无相关或非线性关系。在散点图中远离大多数数据点的观测值即异常值或极端值很容易被识别出来。同时在统计学中散点图可以用于支持或反驳关于两个变量之间关系的假设。
散点图需要注意一些问题
当数据点过多时散点图可能会变得难以解读因为点可能会重叠在一起。在这种情况下可以考虑使用其他可视化方法如密度图或六边形分箱图。散点图只能显示两个变量之间的关系如果数据集包含多个变量可能需要使用其他类型的图表如多维散点图或平行坐标图来展示更多信息。在解读散点图时要注意数据点的分布是否均匀以及是否存在潜在的偏差或异常值。
# 设置图形风格为whitegrid
sns.set(stylewhitegrid)
# 加载diamonds数据集
diamonds sns.load_dataset(diamonds)
# 创建一个8x8的图形
f, ax plt.subplots(figsize(8, 8))
# 去除图形的左边和底部的边框
sns.despine(f, leftTrue, bottomTrue)
# x轴为depthy轴为table颜色为红色数据为diamonds坐标轴为ax标记为圆形大小为100边框宽度为0.5边框颜色为白色
sns.scatterplot(xdepth, ytable,colorr,datadiamonds, axax, markero, s100, linewidth0.5, edgecolorw) 也可以使用plt绘制
# 生成一些随机数据
np.random.seed(0)
x np.random.rand(100)
y np.random.rand(100)
# 设置图表大小
plt.figure(figsize(10, 6))
# s是点的大小c是颜色alpha是透明度edgecolors是边缘颜色
plt.scatter(x, y, s50, cblue, alpha0.6, edgecolorsw)
# 添加标题和标签
plt.title(Scatterplot, fontsize16)
plt.xlabel(X Axis, fontsize14)
plt.ylabel(Y Axis, fontsize14)
# 设置坐标轴范围
plt.xlim(0, 1)
plt.ylim(0, 1)
# 添加网格线
plt.grid(True, whichboth, linestyle--, linewidth0.5)
# 显示图例
plt.legend([Data], locupper left, fontsize12)
# 显示图表
plt.show() 气泡图
气泡图Bubble Chart是一种多变量的数据可视化图表它是散点图的一种变体也可以看作是散点图和百分比区域图的组合。气泡图通过引入第三个变量来展示三个变量之间的关系使得数据展示更加丰富和全面。
多变量展示能够同时展示三个或更多维度的数据。直观比较通过气泡的位置和大小可以直观地比较不同类别的数据。灵活性强气泡图可以根据需要调整气泡的形状、颜色和透明度等属性以增强视觉效果。
# 加载名为planets的数据集
planets sns.load_dataset(planets)
# 创建一个颜色映射
cmap sns.cubehelix_palette(as_cmapTrue)
# 绘制散点图x轴为distancey轴为orbital_period颜色映射为year大小为mass
ax sns.scatterplot(xdistance, yorbital_period,hueyear, sizemass,palettecmap, sizes(10, 200),dataplanets) # 设置绘图风格为白色
sns.set(stylewhite)
# 加载mpg数据集
mpg sns.load_dataset(mpg)
# 绘制散点图x轴为horsepowery轴为mpg颜色根据origin分类大小根据weight分类
sns.relplot(xhorsepower, ympg, hueorigin, sizeweight,sizes(40, 400), alpha.5, paletteplasma,height6, datampg)时序图
Lineplot是Seaborn库中用于绘制折线图的函数它能够帮助用户可视化数据集中不同变量之间的关系特别是展示随时间变化的数据趋势。Lineplot函数的基本用法是传入x轴和y轴的数据以及包含这些数据的数据集DataFrame或类似结构。通过指定x和y参数Lineplot能够绘制出表示这两个变量之间关系的折线图。
Lineplot函数提供了多个参数来调整折线图的外观和行为
x, y分别指定折线图中x轴和y轴的数据。data指定包含x和y数据的数据集通常是pandas的DataFrame。hue可选参数用于根据某一列数据对折线进行分组着色以区分不同的数据系列。style可选参数用于指定折线的风格如线型、破折号样式等。markers可选参数设置为True时会在折线图上显示数据点便于观察具体的数据值。ci控制置信区间的显示如果不需要显示置信区间可以设置为None。
在使用Lineplot时需要确保传入的数据格式正确且x轴和y轴的数据长度必须相同。如果数据中包含缺失值NaNLineplot会自动跳过这些值进行绘图。Lineplot的绘图结果会受到Seaborn和matplotlib的样式设置影响因此可以通过调整这些库的样式设置来改变折线图的外观。
# 加载fmri数据集
fmri sns.load_dataset(fmri)
# 绘制折线图x轴为timepointy轴为signal根据region进行颜色区分根据event进行线条样式区分
sns.lineplot(xtimepoint, ysignal,hueregion, paletteplasma,styleevent,datafmri) # 创建一个随机数生成器种子为88
rs np.random.RandomState(88)
# 生成365个随机数每个随机数有4个值
values rs.randn(365, 4).cumsum(axis0)
# 创建一个日期范围从2016年1月1日开始共365天每天一个日期
dates pd.date_range(1 1 2016, periods365, freqD)
# 创建一个DataFrame包含生成的随机数和日期
data pd.DataFrame(values, dates, columns[A, B, C, D])
# 对DataFrame进行滚动平均窗口大小为7
data data.rolling(7).mean()
# data为数据集palette为颜色调色板linewidth为线宽
sns.lineplot(datadata, paletteinferno, linewidth3) 关系图
relplot是Seaborn库中用于绘制关系图的函数它是一个高级绘图函数能够灵活地处理多变量关系并自动生成具有多个子图的图表。
x, y分别指定图表的x轴和y轴数据。data包含绘图所需数据的数据集通常是pandas的DataFrame。hue用于根据某一列数据对数据进行分组并在图表中用不同的颜色表示。size控制数据点的大小或线条的粗细根据数据集中的某列进行映射。style控制数据点的样式或线条的样式如点型、线型等同样可以根据数据集中的某列进行映射。row, col用于将数据按照指定的列分割成多个子图分别绘制在行或列上。palette指定hue参数分组的颜色映射方案。height每个子图的高度单位英寸。aspect子图的宽高比默认为1。kind指定绘图的类型scatter或line。
# 加载名为dots的数据集
dots sns.load_dataset(dots)
# 绘制关系图x轴为timey轴为firing_rate根据coherence进行颜色区分根据choice进行大小区分根据align进行列区分
# size_order指定了大小顺序height指定了图形的高度aspect指定了图形的纵横比facet_kws指定了子图的关键字参数
# kind指定了图形的类型为线图legend指定了图例的位置为全图data指定了数据集为dots
sns.relplot(xtime, yfiring_rate,huecoherence, sizechoice, colalign,size_order[T1, T2],paletteviridis,height5, aspect.75, facet_kwsdict(sharexFalse),kindline, legendfull, datadots)# 加载名为 tips 的数据集
tips sns.load_dataset(tips)
# 绘制关系图x 轴为 total_billy 轴为 tip根据 smoker 进行颜色区分根据 day 进行列区分
# size_order 指定了大小顺序height 指定了图形的高度aspect 指定了图形的纵横比facet_kws 指定了子图的关键字参数
# kind 指定了图形的类型为线图legend 指定了图例的位置为全图data 指定了数据集为 tips
sns.relplot(xtotal_bill, ytip,huesmoker, colday,size_order[T1, T2], paletteinferno,height5, aspect.75, facet_kwsdict(sharexFalse),kindline, legendfull, datatips)