Quantcast
Channel: CodeSection,代码区,Python开发技术文章_教程 - CodeSec
Viewing all articles
Browse latest Browse all 9596

基于 Python 的数据可视化

$
0
0
基于 python 的数据可视化

一点号数据玩家2小时前

限时干货下载:添加微信公众号“数据玩家「fbigdata」”

回复【7】免费获取【完整数据分析资料!(包括SPSS、SAS、SQL、EXCEL、Project)!】

英文:kaggle

# 首先载入pandas

import pandasaspd

# 我们将载入seaborn,但是因为载入时会有警告出现,因此先载入warnings,忽略警告

import warnings

warnings.filterwarnings("ignore")

import seabornassns

importmatplotlib.pyplotasplt

sns.set(style="white"color_codes=True)

# 载入数据

iris=pd.read_csv("../input/Iris.csv")# 数据现在为 DataFrame格式

# 用head函数看一下数据结构啥样


php?url=0FMpYdnoRv" alt="基于 Python 的数据可视化" />

# 让我们用counts功能看下一共有多少种花

Iris-setosa 50

Iris-virginica 50

Iris-versicolor 50

# 使用 .plot 做散点图

iris.plot(kind="scatter"x="SepalLengthCm"y="SepalWidthCm")#数据为萼片的长和宽 结果如下


基于 Python 的数据可视化

# 开始使用seaborn了它能同时显示直方图噢

sns.jointplot(x="SepalLengthCm"y="SepalWidthCm"data=irissize=5)


基于 Python 的数据可视化

# 我们还可以用seaborn's FacetGrid 标记不同的种类噢

sns.FacetGrid(irishue="Species"size=5) #hue英文是色彩的意思

.map(plt.scatter"SepalLengthCm""SepalWidthCm")#注意这里的plt哦


基于 Python 的数据可视化

4 箱线图!

# Seaborn中的boxplot,可以画箱线图,可以看出不同种类的分布情况

sns.boxplot(x="Species"y="PetalLengthCm"data=iris)


基于 Python 的数据可视化

5、

# 利用striplot可以锦上添花,加上散点图

#

# 使振动值jitter=True 使各个散点分开,要不然会是一条直线

#

# 注意这里将坐标图用ax来保存了哦,这样第二次才会在原来的基础上加点

ax=sns.boxplot(x="Species"y="PetalLengthCm"data=iris)

ax=sns.stripplot(x="Species"y="PetalLengthCm"data=irisjitter=Trueedgecolor="gray")


基于 Python 的数据可视化

6、小提琴图

# 这图可以变现出密度的分布

sns.violinplot(x="Species"y="PetalLengthCm"data=irissize=6)


基于 Python 的数据可视化

# 通过这个曲线图可以看出不同特征值时的分布密度

sns.FacetGrid(irishue="Species"size=6)

.map(sns.kdeplot"PetalLengthCm")


基于 Python 的数据可视化

8.大招来了

# pairplot显示不同特征之间的关系

sns.pairplot(iris.drop("Id"axis=1),hue="Species"size=3)


基于 Python 的数据可视化

# 修改参数dige_kind

sns.pairplot(iris.drop("Id"axis=1),hue="Species"size=3diag_kind="kde")


基于 Python 的数据可视化

# 用Pandas 快速做出每个特征在不同种类下的箱线图

iris.drop("Id"axis=1).boxplot(by="Species"figsize=(126))


基于 Python 的数据可视化

他是将高维的点 化为二维的曲线,曲线是一条傅里叶函数的样子,参数项为不同的特征值,臆想出来了自变量t,这样每个点都是一条曲线

# 画图的函数在下面,我们会发现相同种类的线总是缠绵在一起,可以和聚类混在一起噢,事实上他们与欧氏距离是有关系的

frompandas.tools.plotting import andrews_curves

andrews_curves(iris.drop("Id"axis=1),"Species")


基于 Python 的数据可视化

# 轮廓图也是看高维数据的一种方法,将不同的特征放在横坐标,然后将各点的特征值放在纵坐标就可以了

frompandas.tools.plotting import parallel_coordinates

parallel_coordinates(iris.drop("Id"axis=1),"Species")


基于 Python 的数据可视化

# 这也是一种将高维点表现在二维平面的方法,具体作图方法应该在上面的网址上应该有

frompandas.tools.plotting import radviz


基于 Python 的数据可视化

Viewing all articles
Browse latest Browse all 9596

Trending Articles