1行代码实现Python数据分析:图表美观清晰,自带

科技 admin 浏览

小编:萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你是否也在朋友圈看过这样的小广告: 「你要悄悄学Python,然后惊艳所有人。」 现在,GitHub上一位博主告诉你:不用学,用 sweetviz 就行。

萧箫 发自 凹非寺

量子位 报道 | 公众号 QbitAI

你是否也在朋友圈看过这样的小广告:

「你要悄悄学Python,然后惊艳所有人。」

现在,GitHub上一位博主告诉你:不用学,用 sweetviz就行。

这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现 数据集可视化、分析与比较

我们以Titanic数据集为例,输入一行代码:

一个 1080p的清晰网页界面就出现在了眼前。

不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。

所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。

在这样的数据分析下,结果一目了然。

Titanic数据集部分功能细节展示

这样的效果,是基于3个主函数实现的。

3种函数用法 analyze丨数据分析

数据分析函数中,有4个参数source,target_feat,feat_cfg和pairwise_analysis需要被设置。

source:以pandas中的DataFrame数据结构、或是DataFrame中的某一类字符串作为分析对象。

target_feat:需要被标记为目标对象的字符串。

feat_cfg:需要被跳过、或是需要被强制转换为某种数据类型的特征。

pairwise_analysis:相关性和其他类型的数据关联可能需要花费较长时间。如果超过了某个阈值,就需要设置这个参数为on或者off,以判断是否需要分析数据相关性。

数据相关性分析效果,可能需要花费一定时间 compare丨两个数据集比较

如果想要对两个数据集进行对比分析,就使用这个比较函数。

例子中的my_dataframe和test_df是两个数据集,分别被命名为训练数据和测试数据。

除了这个被插入的数据集,剩余的参数与analyze中的一致。

compare_intra丨数据集栏目比较

想要对数据集中某个栏目下的参数进行分析,就采用这个函数进行。

例如,如果需要比较“性别”栏目下的“男性”和“女性”,就可以采用这个函数。

理解这几种函数的变量后,一行代码就能实现Python数据分析。

使用指南

sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:

当前网址:http://xahengda.com/keji/2020/0706/2520.html

 
你可能喜欢的: