博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python数据分析库之pandas,你该这么学!No.1
阅读量:6583 次
发布时间:2019-06-24

本文共 2792 字,大约阅读时间需要 9 分钟。

写这个系列背后的故事

咦,面试系列的把基础部分都写完啦,哈哈答,接下来要弄啥嘞~

pandas吧

外国人开发的 翻译成汉语叫 熊猫

厉害厉害,很接地气 一个基于numpy的库

干啥的? 做数据分析用的

而数据分析是python体系下一个非常庞大的分支

厉害到,好多人一看就会(博主就不是)

博主将用不知道多少篇博客把她给你捣鼓明白(说白了,就是没写大纲!)

当然也可能让你失去对她的兴趣

毕竟,博主叫梦想橡皮擦啊

擦掉你编程的梦想也是我努力的一部分

下载按照这个库

这个库,安装easy

你只要这样,这样,然后在这样,中间出现问题,百度一下,这样,这样,就好了... ...

嘿嘿

我其实用的是python3.6版本 然后通过下面的命令安装的

pip install pandas 复制代码

国内,一般安装比较慢,你添加一个清华大学的源就好了

pip install pandas -i  https://pypi.tuna.tsinghua.edu.cn/simple/复制代码

下载&安装速度就嗷嗷的了

pandas版本为

pandas 0.23.3

你的版本比我应该高,

毕竟我是老程序员了

pandas官网

没有翻译完的伪中文网

安装之后

一番简单的操作之后,如果过程中你没有出现任何BUG 恭喜你,安装成功

下面打开你的任意开发工具

一般我用“被免费版”的pycharm

创建一个文件,然后输入下面的代码,直接run

import pandas复制代码

没有报错,完美,一个库学会了

当然,一般写成

import pandas as pd复制代码

你就和国际程序员接轨了

pandas主要干啥

如果你英文好,直接打开官方文档

瞅就可以了

如果英语不好,没关系

你这么理解,pandas就像用代码操作excel一样,一样一样的

在pandas中,你要学习一个新的数据结构

Series

百度翻译,恩,先记住发音吧 say 额 瑞 z 多么棒的标注,中英结合。

这是一种什么样的数据结构呢?

在解释这个问题前,我们先创建一个,然后在代码中看看

不就清晰明了了么

编写下面的代码

import pandas as pdmy_series = pd.Series(['我','是','梦想','橡皮擦'])print(my_series)复制代码

运行结果

0      我1      是2     梦想3    橡皮擦dtype: object复制代码

好像也有看出来了啥?

别着急,弄到excel里面瞅瞅,直接复制就好

看到没,我们通过列表创建了一个
series

在excel中,你需要先确定你知道什么是行,什么是列

横着的叫行,竖着的叫列

你通过列表创建series之后,每行的前面出现一个从0开始的序号

这个新出现的序列,记住,叫索引, 既然叫做索引了,那么我们就可以给索引设置值

如果你有编程经验,那么你知道,索引值对应的英文叫做index

every 编程语言索引基本都是设置index

那我们在重写一下

import pandas as pdmy_series = pd.Series(['我','是','梦想','橡皮擦'],index=['a','b','c','d'])print(my_series)复制代码

看一下结果 索引变了吧

a      我b      是c     梦想d    橡皮擦dtype: object复制代码

继续往里面挖,注意index和前面列表的长度一定要一致

什么意思?

pd.Series(['我','是','梦想','橡皮擦'],index=['a','b','c','d','e']) 报错 pd.Series(['我','是','梦想','橡皮擦'],index=['a','b','c']) 报错

声明一个series的函数中,还可以携带一个name参数

请查看

import pandas as pdmy_series = pd.Series(['我','是','梦想','橡皮擦'],index=['a','b','c','d'],name='梦想序列')print(my_series)复制代码

结果瞅瞅

a      我b      是c     梦想d    橡皮擦Name: 梦想序列, dtype: object复制代码

接下来,可以把前面的列表参数也写完整了

import pandas as pdmy_series = pd.Series(data = ['我','是','梦想','橡皮擦'],index=['a','b','c','d'],name='梦想序列')print(my_series)复制代码

总结一下

创建一个series是非常容易的,只需要采用

pd.Series(data=列表,index=列表,name=名称就可以)复制代码

其他创建方式

用字典也是可以的

my_series1 = pd.Series({
'a':'非本科程序员','b':'公号'})print(my_series1)复制代码

Series里面存储不同类型也是可以的

my_series2 = pd.Series([1,1.2,True,'MyName'])print(my_series2)复制代码

这个Series你把他当成只有一列的excel就好了

咦?有人问了,刚才打印的结果不是2列么

没关系,那个是索引,只是获取值的一个序号罢了

不信,我们获取一下

my_series2 = pd.Series([1,1.2,True,'MyName'])print(my_series2[0])复制代码

打印出来了吧

在试试

import pandas as pdmy_series = pd.Series(data = ['我','是','梦想','橡皮擦'],index=['a','b','c','d'],name='梦想序列')my_series1 = pd.Series({
'a':'非本科程序员','b':'公号'})my_series2 = pd.Series([1,1.2,True,'MyName'])print(my_series1['a']) # 通过索引 a 访问到了“非本科程序员”print(my_series[0]) # 通过索引 0 访问到了“我“,通过my_series['a']依旧可以复制代码

这样子,你是不是感觉series跟python中的列表有点相似了呢?

好像还有点字典的感觉

这就对了,下篇见吧

我们会对series继续研究的~

最后,欢迎关注一个唠叨的编程工程师的公号,非本科程序员

你懒得搜,就打开这个链接吧

或者掏出你的手机,拍这个

转载地址:http://assno.baihongyu.com/

你可能感兴趣的文章
使用SecureCRT连接ubuntu
查看>>
php学习之路:WSDL详细解释(两)
查看>>
开发板上修改时间方法date命令【转】
查看>>
linux 实时时钟(RTC)驱动【转】
查看>>
QTP的那些事---页面弹出框的处理,页面等待加载的处理
查看>>
Hadoop HDFS编程 API入门系列之HdfsUtil版本1(六)
查看>>
22. 使用 awk / grep / head / tail 命令进行文本 / 日志分析
查看>>
GNU make manual 翻译(五十)
查看>>
Silverlight 5 RC新特性探索系列:13.Silverlight 5 RC 新增对并行任务库(TPL)的支持
查看>>
Linux : select()详解 和 实现原理【转】
查看>>
FPGROWTH算法
查看>>
使用makecontext实现用户线程【转】
查看>>
iOS:多线程NSThread的详细使用
查看>>
ASP.NET Web页面(.aspx)添加用户控件(.ascx)无显示的问题
查看>>
Oracle 异常错误处理
查看>>
浅谈网址导航网站的成功推广方案大揭秘
查看>>
WiFi万能钥匙内测位置服务“小广告”
查看>>
是什么让IBM逐渐变成一家数字营销公司?
查看>>
软银:成为日本第二家净利润过万亿日元企业
查看>>
十大场景案例详解:人工智能如何提升商业效益 | 硬创公开课
查看>>