pandas的简单使用-1-简单了解一下潘大师

发布时间 2023-04-13 16:27:10作者: 南风丶轻语

pandas的简单使用-1-简单了解一下潘大师

学习链接Pandas中文网,非常好的文档!

前言

Pandas 是 Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。

Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。

数据结构

维数 名称 描述
1 Series 带标签的一维同构数组
2 DataFrame 带标签的,大小可变的,二维异构表格

了解了pandas的数据结构,就比较好理解pandas的使用方法和API了,我们可以简单理解为:

①Series是一维数组,里面的元素类型一致

②DataFrame是二维数组,里面的元素类型可以不一致

获取学习数据

想要学习pandas的常用函数,必须构造一些假数据进行测试,但是自己写假数据费力费时的。

我的做法是直接通过读取csv文件,获取里面的数据作为测试数据

可以通过船长博客的链接获取学习数据,使用csv文件中的数据作为学习数据,相当便利,不用自己伪造数据。

这里下载的是https://vincentarelbundock.github.io/Rdatasets/datasets.html中的 Affairs来进行测试

image-20230403150917892

github