简介与安装
简介
Pandas是Python中一个专门用来做数据分析的第三方库,擅长处理数值型数据和时间序列数据。Padans封装了许多有用的功能,可以很方便的调用,足以轻松应对日常工作中的表格数据处理。相较于Excel,Pandas可以实现更加复杂的处理逻辑,以及提供更好的数据处理效率。
常用功能:
- 从xlsx、csv、sql等文件或工具中读取数据。
- 合并多个文件或电子表格中的数据,将数据拆分为独立文件。
- 数据清洗,如去重、处理缺失值、填充默认值、补全格式、处理异常值等。
- 为数据建立索引
- 支持大体量数据
- 按一定业务逻辑插入计算后的列、删除列
- 灵活方便的数据查询、筛选