索引和选取数据

pandas 对象中的轴标签信息用于很多方面:

  • 使用已知指标标识数据(即提供元数据),对于分析、可视化和交互控制台显示非常重要
  • 使数据自动和显式对齐
  • 允许直观地获取和设置数据集的子集

在这一章我们将关注最后一点,即如何分片、删除以及获取和设置 pandas 对象的子集。主要关注的是 Series 和 DataFrame,因为它们在这一领域受到了更多的发展关注。期待将来对更高维数据结构(包括 Panel)投入更多工作,尤其是基于标签的高级索引。


注意: Python 和 NumPy 索引操作符 [] 和属性操作符 . 在大部分用例中提供了快速且方便的访问手段。这个特性使得数据访问非常直观,你不需要学习新知识就可以使用,前提是你早已了解如何处理 Python 字典和 NumPy 数组,但是当要访问的数据的类型事先不知道的话,直接使用标准操作符会带来一些优化限制。对于生产环境的代码,我们建议你使用本章介绍的优化的 pandas 数据访问方法。


警告: 设置操作返回副本或引用取决于上下文。这有时称为 链式赋值 (chained assignment),应该避免这种情况。参见 返回视图还是副本

警告: 在具有浮点数的基于整数的索引上进行索引已在 0.18.0 中阐明,相关更改总结参见 版本变化

results matching ""

    No results matching ""