2020.7.21 Pandas

发布于 2020-07-21  11 次阅读


1.学习内容

  • Pandas 介绍

    • pandas介绍
      • 开源的数据挖掘库,用于数据探索
      • Pandas 封装了matplotlib,Numpy的画图和计算
      • 最开始是为了金融分析而开发
    • 案例知识点
      • 1.创建DataFrame
        • DataFrame类似numpy的二维数组
        • pd.DataFrame(ndarray)
        • shape,index,columns,values,T
        • head,tail 获取前几行,后几行
      • 2.对应日期创建
        • pd.date_range()
          • start – 开始日期 字符串
          • end – 结束日期
          • periods -- 时间跨度
          • freq – 时间统计方式
    • DataFrame介绍(类比二维数组)

      • 对象属性方式(index不可以修改值,别的没试)
        • shape 获取形状
        • index 获取行索引
        • columns 获取列索引
        • values 获取数据 ndarry数组
        • T 转置
        • head() tail() 获取前几行,后几行
      • dataframe 设置索引
        • 1.修改行列索引必须整体设置
        • 2.重设索引
          • 对象.reset_index()
        • 3.设置新索引
          • 对象.set_index()
          • 如果设置索引是两个的 就是MultiIndex
    • MultiIndex和pannel(类比三维数组)

      • MultiIndex
        • 对象.index
        • 对象.index.names
      • panel 已经弃用
        • 直接没法查看值
        • p[:,:,”frist”=L]
    • Series(类比一维数组)

      • series结构只有行索引
      • 数据对象[‘行索引’][‘具体索引’]
      • 创建(数据是ndarray)
        • pd.Series([数据])
        • pd.Series([数据],index=[索引值])
        • pd.Series({red:10,green:20})
      • 属性
        • series.index
        • series.values

2.扩展延伸知识

3.灵感代办

4.复习内容

5.学习成果&问题


Ares个人进阶之路