2020.7.20 Matplotlib

发布于 2020-07-19  10 次阅读


1.复习内容

2.灵感代办

3.学习内容

  • 人工智能,机器学习和深度学习

    • 人工智能
      • 类似概念,
    • 机器学习
      • 人工智能的实现途径
    • 深度学习
      • 机器学习的一种方式,让机器像大脑一样思考,卷积网络
  • 机器学习概述

    • 人工智能起源
      • 图灵测试
      • 达特茅斯会议
    • 人工智能三个阶段
      • 1980 正式型形成
      • 1990-2010 蓬勃发展
      • 2012年 深度学习
  • 人工智能分支

    • 计算机视觉
      • 人脸识别
    • 自然语言处理
      • 分析语音,文字含义
    • 机器人
      • 家庭机器人,工业机器人
  • 人工智能必备三要素

    • 数据
    • 算法
    • 计算力
  • 什么是机器学习

    • 数据自动分析获得模型,利用模型对未知数据进行预测
    • 机器学习
      • 新的数据-输入-模型-预测-未知属性
        • 模型就训练的
    • 人的学习
      • 新的数据-输入-模型-预测-未来
        • 模型根据经验
  • 机器学习工作流程

    • 获取数据(数据基本处理,特征工程,机器学习,模型评估)
      • 括号内的可以循环
    • 最后是在线服务
  • 数据简介

    • 一行数据称为样本
    • 一列数据称为特征
    • 有些数据有目标值(标签值),有些数据没有目标值(电影类型)
      • 目标值:可连续,离散的
    • 特征值
  • 数据类型的构成

    • 类型一:特征值+目标值
      • 目标值分为离散还是连续
    • 类型二:只有特征值,没有目标值
  • 数据划分

    • 训练数据 (训练集)-- 构建模型 70%
    • 测试数据 (测试集)-- 模型评估 20%-30%
  • 数据基本处理

    • 对数据进行处理,去除异常值等处理
  • 特征工程

    • 定义:把数据转换称为机器更容易识别的数据
    • 为什么需要特征工程?
    • 包含内容
      • 特征提取 文字-数字
      • 特征与预处理:
      • 特征降维
  • 机器学习

    • 选择合适的算法对模型训练
  • 模型评估

    • 对训练好的模型进行评估
  • 机器学习算法分类

    • 监督学习
    • 无监督学习
    • 半监督学习
    • 强化学习
  • 监督学习

    • 输入数据是由输入特征值和目标值组成
      • 函数的输出可以是一个连续的(称为回归)
      • 输出是离散的(称为分类)
    • 分类问题
      • 分类别
  • 无监督学习

    • 输入数据由特征值组成
    • 聚类
    • 按照自己的标准(有帽子,职业)
  • 半监督学习

    • 有特征值,但是一部分有目标值
  • 强化学习

    • 动态过程,上一步数据的输出,是下一步数据的输入
    • 四要素:agent代理,环境状态environment,行动action,奖励Reward
  • 模型评估

    • 分类模型评估
      • 准确率,精确率,召回率,f1-score,auc指标
    • 回顾模型评估
      • 均方根误差
      • 相对平方吾侪
      • 平均绝对误差
      • 相对绝对误差
      • 决定系数
    • 拟合
      • 欠拟合
        • 特征少,区分不出来类型
      • 过拟合
        • 特征多,识别不出来类型
  • jupyter Notebook使用

    • 介绍
      • 开源,用于科学计算,科学研究的
      • julia,python,R
      • ipython 加强版,可以画图
      • 探索性数据,边分析,边运行
      • pycharm适合逻辑性强的操作(web)
    • cell单元
      • 一个in和out就是一个代码单元
    • 两种模式
      • 编辑模式
        • 操作cell中代码
      • 命令模式
        • 操作整个cell
    • 命令快捷键
      • Y code模式
      • A 上面增加一行
      • M markdown格式
      • B 下面增加一行
      • DD 删除
  • Matplotlib 使用

    • 介绍
      • 专门开发二维图表
      • 实际简单,渐进可视化
    • 为什么要学
      • 直观的进行数据分析
    • matplotilib 三层结构
      • 容器层
        • canvas 类似画笔
        • figure 类似白纸
        • Axes 类似作品
          • axes(坐标系)
          • axis(坐标轴)
      • 辅助显示图
        • x,y轴名称
        • 一些描述信息
      • 图像层
        • 绘制图像类型 折现 散点
    • 使用matplotlib
      • 1.导入
      • 2.创建画布
      • 3.添加数据
      • 4.添加属性
      • 5.保存
      • 6.展示
  • 折线图 plot 基础

    • 使用图形保存
      • 需要在show前面写,show会释放资源
      • plt.savefig(‘’) 其中是路径
    • 添加x y轴 刻度
      • plt.xticks()
      • plt.yticks() 是一个可迭代对象
      • label字段,可以用来展示legend()
      • 注意,第一个参数必须是数字,如果不是数字,需要值替换
    • 添加网格
      • plt.grid()
        • linestyle 绘制网格方式
          • -实线 --虚线 -.点划线 :点虚线 ‘’留空 空格
        • alpha 通明度
    • 添加描述
      • plt.xlabel() x轴描述
      • plt.ylabel() y轴描述
      • plt.title() 图形标题
    • 多个plot 显示图例
      • plt.legend() 显示图型的含义(北京温度,上海温度)
        • 需要指定 plot方法中的label参数
        • loc参数
          • 显示位置 一般都是0
    • 设置图形风格
      • 颜色
        • r 红色,r绿色,g蓝色等等
      • 风格字符
      • -实线 --虚线 -.点划线 :点虚线 ‘’留空 空格
    • 多个坐标系展示
      • fig,axes = plt.subplot(nrows,ncols)
        • nrows – 行
        • ncols - 列
        • 注意:有些方法使用set_*前缀使用
    • 折线图的应用场景
      • 表示数据变化
      • 绘制一些数学图像
        *

4.扩展延伸知识

5.知识内容个人梳理

6.今天都复习了之前的什么内容


Ares个人进阶之路