课程简介:
Python是一门易学易懂适合快速开发的编程语言,既能满足互联网行业的Web应用和服务器应用开发,又可以作为方便强大的Linux服务器及网络运维工作的开发工具,完成系统运维的工作。最近的大数据快速发展也扩展了Python语言的新天地,作为数据抓取和分析的合适的语言,Python又焕发了新的活力。因此Web应用开发、系统网络运维、大数据的科学与数字计算,甚至3D游戏开发都是Python工程师非常适应的职业发展方向。

注:本课程适合零基础学员或有意向转行的技术人员。

入学基础:
有Linux使用经验\ 有HTML5 前端开发经验 ,可以减免部分前置课程。

课程大纲:

Python 基础

  • Python概述
  •   计算机语言概述
      python简史
      python相关

  • python语法基础
  •   Python环境配置
      python基础语法
      变量
      数据类型
      表达式和运算符
      分支结构
      循环结构

  • 函数
  •   函数初步
      细说参数
      变量作用域
      递归调用

  • 内置函数
  •   字符串相关-string
      列表-list
      元组-tuple
      集合-set
      字典-dict

Python 高阶

  • Python面向对象高级编程
  • 面向对象编程基础
  • 公有私有
  • 继承
  • 组合 & Mixin
  • 模块
  • 模块概述
  • 搜索路径
  •   Python正则表达式
      Python与数据库编程
      Python多进程与进程间通信
      Python多线程
      Python网络编程
      Python GUI编程
      项目实践

Python Web 开发

  • Python Web开发简介
  • Django开发环境搭建
  • Django基础
  • Django视图
  • Django URL映射
  • Django模板
  • Django模型与数据库
  • Django表单
  • Django用户验证
  • Cookies和Sessions
  • Django模板继承
  • Bootstrap结合
  • Jquery结合
  • AJAX结合
  • 项目部署
  • Django项目实践-在线商城

Python 爬虫技术

  • 爬虫概述
  •   爬虫定义
      爬虫在行业中的地位

  • 页面获取
  •   urllib基本使用
      requtests基本使用
      反爬虫策略和反反爬虫

  • 内容提取
  •   正则
      XPath
      BeautifulSoap

  • scrapy
  •   概述
      Scrapy核心部件使用
      Scrapy Shell

Python 人工智能
数据分析和数据挖掘

  • 数据科学和AI概述
  • 数据结构和算法
  • Python 数据分析与数据挖掘简介、环境搭建
  • Python数据分析工具箱
  • 数据加载与存储
  •   数据类型
      数据结构
      数据导入
      数据导出

  • 数据规范化和处理
  •   数据清洗
      数据抽取
      数据合并
      数据计算
      数据转换

  • 数据分析
  •   基本统计
      分组分析
      结构分析
      分布分析
      交叉分析
      矩阵分析
      RFM分析

  • 数据挖掘
  •   相关分析
      简单线性回归
      多重线性回归
      逻辑回归
      决策树分析
      聚类分析
      因子分析
      关联规则
      时间序列分析

  • 数据可视化
  • 项目实践

Python人工智能算法和框架
--机器学习与深度学习

    初始机器学习

  • 概述
  •   概念与术语(人工智能、数据挖掘、机器学习、深度学习)
      数据挖掘的对象
      数据挖掘的关键技术
      知识的表达
      Python的安装

  • Python数据挖掘工具箱
  •   Numpy,Scipy
      Pandas
      Scikit.learn
      Matplotlib
      TensorFlow

  • 数据加载与存储
  •   csv/json/Excel/mySQL数据预处理与规范化
      数据合并
      数据转换
      数据清洗
      数据聚合
      数据分组
      透视表与交叉表

    机器学习中的典型算法

  • 机器学习框架
  • 模型评估方法
  •   偏差与方差
      混淆矩阵/准确率/精确率/召回率
      ROC/AUC/F1

  • 特征提取(分类变量/文本/图像)
  • 数据预处理(标准化/正则化)
  • 线性回归
  •   一元/多元
      多项式

  • 线性回归
  •   岭回归
      随机梯度下降法
      交叉验证

  • 逻辑回归
  •   二分类
      多分类

  • K近邻算法
  •   kNN回归
      kNN分类

    机器学习中的典型算法进阶

  • 决策树
  •   回归数
      分类树
      模型参数网络搜索
      随机森林

  • 朴素贝叶斯
  •   高斯贝叶斯分类器
      多项式贝叶斯分类器
      伯努利贝贝叶斯分类器

  • 支持向量机
  •   核函数
      SVC
      SVR

  • 人工神经网络
  •   感知器
      神经网络

    机器学习中的典型算法扩展

  • 无监督学习聚类
  •   Kmean

  • PCA降维
  • 集成学习方法
  •   Adaboost
      Gradientboosting
      RandomForest

  • 关联分析-Apriori算法
  •   频繁项集
      关联规则

  • 关联分析-FP-growth算法
  •   FP树

    深度学习初步

  • 深度学习简介
  •   深度学习引入
      深度学习历史
      深度学习应用
      TensorFlow

  • TensorFlow入门
  •   计算模型
      数据模型
      运行模型
      TensorFlow实现神经网络

  • 深层神经网络
  •   深度学习与深层神经网络
      损失函数定义
      神经网络优化算法
      神经网络进一步优化

  • 深度学习模型改进
  •   MNIST数据处理
      模型训练及对比
      变量管理
      模型持久化

    深度学习进阶

  • 卷积神经网络
  •   图像识别问题
      卷积神经网络
      卷积神经网络常用结构
      典型卷积神经网络模型

  • 图像数据处理
  •   TFRecord输入数据格式
      图像数据处理
      数据集框架

  • 循环神经网络
  •   循环神经网络简介
      长短时记忆网络LSTM
      循环神经网络变种

  • Tensorflow高层封装
  •   Keras
      Estimator

  • TensorBoard可视化
  •   TensorBoard计算图可视化
      监控指标可视化
      高维向量可视化

Python数据分析和人工智能
--配套项目一览
(根据实际进度安排) 穿插在整个培训中

    实践-案例-项目

  • 项目群1
  •   Anaconda安装
      Tensorflow安装
      二维布朗运动
      泰坦尼克号生存者名单处理
      上海证券大盘指数分析
      QQ聊天群数据分析
      中国地震数据分析

  • 项目群2
  •   酒品质预测
      波士顿住房数据来预测房屋价格
      垃圾邮件分类
      影评电影分类
      美国入学申请录取分类

  • 项目群3
  •   广告屏蔽
      泰坦尼克号乘客生还情况
      iris(鸢尾花)
      20类新闻数据分类

  • 项目群4
  •   脸部识别
      手写数字识别
      新闻类别分类
      自然图片字母与数字识别

  • 项目群5
  •   美国参议院党派分类
      各省经济水平分类
      手写识别
      糖尿病病人
      毒蘑菇相似特征
      从新闻网站点击流中挖掘新闻报道

  • 项目群6
  •   Tensorflow安装
      神经网络实现
      MNIST手写数字识别
      训练模型保存与恢复

  • 项目群7
  •   Lenet5网络
      图像数据
      RNN网络实现时序预测
      Keras实现IMDB自然语言情感分类

必备配套技术:

RED HAT LINUX系统运维
*前置课程

  • 在bash shell命令行模式下运行常用基本Unix命令
  • 从shell命令行及Xwindow界面运行应用程序
  • 配置XFree86系统及常用XWindow桌面环境
  • 使用X GUI应用程序完成一般的工作
  • 了解Linux EXT2 和EXT3文件系统结构
  • 完成普通的文件维护操作
  • 了解和维护文件存取权限
  • 复制和存取不同文件系统下的文件
  • 使用vi文本编辑器编辑和运行Shell 脚本文件
  • 使用sed、awk及perl正则表达式过滤和处理文本
  • 使用Linux本底打印命令和相关实用工具实现Unix下的文本打印
  • 使用电子邮件和Openoffice完成Linux下的电子办公
  • 用标准的输入/输出重定向及管道连接程序和文件
  • 控制Linux系统进程
  • 查询Linux系统内的rpm软件包
  • 使用Unix常用网络程序和相关实用工具控制本底机网络
  • 使用基于SSL的方式安全传输文件
  • 掌握RedHat提供给用户的系统工具
  • 掌握基本的shell script 脚本

数据分析师基础理论和实践
(基于excel的数据分析)

  • 数据加工处理方法
  •   处理重复数据
      处理不完整数据
      处理格式错误数据
      处理异常值
      提取数据
      计算数据
      拆分、合并数据
      数据分组、排序
      数据转换
      查找、定位
      处理海量数据(Power Query)
      数据透视(Power Pivot)

  • 数据可视化方法
  •   基本图表
      动态图表
      专业图表

  • 多维度数据集搭建方法
  • 透视分析
  • 现状、原因分析
  • 宏使用方法简介

SPSS数据统计和分析

课程基于SPSS工具手把手教学操作,数据的录入、整理、清洗、处理、分析、输出、解读等。

  • SPSS软件及统计分析过程方法论简介
  • 统计分析过程方法论应用:一个调查研究的实例
  • SPSS for Windows的各个模块简介
  • 数据输入与建立
  •   数据文件获取:EXCEL和其它各种ASCII文本文件,数据库数据等各种格式数据的读取
      数据文件的建立:变量名、变量标签、值标签、变量类型、缺失值等的处理方式,收集数据时的错误和误差

  • 数据管理与变换
  •   数据分段
      衍生变量
      变量重新编码

  • SPSS统计图表和报表展示
  •   饼图、直方图、三维直方图、散点图、条图、线图、茎叶图、箱线图、帕雷托图、Q-Q图、P-P图、控制图等

  • 打印与存储输出
  • 高级数据修改
  • 文件管理
  • SPSS编程
  •   基本使用方法
      SPSS编程命令语句

  • 实用特性举例
  • 枢轴表编辑器的用户化输出
  • 集中趋势及离散趋势分析
  • 正态检验
  • 非参数检验
  • 变量间关系描述
  • SPSS交叉表分析过程
  •   交叉列表的分析对象、解决的问题,应用SPSS实现交叉列表分析

  • 单样本及双样本T检验
  • 方差分析(ANOVA)
  • 多选题变量分析及SPSS实现
  •   多选题变量的编码形式、分析指标;多选题变量的建立、频数分析、交叉列表分析;多选题变量的探索性分析

  • 如何选择合适的统计学方法

MYSQL
/ORACLE
数据库管理
*必备数据库技术

  • 描述Oracle MySQL架构、安装和升级Oracle MySQL
  • 利用 INFORMATION_SCHEMA 数据库访问元数据
  • 完成 Oracle MySQL 启动和关闭操作
  • 在运行时间配置 Oracle MySQL 服务器选项
  • 利用 Oracle MySQL 管理员图形用户界面管理 Oracle MySQL 服务器
  • 为解决性能问题评估数据类型及字符集
  • 了解数据锁定概念以及在 Oracle MySQL 中不同级别锁定
  • 了解和使用Oracle MySQL InnoDB引擎
  • 保持Oracle MySQL安装一致性
  • 使用触发器执行管理任务
  • 使用企业审计和插入式验证
  • 配置高级复制技术来实现ORACLE MYSQL高可用性
  • 描述介绍性能调优技术
  • 执行备份和恢复操作
  • 管理任务自动化与排程事件

HTML5+CSS3
*必备前端技术

  • HTML 5的结构
  • 表单及其他新增和改良元素
  • 绘制图形
  • 多媒体相关API
  • History API
  • 本地存储
  • 离线应用程序
  • 文件API
  • 通信API
  • WebRTC通信
  • 扩展的XMLHttpRequest API
  • 使用Web Workers处理线程
  • 获取地理位置信息
  • 拖放API与通知API
  • Page Visibility API
  • Fullscreen API
  • 鼠标指针锁定API

JavaScript
*必备前端技术

  • JavaScript概述
  • 词法结构
  • 类型
  • 值和变量
  • 表达式和运算符
  • 语句
  • 对象
  • 数组
  • 函数
  • 类和模块
  • 正则表达式的模式匹配
  • JavaScript的子集和扩展
  • 客户端JavaScript
  • 服务器端JavaScript

JQuery
*必备前端技术

  • 初识jQuery
  • jQuery选择器
  • jQuery中DOM的操作
  • jQuery的事件处理
  • jQuery的动画效果
  • jQuery与Ajax
  • jQuery常用插件