教程介绍

  《数据挖掘入门》是由智客段小辉提供(阅读原文),楠木大叔整理。该教程为入门教程,为博主学习数据挖掘的学习路径步骤。教程为入门教程,从最简单的开始。使用的编程语言为Python3.8.1,使用JupyterNotebook作为开发环境。

在学习本教程之前,你需要:

  • 有一点python编程基础
  • 会用百度 or 谷歌
  • 数学知识还是要一点的(但是要多少呢?我也不知道,我也是刚开始学)
  • 什么是数据挖掘,通俗地讲就是寻找数据之间的关系。

教程目录

  • 前言
  • 1 亲和性分析
  • 2 分类问题OneR算法
  • 2.1 分类问题OneR算法
  • 2.2 K-近邻算法和距离度量介绍
  • 3 scikit-learn
  • 3.1 scikit-learn框架基本使用(以K近邻算法为例)
  • 3.2 决策树
  • 4 Apriori 算法
  • 4.1 基于scikit-lean决策树处理Iri
  • 4.2 Apriori算法
  • 4.3 Apriori算法Python实现
  • 5 数据集特征选择
  • 6 朴素贝叶斯进行文本分类
  • 7 神经网络
    • 7.1 神经网络介绍
    • 7.2 使用神经网络(基于pybrain)识别数字手写集MNIST
  • 8 SVM介绍以及从零开始公式推导
    • 8.1 SVM介绍以及从零开始公式推导
    • 8.2 sklearn的SVM使用
  • 9 k-means算法
  • 10 DNN
    • 10.1 DNN介绍及公式推导
    • 10.2 keras入门使用以及构建DNN网络识别MNIST
  • 11 CNN网络
    • 11.1 CNN网络介绍
    • 11.2 使用keras构建CNN网络识别CIFAR10
  • 12 结束