MachineLearningMastery

访问网站

需要帮助开始应用机器学习？

这些是您一直在寻找的分步指南！

你需要什么帮助？

基金会

初学者

中间的

先进的

我如何开始？

我被问到的最常见问题是：“我如何开始？”

我对机器学习入门的最佳建议分为 5 个步骤：

第一步：调整心态。相信您可以练习和应用机器学习。
第 2 步：选择流程。使用系统流程来解决问题。
- 应用机器学习过程
第 3 步：选择一个工具。为您的关卡选择一个工具并将其映射到您的流程中。
- 初学者：维卡工作台。
- 中级： Python 生态系统。
- 高级：R 平台。
- 机器学习的最佳编程语言
第 4 步：在数据集上练习。选择要处理的数据集并练习该过程。
第 5 步：建立投资组合。收集结果并展示您的技能。

有关此自上而下方法的更多信息，请参阅：

我的许多学生都使用这种方法继续在 Kaggle 比赛中取得好成绩，并获得了机器学习工程师和数据科学家的工作。

应用机器学习过程

机器学习的好处是预测和做出预测的模型。

拥有应用机器学习的技能意味着知道如何始终如一地可靠地对一个又一个问题提供高质量的预测。你需要遵循一个系统的过程。

以下是一个 5 步流程，您可以按照该流程在预测建模问题上始终如一地取得高于平均水平的结果：

有关此过程的完整摘要，请参阅以下帖子：

机器学习的概率

概率是量化和利用不确定性的数学。它是许多数学领域（如统计学）的基石，对于应用机器学习至关重要。

以下是您可以用来快速了解机器学习概率的 3 步过程。

第 1 步：了解什么是概率。
- 机器学习数学符号基础
- 什么是概率？
第 2 步：了解为什么概率对于机器学习如此重要。
- 学习机器学习概率的 5 个理由
- 机器学习中不确定性的简要介绍
第 3 步：深入探讨概率主题。
- 概率论机器学习迷你课程
- 机器学习的概率（我的书）

您可以在此处查看有关概率的所有教程。以下是一些最受欢迎的教程的精选。

概率基础

贝叶斯定理

概率分布

信息论

机器学习统计

统计方法是深入了解机器学习算法行为所需的重要数学基础领域。

以下是您可以用来快速掌握机器学习统计方法的 3 步过程。

第 1 步：了解什么是统计方法。
- 什么是统计学（以及为什么它在机器学习中很重要）？
第 2 步：了解为什么统计方法对机器学习很重要。
- 应用统计学与机器学习的密切关系
- 如何在机器学习项目中使用统计方法的 10 个示例
第 3 步：深入研究统计方法的主题。
- 机器学习统计（7 天迷你课程）
- 机器学习的统计方法（我的书）

您可以在此处查看所有统计方法帖子。以下是一些最受欢迎的教程的精选。

汇总统计

统计假设检验

重采样方法

估计统计

机器学习的线性代数

线性代数是深入理解机器学习算法所需的重要数学基础领域。

下面是 3 个步骤的过程，您可以使用它来快速掌握用于机器学习的线性代数。

第 1 步：了解什么是线性代数。
- 机器学习数学符号基础
- 线性代数简介
第 2 步：了解为什么线性代数对机器学习很重要。
第 3 步：深入研究线性代数主题。
- 机器学习的线性代数迷你课程
- 机器学习的线性代数（我的书）

您可以在此处查看所有线性代数帖子。以下是一些最受欢迎的教程的精选。

Python 中的线性代数

矩阵

载体

矩阵分解

机器学习优化

优化是所有机器学习算法的核心。当我们训练机器学习模型时，它正在对给定的数据集进行优化。

您可以通过 3 个步骤快速熟悉机器学习的优化。

第 1 步：了解什么是优化。
- 应用机器学习作为搜索问题的简要介绍
- 函数优化简介
第 2 步：发现优化算法。
第 3 步：深入优化主题。
- 如何手动优化机器学习模型超参数
- 机器学习优化（我的书）

您可以在此处查看所有优化帖子。以下是一些最受欢迎的教程的精选。

局部优化

全局优化

梯度下降

优化的应用

机器学习微积分

微积分是许多机器学习算法成功的隐藏驱动力。当我们谈论机器学习算法的梯度下降优化部分时，梯度是使用微积分找到的。

您可以通过 3 个步骤熟悉机器学习的微积分。

第 1 步：发现什么是微积分。
- 什么是微积分？
- 微积分的关键概念：变化率
第 2 步：发现差异化规则。
第 3 步：深入研究微积分主题。
- 微积分实战：神经网络
- 微分在神经网络中的应用
- 机器学习微积分（我的书）

您可以在此处查看所有微积分帖子。以下是一些最受欢迎的教程的精选。

基础微积分

多元微积分

优化微积分

微积分的应用

用于机器学习的 Python

Python 是机器学习项目的通用语言。不仅很多机器学习库都是用Python编写的，而且能有效的帮助我们快速、利落的完成我们的机器学习项目。拥有良好的 Python 编程技能可以让您在更短的时间内完成更多的工作！

您可以通过 3 个步骤熟悉用于机器学习的 Python。

第 1 步：学习语言。
- 如何学习用于机器学习的 Python？
- Python 中的一些语言特性
第 2 步：学习如何使用该语言。
第 3 步：了解您可以在 Python 生态系统中做什么。

您可以在此处查看所有Python 帖子。但是不要错过Python for Machine Learning（我的书）。以下是一些最受欢迎的教程的精选。

基本语言

故障排除

语言技巧

图书馆

了解机器学习算法

机器学习是关于机器学习算法的。

您需要了解针对给定问题可用的算法、它们的工作原理以及如何充分利用它们。

以下是如何开始使用机器学习算法：

第 1 步：发现不同类型的机器学习算法。
- 机器学习算法之旅
第 2 步：发现机器学习算法的基础。
第 3 步：了解顶级机器学习算法的工作原理。
- 机器学习算法迷你课程
- 精通机器学习算法（我的书）

您可以在此处查看所有机器学习算法帖子。以下是一些最受欢迎的教程的精选。

线性算法

非线性算法

集成算法

如何研究/学习 ML 算法

Weka 机器学习（无代码）

Weka 是一个平台，您可以使用它开始应用机器学习。

它有一个图形用户界面，这意味着不需要编程，它提供了一套最先进的算法。

以下是开始使用 Weka 的方法：

第 1 步：了解 Weka 平台的功能。
- 什么是 Weka 机器学习工作台
第 2 步：了解如何绕过 Weka 平台。
- 如何下载和安装 Weka 机器学习工作台
- Weka 机器学习工作台之旅
第 3 步：了解如何使用 Weka 交付结果。
- 如何在 Weka 中运行你的第一个分类器
- 使用 Weka 迷你课程应用机器学习
- 精通 Weka 机器学习（我的书）

您可以在此处查看所有Weka 机器学习帖子。以下是一些最受欢迎的教程的精选。

在 Weka 中准备数据

Weka算法教程

Python 机器学习 (scikit-learn)

Python 是应用机器学习发展最快的平台之一。

您可以在模型的开发和运营部署中使用相同的工具，如 pandas 和 scikit-learn。

以下是您可以用来开始使用 Python 机器学习的步骤：

第 1 步：发现用于机器学习的 Python
- Scikit-Learn 简介：Python 机器学习库
第 2 步：探索 Python 机器学习的生态系统。
第 3 步：了解如何使用 Python 中的机器学习解决问题。
- 您的第一个 Python 机器学习项目循序渐进
- Python 机器学习迷你课程
- 精通 Python 机器学习（我的书）

您可以在此处查看所有Python 机器学习帖子。以下是一些最受欢迎的教程的精选。

在 Python 中准备数据

Python 中的机器学习

R 机器学习（插入符号）

R 是一个统计计算平台，是专业数据科学家中最受欢迎的平台。

它之所以流行，是因为有大量可用的技术，并且因为这些方法具有出色的接口，例如功能强大的 caret 包。

以下是 R 机器学习入门的方法：

第 1 步：发现 R 平台及其如此受欢迎的原因。
第 2 步：在 R 中发现机器学习算法。
- 如何开始使用 R 中的机器学习算法
第 3 步：了解如何使用 R 中的机器学习解决问题。
- 您在 R 中的第一个机器学习项目循序渐进
- R 机器学习迷你课程
- 精通 R 机器学习（我的书）

您可以在此处查看所有R 机器学习帖子。以下是一些最受欢迎的教程的精选。

R 中的数据准备

R 中的应用机器学习

从零开始的代码算法（Python）

通过从头开始编写代码，您可以学到很多关于机器学习算法的知识。

通过编码学习是许多开发人员和工程师的首选学习方式。

以下是如何通过从头开始编写所有内容来开始机器学习。

第 1 步：从头开始发现编码算法的好处。
- 从头开始实施机器学习算法的好处
- 通过从头开始实施机器学习算法来理解它们
第 2 步：发现从头开始编码算法只是一种学习工具。
- 停止从头开始编写机器学习算法
- 实施机器学习算法时不要从开源代码开始
第 3 步：了解如何使用 Python 从头开始编写机器学习算法代码。
- 从零开始的机器学习算法（我的书）

您可以在此处查看 Scratch 帖子中的所有代码算法。以下是一些最受欢迎的教程的精选。

准备数据

线性算法

算法评估

非线性算法

时间序列预测简介（Python）

时间序列预测是业务应用程序中的一个重要主题。

许多数据集包含时间成分，但从机器学习的角度来看，时间序列的主题很少被深入探讨。

以下是时间序列预测的入门方法：

第 1 步：发现时间序列预测。
- 什么是时间序列预测？
第 2 步：发现时间序列作为监督学习。
- 作为监督学习的时间序列预测
第 3 步：了解如何通过时间序列预测善于交付结果。
- 使用 Python 迷你课程进行时间序列预测
- 使用 Python 进行时间序列预测（我的书）

您可以在此处查看所有时间序列预测帖子。以下是一些最受欢迎的教程的精选。

数据准备教程

预测教程

机器学习的数据准备 (Python)

您的预测模型的性能取决于您用来训练它的数据。

因此，数据准备可能是您应用的机器学习项目中最重要的部分。

以下是机器学习数据准备入门的方法：

第 1 步：发现数据准备的重要性。
- 什么是机器学习项目中的数据准备
- 为什么数据准备在机器学习中如此重要
第 2 步：发现数据准备技术。
- 机器学习的数据准备技术之旅
- 机器学习中的数据准备技术框架
第 3 步：发现如何通过数据准备擅长交付结果。
- 如何选择机器学习的数据准备方法
- 机器学习的数据准备（7 天迷你课程）
- 机器学习的数据准备（我的书）

您可以在此处查看所有数据准备教程。以下是一些最受欢迎的教程的精选。

数据清洗

特征选择

数据转换

降维

Python 中的 XGBoost（随机梯度提升）

XGBoost 是梯度提升决策树的高度优化实现。

它很受欢迎，因为它被世界上一些最好的数据科学家用来赢得机器学习竞赛。

以下是开始使用 XGBoost 的方法：

第 1 步：发现梯度提升算法。
- 机器学习梯度提升算法的简要介绍
第 2 步：发现 XGBoost。
- 用于应用机器学习的 XGBoost 的简要介绍
第 3 步：了解如何使用 XGBoost 擅长交付结果。
- 如何使用 scikit-learn 在 Python 中开发您的第一个 XGBoost 模型
- XGBoost 与 Python 迷你课程
- XGBoost With Python（我的书）

您可以在此处查看所有XGBoost 帖子。以下是一些最受欢迎的教程的精选。

XGBoost 基础知识

XGBoost 调整

分类不平衡

不平衡分类是指分类任务，其中一个类的示例比另一个类多得多。

这些类型的问题通常需要使用专门的性能指标和学习算法，因为标准指标和方法不可靠或完全失败。

下面介绍如何开始使用不平衡分类：

第 1 步：发现不平衡分类的挑战
- 不平衡分类的简要介绍
第 2 步：发现偏斜类分布的直觉。
- 培养对严重偏斜类分布的直觉
第 3 步：探索如何解决不平衡分类问题。
- 不平衡分类项目的分步框架
- 使用 Python 进行不平衡分类（7 天迷你课程）
- 使用 Python 进行不平衡分类（我的书）

您可以在此处查看所有不平衡分类帖子。以下是一些最受欢迎的教程的精选。

绩效衡量

成本敏感算法

数据采样

高级方法

深度学习（凯拉斯）

深度学习是一个迷人而强大的领域。

最先进的成果来自深度学习领域，它是机器学习中不可忽视的一个子领域。

以下是深度学习入门的方法：

第 1 步：了解什么是深度学习。
- 什么是深度学习？
- 深度学习的 8 个鼓舞人心的应用
第 2 步：发现最好的工具和库。
第 3 步：发现如何解决问题并取得成果。

您可以在此处查看所有深度学习帖子。以下是一些最受欢迎的教程的精选。

背景

多层感知器

卷积神经网络

循环神经网络

深度学习（PyTorch）

除了 Keras，PyTorch 是另一个市场份额巨大的深度学习库。了解 PyTorch 并熟悉其语法非常重要。

以下是在 PyTorch 中开始深度学习的方法：

第 1 步：了解什么是深度学习。
- 什么是深度学习？
- 深度学习的 8 个鼓舞人心的应用
第 2 步：发现 PyTorch
- 一些深度学习库的概述
- PyTorch 教程：如何使用 Python 开发深度学习模型
第 3 步：发现如何解决问题并取得成果。
- 使用 PyTorch 逐步开发您的第一个神经网络
- 使用 PyTorch 深度学习迷你课程
- 使用 PyTorck 进行深度学习（我的书）

您可以在此处查看所有PyTorch 深度学习帖子。以下是一些最受欢迎的教程的精选。

背景

多层感知器

建模技术

高级网络

更好的深度学习性能

尽管定义和拟合深度学习神经网络模型很容易，但要在特定的预测建模问题上获得良好的性能可能具有挑战性。

您可以使用一些标准技术来改进学习、减少过度拟合并使用深度学习模型做出更好的预测。

以下是如何开始获得更好的深度学习性能：

第 1 步：发现深度学习的挑战。
- 为什么训练神经网络很困难
- 训练深度学习神经网络模型的挑战
第 2 步：发现用于诊断和改进模型性能的框架。
第 3 步：发现可用于提高性能的技术。
- 如何获得更好的深度学习结果（7 天迷你课程）
- 更好的深度学习（我的书）

您可以在此处查看所有更好的深度学习帖子。以下是一些最受欢迎的教程的精选。

更好的学习（修复培训）

更好的泛化（修复过度拟合）

更好的预测（合奏）

提示、技巧和资源

集成学习

预测性能是许多分类和回归问题中最重要的关注点。集成学习算法结合了来自多个模型的预测，旨在比任何贡献的集成成员表现得更好。

以下是如何开始获得更好的集成学习性能：

第 1 步：发现集成学习。
- 集成学习简介
- 为什么使用集成学习
第 2 步：发现集成学习算法。
- 对集成学习算法的简单介绍
第 3 步：发现可用于提高性能的技术。
- 使用 Python 进行集成机器学习（7 天迷你课程）
- 使用 Python 集成学习算法（我的书）

您可以在此处查看所有集成学习帖子。以下是一些最受欢迎的教程的精选。

合奏基础

堆叠合奏

装袋合奏

提升合奏

长短期记忆网络 (LSTM)

长短期记忆 (LSTM) 递归神经网络专为序列预测问题而设计，是用于挑战性预测问题的最先进的深度学习技术。

以下是在 Python 中开始使用 LSTM 的方法：

第 1 步：发现 LSTM 的前景。
- 递归神经网络在时间序列预测中的前景
第 2 步：发现 LSTM 的用处。
第 3 步：了解如何在您的项目中使用 LSTM。
- Keras 中长短期记忆模型的 5 步生命周期
- 长短期记忆网络（迷你课程）
- 使用 Python 的长短期记忆网络（我的书）

您可以在此处查看所有LSTM 帖子。下面精选了一些在 Python 中使用 LSTM 和 Keras 深度学习库的最流行的教程。

LSTM 的数据准备

LSTM 行为

使用 LSTM 建模

时间序列的 LSTM

自然语言处理 (NLP) 的深度学习

由于自然语言的混乱性质，处理文本数据很困难。

文本不是“已解决”，而是要在具有挑战性的 NLP 问题上获得最先进的结果，您需要采用深度学习方法

以下是自然语言处理深度学习入门的方法：

第 1 步：了解 NLP 深度学习的全部内容。
第 2 步：发现 NLP 的标准数据集。
- 7 深度学习在自然语言处理中的应用
- 自然语言处理数据集
第 3 步：发现如何解决问题并取得成果。
- 自然语言处理深度学习速成班
- 自然语言处理的深度学习（我的书）

您可以在此处查看有关 NLP 深度学习的所有帖子。以下是一些最受欢迎的教程的精选。

词袋模型

语言建模

文本摘要

文本分类

词嵌入

照片说明

文本翻译

计算机视觉的深度学习

由于原始像素和图像中的含义之间存在鸿沟，因此处理图像数据很困难。

计算机视觉并没有解决，但要在具有挑战性的计算机视觉任务（如对象检测和人脸识别）上获得最先进的结果，您需要深度学习方法。

以下是计算机视觉深度学习入门的方法：

第 1 步：了解计算机视觉深度学习的全部内容。
- 什么是计算机视觉？
- 深度学习对计算机视觉的承诺是什么？
第 2 步：发现计算机视觉的标准任务和数据集。
第 3 步：发现如何解决问题并取得成果。
- 如何开始计算机视觉的深度学习（7 天迷你课程）
- 计算机视觉的深度学习（我的书）

您可以在此处查看有关计算机视觉的所有深度学习帖子。以下是一些最受欢迎的教程的精选。

图像数据处理

图像数据增强

图片分类

图像数据准备

卷积神经网络基础

物体识别

时间序列预测的深度学习

深度学习神经网络能够自动学习从输入到输出的任意复杂映射，并支持多个输入和输出。

MLP、CNN 和 LSTM 等方法为时间序列预测提供了很多希望。

以下是开始深度学习进行时间序列预测的方法：

第 1 步：发现时间序列深度学习的前景（和局限性）。
第 2 步：了解如何开发稳健的基线和可靠的预测模型。
- 时间序列预测问题的分类
- 如何开发熟练的机器学习时间序列预测模型
第 3 步：了解如何为时间序列预测构建深度学习模型。
- 如何开始深度学习进行时间序列预测（7 天迷你课程）
- 时间序列预测的深度学习（我的书）

您可以在此处查看有关时间序列预测帖子的所有深度学习。以下是一些最受欢迎的教程的精选。

预测趋势和季节性（单变量）

人类活动识别（多元分类）

预测用电量（多变量、多步骤）

模型类型

时间序列案例研究

预测空气污染（多变量，多步骤）

生成对抗网络 (GAN)

生成对抗网络，简称 GAN，是一种使用深度学习方法（例如卷积神经网络）进行生成建模的方法。

GAN 是一个令人兴奋且瞬息万变的领域，它兑现了生成模型的承诺，能够在一系列问题领域中生成真实的示例，尤其是在图像到图像的转换任务中。

以下是如何开始深度学习生成对抗网络：

第 1 步：发现 GAN 在生成建模方面的前景。
- 生成对抗网络的 18 个令人印象深刻的应用
第 2 步：发现 GAN 架构和不同的 GAN 模型。
- 生成对抗网络的简要介绍
- 生成对抗网络模型之旅
第 3 步：了解如何使用 Keras 在 Python 中开发 GAN 模型。
- 如何开始使用生成对抗网络（7 天迷你课程）
- 使用 Python 的生成对抗网络（我的书）

您可以在此处查看所有生成对抗网络教程。以下是一些最受欢迎的教程的精选。

GAN 基础知识

GAN 损失函数

开发简单的 GAN 模型

用于图像翻译的 GAN

注意力和变形金刚

注意机制是为了缓解递归神经网络无法很好地处理长输入序列的问题而发明的技术。我们了解到注意力机制本身可以用作神经网络的构建块，因此我们现在有了 Transformer 架构。

注意力机制和转换器模型被证明可以提供惊人的结果，尤其是在自然语言处理方面。有一些以某种方式使用 Transformer 模型的示例，这些模型可以使计算机理解人类语言并以类似人类的质量执行翻译或总结段落等任务。

以下是如何开始理解注意力机制和转换器：

第 1 步：了解注意力是什么以及它能做什么。
- 注意力研究概览
第 2 步：了解如何在神经网络模型中使用注意力。
- 在 Keras 中向循环神经网络添加自定义注意层
第 3 步：了解如何从注意力机制构建 Transformer 模型。
- 变压器模型
- 用注意力构建变压器模型（我的书）

您可以在此处查看所有Attention 和 Transformer 教程。以下是一些最受欢迎的教程的精选。

注意力基础

变压器基础知识

从头开始构建变压器模型

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

{{userData.name}}已认证

需要帮助开始应用机器学习？

这些是您一直在寻找的分步指南！

你需要什么帮助？

基金会

初学者

中间的

先进的

概率基础

贝叶斯定理

概率分布

信息论

汇总统计

统计假设检验

重采样方法

估计统计

Python 中的线性代数

矩阵

载体

矩阵分解

局部优化

全局优化

梯度下降

优化的应用

基础微积分

多元微积分

优化微积分

微积分的应用

基本语言

故障排除

语言技巧

图书馆

线性算法

非线性算法

集成算法

如何研究/学习 ML 算法

在 Weka 中准备数据

Weka算法教程

在 Python 中准备数据

Python 中的机器学习

R 中的数据准备

R 中的应用机器学习

准备数据

线性算法

算法评估

非线性算法

数据准备教程

预测教程

数据清洗

特征选择

数据转换

降维

XGBoost 基础知识

XGBoost 调整

绩效衡量

成本敏感算法

数据采样

高级方法

背景

多层感知器

卷积神经网络

循环神经网络

背景

多层感知器

建模技术

高级网络

更好的学习（修复培训）

更好的泛化（修复过度拟合）

更好的预测（合奏）

提示、技巧和资源

合奏基础

堆叠合奏

装袋合奏

提升合奏

LSTM 的数据准备

LSTM 行为

使用 LSTM 建模

时间序列的 LSTM

词袋模型

语言建模