需要帮助开始应用机器学习?

这些是您一直在寻找的分步指南!

你需要什么帮助?

 

我如何开始?

我被问到的最常见问题是:“我如何开始?

我对机器学习入门的最佳建议分为 5 个步骤:

有关此自上而下方法的更多信息,请参阅:

我的许多学生都使用这种方法继续在 Kaggle 比赛中取得好成绩,并获得了机器学习工程师和数据科学家的工作。

应用机器学习过程

机器学习的好处是预测和做出预测的模型。

拥有应用机器学习的技能意味着知道如何始终如一地可靠地对一个又一个问题提供高质量的预测。你需要遵循一个系统的过程。

以下是一个 5 步流程,您可以按照该流程在预测建模问题上始终如一地取得高于平均水平的结果:

有关此过程的完整摘要,请参阅以下帖子:

机器学习的概率

概率是量化和利用不确定性的数学。它是许多数学领域(如统计学)的基石,对于应用机器学习至关重要。

以下是您可以用来快速了解机器学习概率的 3 步过程。

您可以在此处查看有关概率的所有教程。以下是一些最受欢迎的教程的精选。

机器学习统计

统计方法是深入了解机器学习算法行为所需的重要数学基础领域。

以下是您可以用来快速掌握机器学习统计方法的 3 步过程。

您可以在此处查看所有统计方法帖子。以下是一些最受欢迎的教程的精选。

机器学习的线性代数

线性代数是深入理解机器学习算法所需的重要数学基础领域。

下面是 3 个步骤的过程,您可以使用它来快速掌握用于机器学习的线性代数。

您可以在此处查看所有线性代数帖子。以下是一些最受欢迎的教程的精选。

 

机器学习优化

优化是所有机器学习算法的核心。当我们训练机器学习模型时,它正在对给定的数据集进行优化。

您可以通过 3 个步骤快速熟悉机器学习的优化。

您可以在此处查看所有优化帖子。以下是一些最受欢迎的教程的精选。

机器学习微积分

微积分是许多机器学习算法成功的隐藏驱动力。当我们谈论机器学习算法的梯度下降优化部分时,梯度是使用微积分找到的。

您可以通过 3 个步骤熟悉机器学习的微积分。

您可以在此处查看所有微积分帖子。以下是一些最受欢迎的教程的精选。

用于机器学习的 Python

Python 是机器学习项目的通用语言。不仅很多机器学习库都是用Python编写的,而且能有效的帮助我们快速、利落的完成我们的机器学习项目。拥有良好的 Python 编程技能可以让您在更短的时间内完成更多的工作!

您可以通过 3 个步骤熟悉用于机器学习的 Python。

您可以在此处查看所有Python 帖子。但是不要错过Python for Machine Learning我的书)。以下是一些最受欢迎的教程的精选。

了解机器学习算法

机器学习是关于机器学习算法的。

您需要了解针对给定问题可用的算法、它们的工作原理以及如何充分利用它们。

以下是如何开始使用机器学习算法:

您可以在此处查看所有机器学习算法帖子。以下是一些最受欢迎的教程的精选。

Weka 机器学习(无代码)

Weka 是一个平台,您可以使用它开始应用机器学习。

它有一个图形用户界面,这意味着不需要编程,它提供了一套最先进的算法。

以下是开始使用 Weka 的方法:

您可以在此处查看所有Weka 机器学习帖子。以下是一些最受欢迎的教程的精选。

Python 机器学习 (scikit-learn)

Python 是应用机器学习发展最快的平台之一。

您可以在模型的开发和运营部署中使用相同的工具,如 pandas 和 scikit-learn。

以下是您可以用来开始使用 Python 机器学习的步骤:

您可以在此处查看所有Python 机器学习帖子。以下是一些最受欢迎的教程的精选。

R 机器学习(插入符号)

R 是一个统计计算平台,是专业数据科学家中最受欢迎的平台。

它之所以流行,是因为有大量可用的技术,并且因为这些方法具有出色的接口,例如功能强大的 caret 包。

以下是 R 机器学习入门的方法:

您可以在此处查看所有R 机器学习帖子。以下是一些最受欢迎的教程的精选。

从零开始的代码算法(Python)

通过从头开始编写代码,您可以学到很多关于机器学习算法的知识。

通过编码学习是许多开发人员和工程师的首选学习方式。

以下是如何通过从头开始编写所有内容来开始机器学习。

您可以在此处查看 Scratch 帖子中的所有代码算法。以下是一些最受欢迎的教程的精选。

时间序列预测简介(Python)

时间序列预测是业务应用程序中的一个重要主题。

许多数据集包含时间成分,但从机器学习的角度来看,时间序列的主题很少被深入探讨。

以下是时间序列预测的入门方法:

您可以在此处查看所有时间序列预测帖子。以下是一些最受欢迎的教程的精选。

 

机器学习的数据准备 (Python)

您的预测模型的性能取决于您用来训练它的数据。

因此,数据准备可能是您应用的机器学习项目中最重要的部分。

以下是机器学习数据准备入门的方法:

您可以在此处查看所有数据准备教程。以下是一些最受欢迎的教程的精选。

Python 中的 XGBoost(随机梯度提升)

XGBoost 是梯度提升决策树的高度优化实现。

它很受欢迎,因为它被世界上一些最好的数据科学家用来赢得机器学习竞赛。

以下是开始使用 XGBoost 的方法:

您可以在此处查看所有XGBoost 帖子。以下是一些最受欢迎的教程的精选。

分类不平衡

不平衡分类是指分类任务,其中一个类的示例比另一个类多得多。

这些类型的问题通常需要使用专门的性能指标和学习算法,因为标准指标和方法不可靠或完全失败。

下面介绍如何开始使用不平衡分类:

您可以在此处查看所有不平衡分类帖子。以下是一些最受欢迎的教程的精选。

深度学习(凯拉斯)

深度学习是一个迷人而强大的领域。

最先进的成果来自深度学习领域,它是机器学习中不可忽视的一个子领域。

以下是深度学习入门的方法:

您可以在此处查看所有深度学习帖子。以下是一些最受欢迎的教程的精选。

深度学习(PyTorch)

除了 Keras,PyTorch 是另一个市场份额巨大的深度学习库。了解 PyTorch 并熟悉其语法非常重要。

以下是在 PyTorch 中开始深度学习的方法:

您可以在此处查看所有PyTorch 深度学习帖子。以下是一些最受欢迎的教程的精选。

更好的深度学习性能

尽管定义和拟合深度学习神经网络模型很容易,但要在特定的预测建模问题上获得良好的性能可能具有挑战性。

您可以使用一些标准技术来改进学习、减少过度拟合并使用深度学习模型做出更好的预测。

以下是如何开始获得更好的深度学习性能:

您可以在此处查看所有更好的深度学习帖子。以下是一些最受欢迎的教程的精选。

集成学习

预测性能是许多分类和回归问题中最重要的关注点。集成学习算法结合了来自多个模型的预测,旨在比任何贡献的集成成员表现得更好。

以下是如何开始获得更好的集成学习性能:

您可以在此处查看所有集成学习帖子。以下是一些最受欢迎的教程的精选。

长短期记忆网络 (LSTM)

长短期记忆 (LSTM) 递归神经网络专为序列预测问题而设计,是用于挑战性预测问题的最先进的深度学习技术。

以下是在 Python 中开始使用 LSTM 的方法:

您可以在此处查看所有LSTM 帖子。下面精选了一些在 Python 中使用 LSTM 和 Keras 深度学习库的最流行的教程。

 

自然语言处理 (NLP) 的深度学习

由于自然语言的混乱性质,处理文本数据很困难。

文本不是“已解决”,而是要在具有挑战性的 NLP 问题上获得最先进的结果,您需要采用深度学习方法

以下是自然语言处理深度学习入门的方法:

您可以在此处查看有关 NLP 深度学习的所有帖子。以下是一些最受欢迎的教程的精选。

计算机视觉的深度学习

由于原始像素和图像中的含义之间存在鸿沟,因此处理图像数据很困难。

计算机视觉并没有解决,但要在具有挑战性的计算机视觉任务(如对象检测和人脸识别)上获得最先进的结果,您需要深度学习方法。

以下是计算机视觉深度学习入门的方法:

您可以在此处查看有关计算机视觉的所有深度学习帖子。以下是一些最受欢迎的教程的精选。

时间序列预测的深度学习

深度学习神经网络能够自动学习从输入到输出的任意复杂映射,并支持多个输入和输出。

MLP、CNN 和 LSTM 等方法为时间序列预测提供了很多希望。

以下是开始深度学习进行时间序列预测的方法:

您可以在此处查看有关时间序列预测帖子的所有深度学习。以下是一些最受欢迎的教程的精选。

生成对抗网络 (GAN)

生成对抗网络,简称 GAN,是一种使用深度学习方法(例如卷积神经网络)进行生成建模的方法。

GAN 是一个令人兴奋且瞬息万变的领域,它兑现了生成模型的承诺,能够在一系列问题领域中生成真实的示例,尤其是在图像到图像的转换任务中。

以下是如何开始深度学习生成对抗网络:

您可以在此处查看所有生成对抗网络教程。以下是一些最受欢迎的教程的精选。

 

注意力和变形金刚

注意机制是为了缓解递归神经网络无法很好地处理长输入序列的问题而发明的技术。我们了解到注意力机制本身可以用作神经网络的构建块,因此我们现在有了 Transformer 架构。

注意力机制和转换器模型被证明可以提供惊人的结果,尤其是在自然语言处理方面。有一些以某种方式使用 Transformer 模型的示例,这些模型可以使计算机理解人类语言并以类似人类的质量执行翻译或总结段落等任务。

以下是如何开始理解注意力机制和转换器:

您可以在此处查看所有Attention 和 Transformer 教程。以下是一些最受欢迎的教程的精选。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧