初学者如何在机器学习中犯错

原文： https://machinelearningmastery.com/beginners-get-it-wrong/

_ 初学者犯下的 5 个最常见的错误

以及如何避免它们。_

我帮助初学者开始学习机器。

但我在心态和动作中一次又一次地看到同样的错误。

在这篇文章中，您将发现在开始机器学习时我看到初学者滑倒的 5 种最常见的方式。

我坚信任何人都可以开始使用应用机器学习做得很好。

希望您可以在下面的一个或多个陷阱中识别自己，并采取一些纠正措施重新开始。

让我们开始吧。

如何不开始机器学习摄影： Bart Everson ，保留一些权利。

1）不要从理论开始

教授机器学习的传统方法是自下而上的。

努力学习数学背景。
努力学习机器学习理论。
努力从零开始实现算法
??? （_ 插入魔法 _）
最后开始使用机器学习（你的目标！）。

这种方法很慢。这个很难（硬。它专为希望扩展最新技术水平的学者而设计。

它不是为想要结果的从业者设计的。

陷阱

你知道如果你想或说的话，你会陷入这个陷阱：

我需要先用线性代数完成这门课程。
我需要回去获得博士学位。第一。
我必须先阅读这本教科书。

出路

学习 4 年的数学或深奥的算法理论如何让你达到你想要的目标？

你更有可能停下来。失败。不要接近你的目标。

解决方案是翻转模型。

如果机器学习对市场的宝贵贡献是一组准确的预测，那么学习如何建模问题并做出准确的预测。从这里开始。

然后真的很擅长它。

如果您需要，请阅读，窃取，利用理论，但只为您的目标服务。只有它能让你更好地提供价值。

2）不要研究所有的机器学习

机器学习是一个非常大的研究领域。

它是计算机学习过程的自动化，与人工智能有很大的重叠。

从深奥的学习理论到机器人学。这个领域很大。

这个领域太大了，你无法承担所有这些。

The Trap

你知道如果你想到这样的话，你已经屈服于这个陷阱：

我需要了解新网站上提到的每种新技术。
我需要先了解计算机视觉，自然语言处理，演讲等。
我需要知道关于一切的一切。

The Way Out

选择一个小角落并专注于它。

然后再缩小它。

最有价值的机器学习领域是预测性建模。从数据创建模型以做出预测。

从那里开始。

接下来，重点关注一种与您最相关或最感兴趣的预测性建模。

然后坚持下去。

也许你选择技术，比如深度学习。或者您可以选择问题类型，例如推荐系统。

也许你不确定，所以无论如何都选择一个。好好或至少精通。

然后，稍后，回到另一个区域。

3）不要乱用算法

机器学习实际上是关于算法。

有很多算法。每个算法都是一个复杂的系统，它本身就是一个很小的研究领域。它是自己的生态系统。

你可能会迷失在算法中。人们这样做。

他们被称为学者。

The Trap

如果你发现自己说：

在使用之前我需要知道它为什么有效。
我需要首先深入理解超参数。
我需要在调整时解释原因和结果。

The Way Out

算法不是结果。它们是结果的手段。

实际上，机器学习算法是一种商品。

把它们换掉。在你的问题上尝试一下它们。调整一些，但继续前进。

您可以了解有关算法的更多信息以获得更好的结果，但知道何时停止。

使用系统过程。设计调整实验并自动执行和分析。

机器学习是关于算法的良好运用，但应用机器学习不仅仅是摆弄算法。

专注于从每个项目提供结果的目标，即一组预测或可以制作它们的模型。

Wring Way Go Back 照片由 Dallas 拍摄，保留一些权利。

4）不要从零开始实现一切

你可以从从零开始实现算法中学到很多东西。

有时你甚至需要实现一种技术，因为没有合适的或可用的实现。

但是，一般来说，你没有，你不应该。

你的实现可能很糟糕。抱歉。

它会有错误。
它会慢。
它将是记忆猪。
它不会很好地处理边缘情况。
它甚至可能是错。

The Trap

如果你在这个陷阱中：

您正在编写代码来加载 CSV 文件（_ 到底是什么！？_）
您正在为线性回归等标准算法编写代码。
您正在编写用于交叉验证或超参数调整的代码。

The Way Out

停下来。

使用由处理所有边缘情况的数十或数十万其他开发人员使用的通用库，并且已知是正确的。
使用高度优化的库，从硬件中挤出每个最后一个周期和每个最后一个字节的内存。
为您自己的项目使用图形用户界面，完全避免使用代码。

每次想要使用它时实现所有内容都是开始机器学习的一种非常缓慢的方式。

如果您正在实现学习，那么请对自己诚实，并将其与学习如何通过应用机器学习提供价值分开。

5）不要一直改变工具

有很多很棒的机器学习工具。

事实上，伟大的工具，数据可用性和快速硬件是我们在机器学习中看到文艺复兴的原因。

但是你可能陷入跳跃到你偶然发现的每个新工具的陷阱。

The Trap

如果你发现自己，你就陷入了这个陷阱：

使用您听到的每个新工具。
发现每周或每月都要学习一种新的工具或语言。
通过学习库并将其留给新库中途。

The Way Out

学习和使用新工具。

但要有战略意义。

将新工具集成到您的系统过程中，以解决机器学习问题。

如果你选择一个大型主要平台并坚持使用它，你将会更有效地解决问题，至少在你做得好或精通它之前。

我推荐的前 3 个平台是：

Weka Workbench 。
Python 生态系统。
R 平台。

还有其他的，如果你的地区有更多的专业工具。

跟进是爱好者和专业人士之间的区别。

摘要

在这篇文章中，您将发现我在机器学习中看到的 5 个最常见的错误。

他们再次：

不要从理论开始。
不要学习所有的机器学习。
不要乱用算法。
不要从零开始实现一切。
不要一直改变工具。

你陷入了这些陷阱吗？你需要帮忙吗？

发表评论，我来帮忙。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

beginners-get-it-wrong.md

beginners-get-it-wrong.md

初学者如何在机器学习中犯错

_ 初学者犯下的 5 个最常见的错误

1）不要从理论开始

陷阱

出路

2）不要研究所有的机器学习

The Trap

The Way Out

3）不要乱用算法

The Trap

The Way Out

4）不要从零开始实现一切

The Trap

The Way Out

5）不要一直改变工具

The Trap

The Way Out

摘要

Files

beginners-get-it-wrong.md

Latest commit

History

beginners-get-it-wrong.md

File metadata and controls

初学者如何在机器学习中犯错

_ 初学者犯下的 5 个最常见的错误

1）不要从理论开始

陷阱

出路

2）不要研究所有的机器学习

The Trap

The Way Out

3）不要乱用算法

The Trap

The Way Out

4）不要从零开始实现一切

The Trap

The Way Out

5）不要一直改变工具

The Trap

The Way Out

摘要