免规则采集器列表算法(在一种自顶向下的研究机器学习的方法中,理论应立足于何处?)

优采云 发布时间: 2021-11-03 00:19

  免规则采集器列表算法(在一种自顶向下的研究机器学习的方法中,理论应立足于何处?)

  在机器学习的自上而下方法中,理论应该在哪里?

  在传统的机器学习教学计划中,理论首先需要足够广泛的数学背景才能理解。在我的机器学习教学计划中,我会教你如何从头开始解决端到端的问题并做出结果。

  那么,理论更适合出现在哪里呢?

  在这个文章中,当我们谈论机器学习中的“理论”时,您将确切地了解我们在谈论什么。提示:这都是关于算法的。

  你会发现,一旦你能熟练地解决问题并得到结果,你就会不由自主地深入学习,更好地理解结果,提交更好的结果。没有人能阻止你。

  最后,您将发现在标准数据集上进行机器学习时可以使用的 5 种技术,以逐步增强您对机器学习算法的理解。

  如何在没有数学的情况下学习机器学习

  照片由 Ed Brambley 提供,保留部分权利

  理论学习是最后的,不是第一次

  开发人员教他们如何学习机器学习是没有用的。

  这种方法是自上而下的教育。对你来说没用——如果你是一个开发者,只想用机器学习作为解决问题的工具,而不是成为这个领域的研究人员。

  传统的学习方法要求你在学习算法理论之前先学习线性代数、概率和统计等数学知识。如果您正在研究算法的实现或讨论如何端到端地处理问题并提供可运行、可靠且准确的预测模型,那么您很幸运。

  下面我教大家一个自顶向下的机器学习学习方法。在这个方法中,我们将从1)学习一个系统的流程来处理端到端的问题,2)将流程映射到“最好的”机器学习工具和平台,然后3)在测试数据集上完成有针对性的练习。

  您可以在“程序员的机器学习:从开发人员到机器学习从业者的飞跃”文章 中了解有关自顶向下机器学习方法的更多信息。

  那么该理论应该在哪里适合这个过程呢?

  如果要逆向学习过程,这种情况将在后面讨论。但是当我们使用测试数据集来训练模型时,我们在谈论什么理论?你究竟应该如何学习这个理论?

  获取免费的算法思维导图

  示例-易于使用的机器学习算法思维导图

  我创建了一个方便的思维导图,其中收录 60 多种按类型组合的算法。

  您可以下载它,打印出来并使用它。

  免费下载

  您还可以通过电子邮件享受迷你机器学习算法课程。

  算法就是理论上的一切

  机器学习领域充满了理论。

  它之所以密集,是因为该领域有使用数学来描述和解释概念的传统。

  这很有用,因为数学描述可以非常简洁并减少歧义。他们还可以使用所描述环境中的技术(例如对过程的概率理解)进行分析。

  许多这些不重要的技术通常与机器学习算法的描述捆绑在一起。对于一个只是想对一个方法有一个比较浅薄的了解,然后能够配置和应用的人来说,这种感觉很难让人开心。这太令人沮丧了。

  如果你没有基础去解析和理解算法的描述,那会让你非常沮丧。此外,令人沮丧的是,从计算机科学等领域,总是描述算法,区别在于算法的描述是为了快速理解(例如桌面检查)还是应用程序。

  比如我们知道,在学习哈希表是什么以及如何使用哈希表时,我们几乎不需要知道哈希函数在日常工作中是做什么的。但是我们也可以知道什么是哈希函数,知道从哪里可以了解更多关于哈希函数的具体细节以及如何编写自己的哈希函数。那么为什么机器学习不能这样应用呢?

  在学习机器学习中遇到的大部分“理论”都与机器学习算法有关。如果你问任何其他初学者为什么他们对这个理论感到沮丧,那么你就会知道这与学习如何理解或使用特定的机器学习算法有关。

  在这里,算法的研究比创建预测模型的过程更广泛。它是指选择特征、设计新特征、转换数据以及估计模型在不可见数据上的准确性(例如交叉验证)的算法过程。

  所以,归根结底,学习理论意味着学习机器学习算法。

  被迫钻研理论

  我通常建议在著名的机器学习数据集上进行有针对性的练习。

  由于众所周知的机器学习数据集,它将与 UCI 机器学习库中的数据集一样易于使用。而且它们通常很小,因此不需要太多内存,因此可以在工作站上进行处理。它们也可用于良好的理解和研究,因此您可以有一个比较基准。

  可以在《使用UCI机器学习库中的小型低内存数据库进行机器学习实践》文章中了解更多关于机器学习数据集的实践。

  了解机器学习算法在这个过程中的应用。原因是当你追求标准机器学习算法的结果时,你会遇到限制。你会想知道如何从给定的算法中获取更多信息,或者如何更好地配置它,或者如何实际工作。

  这需要更多的知识和好奇心,这些东西会促使你学习机器学习算法的理论。为了得到更好的结果,你将被迫拼凑对算法的一些理解。

  我们也看到了来自不同背景的年轻开发者的同样效果,他们最终通过研究开源项目的代码、教科书甚至研究论文来磨练自己的手艺。促使他们这样做的原因是需要成为更好、更有能力的程序员。

  如果你对成功充满好奇和动力,你必须学习这个理论。

  理解机器学习算法的 5 个技巧

  你的目标练习时间的一部分将用于学习机器学习算法

  到时候可以用一些技巧和模板来缩短这个过程。

  在本节中,您将发现可用于快速理解机器学习算法理论的 5 种技术。

  1)创建机器学习算法列表

  当您刚开始学习时,您可能会被大量可用的算法所淹没。

  即使您尝试在现场测试算法,您可能仍然不确定哪些算法将收录在您的混合算法中(提示,有很多不同的算法)。

  跟踪您阅读的算法是一项很好的技术,您可以在开始时使用。这些列表可以像算法名称一样简单,也可以随着您的兴趣和好奇心的增加而增加复杂性。

  您还可以捕获详细信息,例如适当的问题类型(分类或回归)、相关算法和分类类别(决策树、内核等)。当您看到新算法的名称时,请将其添加到您的列表中。当你开始一个新问题时,你可以尝试一些你以前从未使用过的算法。或者勾选之前使用的算法等。

  控制列表中的算法名称可以提供强大的功能。这个看似可笑的简单策略可以帮助你摆脱压力。您的简单算法列表可以为您节省大量时间和挫折,例如:

  你必须先创建一个算法列表,请打开一个电子表格并开始创建它。

  有关此技术的更多信息,请参阅“通过创建机器学习算法的目标列表进行控制”文章。

  2)机器学习算法研究

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线