机器学习
本文翻译自 | dzone.com
新兴技术正在席卷全球。它们带来的创新、机遇和威胁是独一无二的。随着他们的成长,对这些领域专家的需求也在增加。
根据最新的行业报告,机器学习、人工智能和数据科学等新兴技术领域的工作是最热门的新兴职业之一。从事机器学习、人工智能或数据科学等新兴技术领域的工作既有利可图,又能激发智力。
在本文中,我整理了一些最常见的机器学习面试问题并提供了相应的答案。机器学习有志者以及经验丰富的 ML 专业人士可以在面试前使用它来完善他们的基础知识。
2019 机器学习面试必看问题
1. 机器学习和深度学习有什么区别?
机器学习是人工智能的一个子集,它为机器提供了无需任何显式编程即可自动学习和改进的能力。虽然深度学习是机器学习的一个子集,但人工神经网络能够做出直观的决策。
2. 你对召回率和准确率的理解是什么?
召回率也称为真阳性率。它是指您的模型声称的正数与整个数据中可用的正数的比较。
准确性,也称为阳性预测值,基于预测。这是一种将模型声称的正数的确切数量与模型声称的实际正数进行比较的度量。
3. 有监督机器学习和无监督机器学习有什么区别?
在监督学习中,机器是在标记数据的帮助下进行训练的,即用正确答案标记的数据。在无监督机器学习中机器学习防止过拟合,模型通过自己发现信息来学习。与监督学习模型相比,无监督学习模型更适合执行困难的处理任务。
4. k – 是什么意思,什么是 KNN?
K-means 是一种用于聚类问题处理的无监督算法,而 KNN 或 K-最近邻是一种用于回归和分类处理的监督算法。
5. 分类与回归有何不同?
这两个概念都是监督机器学习技术的一个重要方面。通过分类,将输出分为不同的类别进行预测。回归模型通常用于发现预测与变量之间的关系。分类和回归之间的一个关键区别是前者的输出变量是离散的,而后者是连续的。
6. 如何处理数据集中缺失的数据?
数据科学家面临的最大挑战之一与丢失数据的问题有关。您可以通过多种方式归因缺失值,包括分配唯一类别、行删除、替换为均值/中值/众数、使用支持缺失值的算法、预测缺失值等等。
7. 您对归纳逻辑编程 (ILP) 的理解是什么?
归纳逻辑编程是机器学习的一个子领域,它通过使用逻辑编程来开发预测模型来搜索数据中的模式。这个过程假定逻辑程序是一个假设或背景知识。
8. 您需要采取哪些步骤来确保不会过度拟合特定模型?
当模型在训练期间提供大量数据时,它会从数据集中的噪声和其他错误数据开始。这使得模型很难学习泛化到训练集以外的新实例,并且机器学习中有三种方法可以避免过度拟合。一是保持模型简单,二是使用交叉验证技术机器学习防止过拟合,三是使用LASSO等正则化技术。
9. 什么是整体学习?
集成方法也称为学习多分类器系统或基于提交的学习。集成方法是指构建分类器集然后对新数据点进行分类以对它们进行预测的学习算法。这种方法训练了许多假设来解决相同的问题。集成建模的最佳示例是随机森林树,其中使用许多决策树来预测结果。
10. 请说出机器学习项目所需的步骤?
实施一个好的工作模型应该采取的一些关键步骤是收集数据、准备数据、选择机器学习模型、模型训练、评估模型、调整参数,最后是预测。
请登录后发表评论
注册
社交帐号登录