Dell EMC数据保护部门实习生面试

国内新闻 浏览(714)

这次实习于7月初开始实施。在7月15日下午4点左右的电话中,约会在面试之前不久。第二天[7月16日]是两点钟。

在电话方面,面试官问了很多问题,主要是为了介绍这个项目,基本上我的简历中涉及的算法让我回答了自己的理解。

双方和双方的面试官都没有时间沟通,所以我以基本的技术理解重新审视了我。

这两个技术方面,或简历上的知识点,比一方更详细。主要问题包括:

问:简历中简要介绍项目[答案:项目的最终目的,特点,目标,项目涉及的技术要点]

项目中涉及的代码[我将One-hot编码与项目功能结合起来]

由于该项目涉及RandomForest和GBDT,相当于RF是最好的,您是否考虑过为什么RF的效果会优于GBDT? [没有答案]

项目是独立完成还是分组完成,主要工作的哪一部分? [组表,预数据处理,数据挖掘]

在您的项目中,您还可以编写在线在线课程。在这个课程中,您有自己的想法或做什么? [该课程是与项目取得联系,项目的结果将从在线搜索结果进行比较,相当于结果或参考某些网络上的结果]

使用python学习机器学习需要多长时间?

询问实习经历

问:简要介绍实习经历的工作过程,你自己的工作和对这个问题的理解。

问:选择机器学习算法来谈谈你自己的理解[LR基本思想,目标假设,损失函数,优化过程,输入数据的规范化?使用?正规化以防止过度拟合]

LR在您的常规项目中使用的优点是什么?缺点在哪里? [容易过度拟合,易受异常点影响]

你是否接受过LR + GBDT组合训练? [否]

问:本科成绩要点

问:Bagging和Boosting [样本用法]

之间的最大区别

Bagging and Boosting的优缺点示例及相应的方法[Bagging:RF Boosting:Adaboost,xgboost,GBDT]

问:研究生课程专业

问:自我介绍

因为他表达了在机器学习领域积累一些经验的愿望,所以面试官介绍了公司和机器学习的相关领域。他表示,该项目可能不仅涉及机器学习,我希望我能衡量它。

问:什么是机器学习库有用? [sklearn,tensorflow]

问:数据清理中遇到的数据噪声[异常数据] [默认]

用于处理默认值[组合项目描述处理少量缺失值]

版本问题是否会导致不同程度的默认值?例如,旧版本到新版本的数据将具有默认的部分功能,但我们仍然需要这种数据,在将其放入模型之前我应该怎么做? [这不是很清楚]

你有没有理解如何在将它放入模型之前进行特征选择和特征去噪? [联系模型进行的特征选择,在选择未知模型之前,没有接触统计类方法。]

数据可视化分析,主要采用了哪种可视化方法? [直方图热图散点图]

是否有多维数据的可视化分析? [没有联系]

问:英语六年级

三方面,领导面子

问:你在夏天做什么[学习张量流]

问:用你目前的理解来解释张量流。你为什么需要张量流?它解决了什么问题?

问:我在实习经历中提到了数据清理。你是如何进行清洁工作的?

问:节目中有更多的写作吗?什么语言?

问:你学过操作系统,C ++使用的更多吗?

问:公司的意图是什么?

问:选择这个方向的原因是兴趣,因为它很受欢迎?

问:描述随机森林

问:随机森林主要用来解决什么样的问题?

问:你了解戴尔EMC吗?知道多少

问:你对外国公司了解多少?你想去什么?

然后领导者向我介绍了一些部门的工作和未来的目标。让我考虑一下,一些机器开发可能涉及未来的一些研究和开发,实习生希望更稳定,并希望培训。可以留下来,让我自己考虑一下。这位中层领导总是告诉我让我考虑一下这次实习是否有意义,然后我就不会说话了,我不确定我是否愿意表达积极和积极的意愿。

然后就结束了,这并不酷,你怎么觉得实习是如此困难

mg电子网址