网易2013校园招聘数据挖掘工程师实习生笔试
职位类型:数据挖掘工程师实习生
面试网
面试时间:2013校招
求职信息
招聘公司: 面试问题
礼仪
题目和答案并不完整,请大家多包涵,也欢迎大家在评论中来补充,互相交流一下。
面试网
一、问答题
面试网
a) 欠拟合和过拟合的原因分别有哪些?如何避免? 面试网
欠拟合:模型过于简单;过拟合:模型过于复杂,且训练数据太少。
求职信息
b) 决策树的父节点和子节点的熵的大小?请解释原因。 求职面试
父节点的熵>子节点的熵
求职面试
面试网
c) 衡量分类算法的准确率,召回率,F1值。
求职信息
面试网
d) 举例序列模式挖掘算法有哪些?以及他们的应用场景。 面试网
DTW(动态事件规整算法):语音识别领域,判断两端序列是否是同一个单词。
礼仪
Holt-Winters(三次指数平滑法):对时间序列进行预测。时间序列的趋势、季节性。
求职面试
Apriori 礼仪
Generalized Sequential Pattern(广义序贯模式)
求职信息
PrefixSpan 礼仪
礼仪
求职面试
二、计算题 面试问题
1) 给你一组向量a,b 求职面试
a) 计算二者欧氏距离 面试网
(a-b)(a-b)T 面试网
qzm4
求职面试
c) 计算c、d的皮尔森相关系数
求职面试
即线性相关系数。 礼仪
求职信息
求职面试
三、(题目记得不是很清楚)
qzm4
一个文档-词矩阵,给你一个变换公式tfij’=tfij*log(m/dfi);其中tfij代表单词i在文档f中的频率,m代表文档数,dfi含有单词i的文档频率。 面试网
1) 只有一个单词只存在文档中,转换的结果?(具体问题忘记) 求职面试
2) 有多个单词存在在多个文档中,转换的结果?(具体问题忘记) 求职面试
3) 公式变换的目的?
面试问题
四、推导朴素贝叶斯分类P(c|d),文档d(由若干word组成),求该文档属于类别c的概率,并说明公式中哪些概率可以利用训练集计算得到。 面试问题
求职面试
五、给你五张人脸图片。 可以抽取哪些特征?按照列出的特征,写出第一个和最后一个用户的特征向量。
求职信息
礼仪
六、考查ID3算法,根据天气分类outlook/temperature/humidity/windy。(给你一张离散型的图表数据,一般学过ID3的应该都知道) 求职信息
a) 哪一个属性作为第一个分类属性?
面试网
b) 画出二层决策树。 求职信息
面试问题
七、购物篮事物(关联规则) 礼仪
一个表格:事物ID/购买项。 面试网
1) 提取出关联规则的最大数量是多少?(包括0支持度的规则) qzm4
2) 提取的频繁项集的最大长度(最小支持>0) 面试网
3) 找出能提取出4-项集的最大数量表达式 求职面试
4) 找出一个具有最大支持度的项集(长度为2或更大) 礼仪
5) 找出一对项a,b,使得{a}->{b}和{b}->{a}有相同置信度。
求职信息
八、一个发布优惠劵的网站,如何给用户做出合适的推荐?有哪些方法?设计一个合适的系统(线下数据处理,存放,线上如何查询?)
面试问题
相关百科:
qzm4
求职面试
礼仪
面试问题
求职信息
面试问题
qzm4
声明:网易2013校园招聘数据挖掘工程师实习生笔试来源于互联网,其版权均归原作者及其网站所有,本站虽力求保存原有的版权信息,但由于诸多原因,可能导致无法确定其真实来源,如果您对本站文章、图片资源的归属存有异议,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意!