2015百度校招用户行为分析研发工程师笔试题

2014-12-29 16:21 作者 : 围观 : 次 TAG标签：笔经百度 2015年校园招聘

职位类型：技术类岗位

礼仪

笔试时间：2013年百度校园招聘（）

礼仪

qzm4

招聘公司：求职信息

礼仪

1.简答题（本题共30分）

面试问题

1)当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的执行效率？（10分）求职面试

2)Unix/Linux系统中僵尸进程是如何产生的？有什么危害？为何避免？（10分）

面试问题

3)一道选择题有如下四个选项，假设你随机选一个答案，你的答案正确的概率是那个选项？礼仪

A 25% B 50% C 60% D 25% qzm4

请解释你选择的原因。（10分）

qzm4

2.算法与程序设计题（本题共45分） qzm4

1）使用C/C 语言写一个函数，实现字符串的反转，要求不能用任何系统函数，且时间复杂度最小，函数原型是 char* reverse_str(char* str)。（15分）面试问题

2）给定一个如下格式的字符串(1,(2,3),(4,(5,6),7))括号内的元素可以是数字，也可以是另一个括号，请实现一个算法消除嵌套的括号，比如把上面的表达式变成：(1,2,3,4,5,6,7)，如果表达式有误请报错。

求职面试

3）相似度计算用于衡量对象之间的相似程度，在数据挖据，自然语言处理中使一个基础性计算，在广告检索服务中往往也会判断网民检索Query和广告Adword 的主题相似度。假设Query 或者Adword 的主题属性定义为一个长度为10000 的浮点数据Pr[10000](称之为主题概率数组)，其中Pr[i]表示Query 或者Adword 属于主题Id 为i 的概率，而Query和Adword 的相似度简化定义为两者主题概率数组的内积，即sim(Query,Adword)=sum(QueryPr[i]*AdwordPr[i])(0<==i<10000).在实际应用场景中，由于大多数主题的概率都为0，所以主题概率数组往往比较稀疏，在实现时会以一个紧凑型数组topic_info_t[]的方式保存，其中100<=数组大小<=1000，并按照topic_id 递增排列，
0<=topic_id<10000,0< topic_pr<1,
Struct topic_info_t {
int topic_id;
float topic_pr;
} ; 面试网

现在给出Query 的topic_info_t 数组和N(N>=5000)个Adwords 的topic_info_t 数组，现要求出Query 与Adwords 的相似度最大值，即
max(sim(Query,Adword[i])(0<=ifloat max_sim(const vector& query_topic_info,
const vectoradwords_topic_info[],
int adwords_number);

礼仪

编写代码求时间复杂度最低的算法，并给出时间复杂度分析。(15分)

求职信息

求职面试

3.系统设计题（本题共25分） 面试网

子query统计和重要子query识别求职面试

面试问题

问题定义：

求职面试

当query A切词后的term集是query B切词后的term集的真子集时，成query A为query B的子query，例如：面试问题

        “刘德华”的切词结果为“刘德华”；
        “刘德华电影”的切词结果为“刘德华电影”；
        “刘德华最新电影”的切词结果为“刘德华最新电影”；
        “刘德华电影下载”的切词结果为“刘德华电影下载”；面试网

        根据以上切词结果，刘德华”是“刘德华电影”，“刘德华最新电影”, “刘德华电影下载”的子query；
        “刘德华电影”是“刘德华最新电影”, “刘德华电影下载”的子query；
        但是“刘德华电影下载”和“刘德华最新电影”不想不是对方的子query。求职面试

现有亿级的用户query，并且知道每个query的查询次数，要求：面试问题

1）列出一个query的全部子query，写出C语言实现。（15分）面试问题

2） query中的不同term对这个query的重要形式不同的，例如“刘德华电影下载”中“刘德华”和“电影”的重要性比“下载”重要，因为：“刘德华电影“所表达的查询需求，与”刘德华下载“或者”电影下载“相比，更接近原query的需求。根据(1)中的统计的子query数据，请给出一种思路，来计算也给query中的所有子query的重要性排序。如果认为子query数据的信息不够充分，请给出还需要哪些信息，以及获得这些信息的途径，给出算法思路描述，必要的符号和推理公式即可。（10分）

面试问题

4.统计方法（本题共20分） qzm4

假设检验是常用的统计推断方法，在大数据时代，人们可以更加容易地得到更多特征。在ab-test时，常常需要使用假设检验方法研究特征在两者样本间是否有差异。一个常见的现象是，当特征数目较多时，在同样的显著性水平下，往往更加“容易”得到“显著差异”结果。

求职信息

        1)如何看待特征数目假设检验结果的影响？
        2)假设独立特征数目是n，如何调整各个特征的p-value，调整后的p-value真实反映特征在两组间存在差异的显著性。
        3)假设特征间分布不独立，(2)的解决方案是否需要调整，如何调整？

礼仪

面试网

声明：2015百度校招用户行为分析研发工程师笔试题来源于互联网，其版权均归原作者及其网站所有，本站虽力求保存原有的版权信息，但由于诸多原因，可能导致无法确定其真实来源，如果您对本站文章、图片资源的归属存有异议，请立即通知我们，情况属实，我们会第一时间予以删除，并同时向您表示歉意！

标签: 笔经百度 2015年校园招聘 2015百度校招用户行为分析研发工程师笔试题

上一篇：职场故事：年轻人应该以学业为重下一篇：银行求职简历撰写“三大注意”

建行招聘笔经大合集，备考经验分享

建设银行的校园招聘笔试分为专业部分和综合部分，每年的考试顺序以及考试题量有所区别，但其中也有不变的部分...
2022-11-09 金融校园招聘笔试攻略
那些关于百度经验引流的财富故事

今天说百度经验引流，有多少财富，就有多少秘密 2个故事，4个案例，一份绝密流量宝典，割不割，练不练，全由个...
2019-12-27 职场
如何解决网站百度快照劫持问题

主要想解决一个问题就是：企业官网被病毒入侵，百度收录网站标题被篡改为第三方标题与描述的解决方法。相信大...
2019-11-22 职场
三个月，日均指数1W5的关键词“垃圾分类”排名百度首页

SEO这个名词相信大家都不陌生，在现在这个互联网的时代，实体企业几乎百分之70以上都有在做互联网推广，同样也正...
2019-11-06 职场
三分钟学会百度霸屏实现全网引流

多少人打工的时候创造着3W的产值，却感恩戴德的拿着3K的薪水; 老板绞尽脑汁压榨着你的剩余价值，同事日复一日的...
2019-10-29 职场
百度升级烽火算法2.0，提升打击网站劫持覆盖范围

近日，百度搜索官方发表公告称：为了保证搜索的公正性以及搜索用户的搜索安全，最近百度将对烽火算法2.0 进行升...
2019-10-15 职场
百度官方公布8月份对违规网站的处罚报告

最近，百度在官网公布了，8月份关于百度搜索的一些违规网站通告，根据数据来看，这次主要涉及到网站问题的有虚...
2019-09-25 职场
百度知道如何被动引流？借鸡下蛋

百度作为中文第一大搜索引擎。虽然现在经常被人骂。但并不影响百度的口号。百度一下。每天都有形形色色的人在...
2019-09-23 职场
百度网页分享按钮工具下线

最近不知道各位站长有没有注意，最近百度分享在没有任何官方公告的前提下悄悄下线了目前百度分享的官方网站已...
2019-09-10 职场
百度统计正式上线白名单过滤功能

最近，百度针对近期发生的很多网站百度统计代码被盗取网站出现的不明来源的问题不出意外的对外做出了表态，表...
2019-09-04 职场