数据分析师面试题(数据分析师面试题业务)

虚拟屋 2022-12-15 15:20 编辑:admin 290阅读

1. 数据分析师面试题业务

面试的基本内容包括自我介绍和hr提问。

信息员这份工作,需要的能力还是很多的,除了需要普通话标准之外,还需要很多其他的能力,比如说对数据的处理分析,分类等等,可以先了解一下信息员的基本工作职责。

信息员的基本工作职责:

1、信息员在单位信息化管理部门和本部门(单位)负责人的领导下,参与单位信息化建设,负责所在部门(单位)的信息化建设和推广工作。

2、负责本部门(单位)信息资源的建设与管理工作,做好信息的整理、发布与备份,及时更新,保证信息的准确性、可用性和及时性。

3、部门网站的维护与更新:负责本部门(单位)信息发布工作,只发布与本部门(单位)工作业务相关的信息,所发布信息须经本单位主要负责人批准。用户密码不得转告他人。

4、部门网站安全与保密:加强网站信息的监管工作,定期查看,发现问题,立即处理并上报给信息化建设领导小组,确保网站信息的安全。

5、负责对本部门(单位)管理信息子系统的不断完善和优化,提供良好的建议。负责培训本部门人员应用学院信息化平台,协助本部门人员参与学院信息化建设。

6、负责本部门(单位)网络的安全、保密管理工作,预防并制止本单位人员利用网络从事不良活动的行为,发现问题及时上报。

7、负责组织对本部门(单位)网络设备与入网计算机的管理,监护由现代教育技术中心安装放置在本单位的校园网络接入设备与线路等设施。

8、负责本部门(单位)IP地址的管理。

9、能到对信息进行简单的分析提供对部门有利用价值的信息资源。

所以说想要做信息员的话,需要的能力还是很多的,主要还是专注提升自身的能力。

2. 数据工程师面试题

首先可以问一些共通的专业基础知识,计算机体系结构,网络通信协议,操作系统,还有数据结构相关的知识,比如CPU流水线,指令集,TCP/IP协议,LINUX内存管理,链表和二叉树等。

然后根据对方简历上提到的项目技术针对性的进行提问,比如对方做过USB设备驱动,就针对性的问问USB的传输类型,枚举过程,还有描述符相关的内容。

3. 数据分析师面试问题及答案

一 曰常游戏:

1.数据异常就是说明腾讯的电脑系统检测到你的帐号数据异常

这些异常可能是楼主使用非法软件或者楼主频繁的掉线登陆游戏 都有可能被检测到数据异常

这种情况请楼主等待半个小时以后在登陆 否则很容易导致被封号。

二.业务异常:

数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当我们面对市场、产品、运营等各种业务场景,经常会发现很多异常数据的问题,比如:

某APP日活DAU相比昨日突然下降了10%,该如何分析?

某公司销售收入环比上月下降了15%,该如何分析?

某产品客单价环比上月下降了20%,该如何分析?

……

上述各种业务场景,其实都是发现了数据有异常波动的情况,那接下来问题来了,我们该如何着手进行分析呢?大部分人解决问题的思路,都是直奔主题找原因,上来就去找出现异常的原因、异常点在哪里。其实这种分析思路有一个最大的弊端就是不够体系化,往往能够找到一些原因,但是很可能是片面的,甚至可能还会踩雷。接下来就给大家分享一种比较实用的方法,我个人称之为“点 – 线 – 面”分析法:

1. 点

首先排查数据准确性,确定是否属于数据错误。容易出现数据错误的环节有数据采集环节(埋点)、数据提取环节、产品环节(BUG)、业务环节(数据口径)等。如果没有问题进入下一步分析;

2. 线

拉长时间周期,也就是进行纵向分析,看是否属于周期性波动,有些行业受季节或淡旺季影响较大,比如家电、饮料、在线教育等都受淡旺季影响较大。如果没有问题进入下一步分析;

3. 面

首先,综合运用公式拆解法、多维度拆解法等对大问题进行拆解,拆解为一个个可着手分析的小问题;然后,通过计算影响系数初步定位到主要影响原因;最后,大胆假设,小心验证,通过假设检验法逐步排查到产生问题的根本原因。

比如,我们以销售收入下降为例,通过“点 – 线 – 面”分析中的“点 – 线”分析确认属于数据异常后,接下来就可以在“面”的分析环节中采用“三部曲分析”法,主要流程如下:

1)运用公式拆解法、多维度拆解法等对大问题进行拆解

2)计算影响系数,定位主要原因影响系数=( 细分项本月数 -细分项上月数 ) / ( 本月总量 – 上月总量 )

影响系数越大,说明该维度数据就是造成总体波动的主要影响因素。

3)通过假设检验法逐步排查根本原因

假设在计算影响系数后,初步确定主要是新用户减少引起的收入下降,接下来就需要对新用户数下降的原因进行假设,常见的假设维度有内、外部维度,其中内部维度主要有渠道侧、产品侧、运营侧、技术侧等等,然后通过数据逐一对上述假设进行验证。

以上是几种常见的拆分维度,通过初步拆分,定位原因大致范围。

4. 数据分析师 面试题

数据能力靠嘴没法说,只能吹嘘前公司背景以及对数据方面的重视。

5. 数据分析 业务面试

(1)项目的数据量多大,多少维,数据都是怎么预处理的。

(2)你应用过哪些数据挖掘算法,针对简历上的算法或者模型,你看过源码或者模型中细节你知道多少,还是仅仅调用API用用而已

(3)项目中,你遇到过的最大的困难时什么,怎么解决的,从中学到什么。

(4)项目中hadoop搜索引擎你是怎么设计的,其中的分词是什么。

(5)数据是存在HDFS中还是Redis中的。

(6)spark和Hadoop的基本架构,尽量说。

6. 数据分析师面试题目及答案

可以看看开课吧这个课程,感觉还是很不错的。

近日,开课吧与百度、微软、阿里、滴滴以及创新工场等头部企业展开深度合作。至此,开课吧系统化课程《大数据分析全栈工程师》将注入更多“大厂脱敏数据、实战项目、云服务等”新鲜血液,而课程内容将更加丰富,实战性也将更强。

重要的是,Boss直聘、猎聘网等多家就业招聘企业也同开课吧达成合作,可为毕业生提供优先推荐服务,绝不让薪资就业成为难住学员的问题。

大数据分析全栈工程师 课程招生

全新改版,深度可达阿里P7

多名一线数据科学大师倾力指导

(前腾讯、美团、百度)

找工作拿不到 offer 退学费

本课程由廖雪峰老师团队倾情打造,围绕企业用人标准,­多次调研百度、腾讯、阿里、美团、头条、滴滴等互联网企业,深入了解一线大厂针对数据分析 / 数据挖掘 / 数据科学需要掌握的必备技能,再结合各大招聘网站对该岗位的要求以及行业专家和技术大牛的建议,全新打造的数据科学相关的课程。

一 、课程简介

1.1 面向希望自己能够在4-6个月内找到一份数据分析师、业务数据分析师、数据挖掘等岗位的同学以及数据驱动的业务工作者。本课程尤其适合:

业务部门的运营、产品、管理、业务分析等谋求数据驱动业务的工作者;

目前从事数据分析师想晋升专业数据分析师或基于互联网平台的大数据分析师的在职人员;

数学、统计、金融、财务、计算机等相关专业的高年级本科生或研究生;

从事Python开发或传统IT技术开发,想往数据分析/数据挖掘方面转行的朋友;

对数据科学具备一定的热情,希望能够从事相关行业或者自己创造相关产品的人员;

对数学、编程具有一定的热情,对数据敏感的人员;

1.2 关于退还学费:报名就业班的同学,报名伊始既签订合同,若上完课程拿不到 offer 或者 offer 初次就业薪资达不到年薪19万,既退还学费。

二、五大实战项目

三、课程内容

课程持续时间为4个月,内容包括:

1. 主修专业课程;

2. 选修拓展课;

3. 个性化项目作业评审,全程进度督促与问题解答;

4. 模拟面试、简历修改、背景提升等职业生涯辅导;

5. 在线大数据实验平台。

2.1 主修专业课程

主修课,周期一共4个月,100课时,共3大部分:

1)数据分析之禅

2) 数据分析之道

3) 大数据分析之术

2.2选修拓展课

选修课《R语言之数据挖掘实战》,每位同学均可免费选修学习,这是针对不同基础的同学设计的专项强化课程。学不学这块不影响就业,总共30课时左右。

四、师资介绍

除了我们的课程老师,为保障课程质量,我们为大家组建了相应的助教团队,助教团队负责我们的日常答疑和作业、项目批改。

助教团队:

张师兄:前小米数据分析师,精通大数据平台数据分析,精通Hive;

张师姐:前瓜子二手车数据分析师,精通Excel数据可视化,Python数据分析;

潘师兄:前搜狐数据分析师,精通Python、SQL、Tableau

五、课程优势介绍

1. 内容由浅入深,层层递进:课程第一部分完全按照零基础的学员能力设计,涵盖基础的Excel操作,Excel数据可视化,认识和熟悉工具;紧接着第二部分刚开始的Python基础,也是照顾零基础的学员,慢慢的深入,到后面的数据科学库numpy、pandas等;再到第三部分的基于Hadoop平台的数据分析和建模,数据挖掘算法,层层递进和加深,尽可能让有基础和无基础的同学都能跟得上并学会,在学员入门过后再加深难度。

2. 既有深度,又有广度:目前市面上几乎所有的数据分析课都是基于Python和Excel的那一套,再穿插点数据挖掘的入门,千篇一律。我们调研后发现,几乎所有大型互联网企业招聘数据分析师都要求掌握大数据平台的数据分析,如Hive,而课程的第三部分就完全包含这些,这是我们课程的独家特色,且占比达整个课程的50%左右,这块就是拉开薪资的地方,就是区分传统数据分析师和大数据分析师的地方。

3. 纯大型互联网企业师资:课程的设计和讲解都来源于纯一线大型互联网企业导师(top10互联网企业),导师即是讲师,也是企业里的数据分析师,也是企业的数据分析师面试官,掌握和熟悉一切主流的技术方案和方法论。来源于企业,输出到企业,这是我们的课程跟其他课程的本质区别。

4. 课程结果保障:选择课程就业班的同学,报名伊始既签订协议,若完成课程拿不到 offer 或者初始就业税前年薪低于19万/年(限北上广深杭),则退还学费。

5. 全程进度督促:大家学习一门知识,善始者实繁,克终者盖寡。下定决心学习只是第一步,坚持学习完毕才是重中之重。我们课程组老师和助教会全程督促各位同学完成课程。

6. 线下大咖见面会:我们会不定期组织线下交流会(限北上广深杭),届时会邀请廖雪峰及各位一线大厂的数据专家跟大家见面交流,促进行业发展和个人圈子发展。

六、你需要达到什么样的预备能力

依据往期学生的经验,要能完成以上学习任务需要具备以下背景能力:

至少具备大专学历,本科及硕士以上学历更佳;

持续自学能力,能够每周投入12小时以上(6小时上课,6小时作业),持续4个月进行学习;

具有良好的逻辑思维能力;

有编程语言基础优先。

注:不具备预备能力的同学,我们为您提供了预修课程(Excel、Python和MySQL),帮助大家做好开课前的知识铺垫。

七、学费、资助与质量保障

通关班:7980元

就业班:17980元

本次课程培训为期时长4个月,通关班与就业班的课程内容一致,但是就业班会签订就业协议。

分期付款:本课程可以为同学提供 3、6、12 期分期付款;

退还学费:报名就业班的同学,报名伊始既签订协议,若完成课程拿不到 offer 或者初始就业税前年薪低于19万/年(限北上广深杭),则退还学费。

前3次课不满意无理由退还学费:正式开课后前3次课不满意,学员可提出退还学费,课程组将无理由退还学费。

八、报名流程与重要时间节点

九、学员评价

左右滑动查看更多

十、相关问题答疑

Q:如何看待数据分析师这一岗位能力要求?

A:最简单的办法就是直接去招聘网站观看,你会发现,岗位需求里面的描述出现最多的技能有Excel、SQL、Tableau、Hive、Python/R等这些,而经过我们调研多位一线大型互联网企业导师发现,在大型互联网企业,Hive SQL是用的最多的,也是最重要的技能之一,也是数据分析师和大数据分析师的本质区别,也是拉开薪资的重要技能之一,而这一块几乎也是我们大数据分析课程的重中之重,内容占比达50%左右。

Q:Python工程师的出路在哪?

A:随着这几年AI人工智能的火爆,带动了Python的热潮,各种Python课程如雨后春笋般的涌现出来,80~90%的内容都是Python Web方向,因为AI人工智能门槛太高。所以普及大众,如果学Python,大部分都是往Python Web方向引,要学Python基础、然后学Flask、Django、然后学一点运维的知识,但是这么干基本上没法就业。因为Python Web方向市场太小,以至于现在基本上是个伪方向,不可否认Python可以写接口,用作网站的后端,但是这么干的公司极少(这相当于是抢Java和PHP的饭碗),所以就导致没有就业的岗位,同时也导致了很多人学Python交了几万块学费无法就业的场景,要么转行要么放弃。

除了门槛较高的AI必须掌握Python,数据分析和数据挖掘方向倒是一个门槛相对较低且不错的发展方向。爬虫和运维也是Python的方向,但是相对来说,岗位太少,太传统,竞争力不大。真要做运维,十年前就可以,为什么是现在?

Q:请问就业班对于任何人都适用吗?

A:报名的同学我们都会联系大家,了解大家的情况之后具体做出建议。就业班对同学是有一定要求的。

Q:学完课程能达到什么水平?

A:依据上一期的学员情况,学完课程的同学,能够达到以下能力要求:

熟练掌握数据库MySQL基本使用,精通SQL语句和Hive SQL;

熟悉数据挖掘的思路和常用的数据挖掘算法;

熟练掌握Excel、Power BI、Tableau等数据分析可视化工具;

掌握Python/R;

能够对崭新的问题进行建模分析,使用已知知识进行解决;

具备应对 BAT 级别相关岗位面试的能力。

最后,感谢大家阅读至此,希望之后能与大家度过一个忙碌而又丰富的学习历程。

注:由于添加人数较多,教务老师没法第一时间一一通过,请耐心等待。

附:1、线下交流会现场

7. 数据分析师面试试题

自我介绍和一些问题

一个主考官主要负责听取你的自我介绍,当然其他考官也在仔细的听,同时给你打分数。2分钟自我介绍完,另外的考官每人问你一个问题。

面试问题:1、如果你进入一个部门后,第一份工作你很喜欢,也是你的专业所在。但此时领导将你调到了另一个部门,这个部门的工作你很不熟悉也很不喜欢,你会怎么做?如果此时,另外一家公司又给你提供了一份工资待遇不错,你也很喜欢的工作,你会不会选择跳槽?

2、现在流行一句话说:博士不如硕士,硕士不如学士。你怎么看待的?

3、什么叫相关关系?相关关系的分类,相关分析的主要内容。

4.主成分分析和因子分析的区别和联系。

5.给出了一组数据用最小二乘法拟合直线。

小结:1、面试时长应合理分配时间。重点在第一个问题,第二个问题要回答完整,第三个问题不宜说的过多,考官们都是行家,多说不宜。

2、紧张不可避免,但只能适度紧张、否则会造成思维混乱,可在进场前与其他考生交谈,也可以掌握别人知道的各方面信息。

3、应注意答题思路的熟悉,准备一些作为下属角度的题,同时也准备好作为上级的角度的题。

4、一定要关注时事,金融专业目前出了货币政策方面的题,也是结合金融危机之后政府相关政策的提问以上希望能为学统计专业的你提供一些

统计文员工作职责:1、负责制订公司销售与订货数字化目标,分解目标,推移管理。

2、负责销售目标及库存指标完成情况的跟进与分析,提交可行性解决方案;

3、负责制订商品管理的工作规范及运作流程,组织商品MD会议,组织商品调拨相关培训;

4、负责公司运营状况分析,包括渠道、消费者、商品、竞争品牌分析等,提供高质量的分析报告,为公司市场发展及营销策略制订提供可行性建议;

5.编制生产计划并进行生产计划的监督

6.生产进度跟踪

7.生产数据统计

8.任务单下达

9.日常生产调度管理

8. 大数据分析师面试题

专业名词不会太多,主要是大数据以及PI UI等方面。

1. 产品感觉。对产品应该有感觉,网站运营最基础的就是产品运营,对产品有感觉,愿意从一个运营的角度去最大程度挖掘产品价值,进而传递给用户,这是运营人员基本的一个要求。

2. 活动热点炒作。运营日常做的很大一部分是活动运营,活动运营的好坏直接影响社区的影响力,这其中需要炒作功底,到底什么样的热点和帖子容易被炒火,用户愿意去点去看,这都需要积累。说到底,运营是个实战的活,能火一天是一天,要充分利用每个新闻热点做炒作,快速执行中达到目标。

3. 数据敏感性。产品经理和运营经理一样,都需要对数据十分敏感,怎么分析数据,如何指导产品的运营。一句话,数据能帮你决定很多事情。真正利用好数据的人,不管做产品还是做运营,都没有问题。我就会经常拿数据去考核这个人对运营的sense,适不适合,看看怎么对待数据就知道了。

其他的一些扩展素质包括:

1. 对业务前景的分析能力和了解程度;

2. 对产品整体的认识和规划

3. 职业路线。

9. 数据分析师常见面试题

面试中,为了加深对于候选人的了解,会问到很多问题,大多数都是严肃认真,比如说对于过往工作经验的问询,追问,对于各种优缺点的打探, 是否能加班的试探, 但是也有一些题目,是为缓和气氛,让大家不用从唇枪舌剑, 你来我往的交锋中解放出来。

其中“你的兴趣爱好是什么? ”就是这种类型的, 这个题目相对放松,回答也多元化,没有统一的答案,但远远不是为了找同好,所以还是需要注意,好好回答。

时尚女孩与移动

1 面试官为什么要问这道题?

面试官时间是很宝贵的,在短短一个小时之内,需要对候选人深入的了解,所以问任何问题都是有目的性的,那面试官问:“你的兴趣爱好是什么?”有什么目的呢?

1) 为了缓和气氛,让你为放松下来

面试的时候,面试官和候选人一直在交锋,如果一直气氛很严肃,怕候选人进展,进而发挥不好,于是中间会穿插一些轻松的话题。

一个人的兴趣爱好是最容易让人放松的,每个人都有自己的兴趣,自己的爱好,当一个人说自己兴趣爱好的时候,会非常的放松,可以让候选人放下警惕,放下紧张的心情,这样更能发挥真实的水平,为面试官了解候选人打下良好基础。

2) 看看你是不是一个好青年,是否有不良嗜好

兴趣爱好,可以反映一个人的个性,喜好,性格,心态,可以从侧面来了解候选人的人格完整性。有的人好静, 有的人好动, 有的人喜欢独处,有的人喜欢团队活动,这些都可以在个人的兴趣爱好中找到答案。

面试官问你有什么体育运动方面的爱好,他可不是想寻找球友,而是想从侧面了解你的工作精力和活力以及身体健康程度。

面试官问你是否喜欢看书,他可能是想从侧面看看你是否爱好学习。

同时, 面试官也想了解候选人是否有不良嗜好,如果这个不良嗜好对于岗位有影响,可能就不不能要。比如说销售岗位,有些时候需要喝酒,如果能喝可以,但是需要每天喝酒, 就不太行。

3) 希望通过业余爱好,来推测你是否更加符合岗位?

有些企业的岗位,对于员工要求更高,面试官希望对你有更多一点的了解,通过了解你的兴趣爱好来推测:你是否是一个好学的人?对哪方面比较喜爱?对什么比较在意?

通过兴趣爱好看出后候选人是否符合要求, 有些岗位需要员工适应能力强,这就需要员工学习能力强,如果候选人热爱学习,那就是加分项。

如果个人爱好和职业技能挂钩, 那就更好了,比如说应聘互联网运营,如果热爱写作,这是一个非常好的加分项。

如果岗位要求的生活状态,正好与个人爱好相符合,也是加分,比如作为一个销售,要外向,而你的爱好是演讲,这也是一个很好的加分项。

2 回答这个题的误区

1) 说自己没有兴趣爱好

有的人说自己没有兴趣爱好,面试官一听就觉得矫情,生活中应该是很无趣的,对于工作的热情就要打问号,或者你要隐藏什么, 是不是有不良嗜好,不能让人知道。

有的人说自己只爱好工作,面试官马上觉得你可以表现自己喜欢工作,很假。

2) 说谎

有的人为了得到工作,刻意说一个跟岗位相关的爱好,塑造自己勤奋爱学的形象,一旦被识破,这样得不偿失的。

当初我面试一个互联网运营,说到兴趣爱好,他就说喜欢看书。

我接着问:“喜欢看什么书啊?”

候选人回答:“XXXX”

这本书我刚好看过,于是我就问:“太好了,我一直想看,你来说说这本书主要讲了什么? 有什么值得推荐的?”

这个是时候,这个候选人支支吾吾,开始瞎编, 估计是只看了书名和目录吧。

这样的候选人,搬起石头砸自己的脚,最后肯定是不要。

3) 说一大堆,没有重点

有的人,爱好广泛,什么运动啊,看书,打游戏,看电影,上来就说一堆,爱好广泛说明你是一个热爱生活的人,但你是来面试的,不是来展示你生活丰富多彩的。一口气向面试官介绍了N个自己的爱好,面试官没法判断你和应聘职位以及公司文化的匹配度。

还有就是如果与面试官的爱好相同,也不要展开太多,把自己聊high了,而忘记了面试。

不要抬高自己的爱好,贬低其他的爱好, 爱好无好坏之分,如果你贬低的爱好刚好是面试官的爱好,则会引起对方的不适。

4) 爱好太危险或者太悠闲

有的人爱好太危险,比如说极限运动,这样的爱好对于公司来说就是一个隐患,所以不好。

曾经面试过一个小伙,上来说自己喜欢骑自行车,很健康,很好的爱好,然后告诉我们自己骑自行车游历了大半个中国了,还准备去西藏,我说:“那为什么来公司应聘啊?”他说:“资金不够,准备赚钱以后再去。 ” 看来是不太稳定,半年以后指定走,那肯定不要了。

还有就是太悠闲, 说自己喜欢打游戏或者打麻将,让人感觉无所事事, 这样面试官会觉得你毫无斗志,不能很好的工作。

3 那应该怎么回答呢?

1) 对公司,职位做一定的了解

对于面试答题,有一些信息非常重要,对于兴趣爱好这个题,公司的企业文化,岗位的本身的素质要求都是非常重要的信息。

公司的企业文化,可以在公司的网站,社交媒体可以搜索到。

而岗位的素质要求则在招聘要求里面有体现, 这里需要多家查看。

2) 两到三个最为稳妥,如果有,展示成果

回答问题言简意赅,不要过度啰嗦,爱好不要多,两道三个最为稳妥,要给予对方正面的联想。

如果有多个爱好,要有取舍,如何取舍,说与职位相关的爱好。比如说应聘数据分析师,可以打说打桥牌,打牌有分析推理能力,面试官会认为业余爱好上乐于钻研的求职者对于本职工作也一定有助益。

回答细致,不要太宽泛,比如说运动可以是篮球,排球具体的,而不是宽泛的说运动。

如果面试官没有追问,不要过多渲染,客观描述即可,不要随意展开。

3) 与公司,职位相关更好

与岗位相关的爱好是加分的,可以结合面试的职位, 如果面试互联网运营,你可以说喜欢新媒体,对于各种新媒体微博,微信,头条,知乎都很喜欢,对于他们的运营有自己想法。

当年我去一家外企面试,遇到了这个问题,我的答案是这么说的:

我的业余爱好是打羽毛球和读书,主要是管理类和IT技术类的书, 最近看的是《Thinking in Java》,挺有收获的。

这是,面试官跟我一听,跟我一起展开聊了这本书,而且聊的不错,后来在公司碰到面试官,他告诉我,好多人跟他说看过这本书,但是好多人都是奔着书名去的,我算是跟他聊的很好的,也是录取我的一个很大的原因。

而且面试官还跟我一起聊了下羽毛球,告诉我每周五下午会去打球,到时可以一起去, 后来我们果然就一起去打球了。

4 写在最后

不要说自己的爱好就是在家听音乐上上网打游戏看小说,这种回答太普通,太单调,是雷同的感觉,而且感觉是标准的宅男,给面试官不合群的感觉。

爱因斯坦说过,兴趣是最好的老师, 面试官问你的兴趣爱好,就是想看看你对于岗位有没有很大的兴趣,看看你是否会花很多时间到里面, 还有就是是否热爱生活。所以我们应该这么回答

1) 了解公司的文化,岗位的要求

2) 找到岗位相关的爱好

3) 最好有一个是展示自己生活乐趣,可以是运动类,绘画类,益智类等等。

10. 数据分析师15道面试题

一、异常值是指什么?请列举1种识别连续型变量异常值的方法?

异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。

Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximum normed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。

未知总体标准差σ,在五种检验法中,优劣次序为:t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。

点评:考察的内容是统计学基础功底。

二、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。

聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的。

聚类分析计算方法主要有: 层次的方法(hierarchical method)、划分方法(partitioning method)、基于密度的方法(density-based method)、基于网格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前两种算法是利用统计学定义的距离进行度量。

k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。

其流程如下:

(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;

(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;

(3)重新计算每个(有变化)聚类的均值(中心对象);

(4)循环(2)、(3)直到每个聚类不再发生变化为止(标准测量函数收敛)。

优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K<<N,t<<N 。

缺点:1. K 是事先给定的,但非常难以选定;2. 初始聚类中心的选择对聚类结果有较大的影响。

点评:考察的内容是常用数据分析方法,做数据分析一定要理解数据分析算法、应用场景、使用过程、以及优缺点。

三、根据要求写出SQL

表A结构如下:

Member_ID(用户的ID,字符型)

Log_time(用户访问页面时间,日期型(只有一天的数据))

URL(访问的页面地址,字符型)

要求:提取出每个用户访问的第一个URL(按时间最早),形成一个新表(新表名为B,表结构和表A一致)

createtable B asselectMember_ID, min(Log_time), URL from Agroup byMember_ID ;

点评:SQL语句,简单的数据获取能力,包括表查询、关联、汇总、函数等。

另外,这个答案其实是不对的,实现有很多方法,任由大家去发挥吧。

四、销售数据分析

以下是一家B2C电子商务网站的一周销售数据,该网站主要用户群是办公室女性,销售额主要集中在5种产品上,如果你是这家公司的分析师,

a) 从数据中,你看到了什么问题?你觉得背后的原因是什么?

b) 如果你的老板要求你提出一个运营改进计划,你会怎么做?

表如下:一组每天某网站的销售数据

a) 从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因,可以从两个角度来看:站在消费者的角度,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。

b) 针对该问题背后的两方面原因,我的运营改进计划也分两方面:一是,针对消费者周末没有购买欲望的心理,进行引导提醒消费者周末就应该准备好该产品;二是,通过该产品的一些类似于打折促销等活动来提升该产品在周末的人气和购买力。

点评:数据解读能力,获取数据是基本功,仅仅有数据获取能力是不够的,其次是对数据的解读能力。

五、用户调研

某公司针对A、B、C三类客户,提出了一种统一的改进计划,用于提升客户的周消费次数,需要你来制定一个事前试验方案,来支持决策,请你思考下列问题:

a) 试验需要为决策提供什么样的信息?

c) 按照上述目的,请写出你的数据抽样方法、需要采集的数据指标项,以及你选择的统计方法。

a) 试验要能证明该改进计划能显著提升A、B、C三类客户的周消费次数。

b) 根据三类客户的数量,采用分层比例抽样;

需要采集的数据指标项有:客户类别,改进计划前周消费次数,改进计划后周消费次数;

选用统计方法为:分别针对A、B、C三类客户,进行改进前和后的周消费次数的,两独立样本T-检验(two-sample t-test)。

点评:业务理解能力和数据分析思路,这是数据分析的核心竞争力。

以上就是关于阿里数据分析师的岗位面试题及要求的相关介绍,更多阿里数据分析师的岗位面试题及要求相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对阿里数据分析师的岗位面试题及要求有更深的了解和认识。

11. 数据分析员面试题

要有良好的口语表达能力,能够精准分析财务的相关预算数据和财务决算的数据分析。

要想在财务面试中表现好,平时就得做好两个方面,一方面要把财务的专业知识学精通,第二要训练良好的口语表达能力和数据分析能力。