数据挖掘中的经典案例(数据挖掘的经典案例啤酒与尿布实验最主要是应用了)

虚拟屋 2022-12-22 23:11 编辑:admin 252阅读

1. 数据挖掘的经典案例啤酒与尿布实验最主要是应用了

是数据挖掘方面的一个经典案例。在美国沃尔玛超市,研究人员发现,买尿布的人也会一起买啤酒,后来研究人员分析,是因为一般母亲在家带孩子,就让父亲去超市买尿布,而父亲也就会顺手买啤酒回去喝,因此超市就把啤酒和尿布放一起,以便购买。

2. 啤酒与尿布的案例运用了大数据的哪种思维方式?

数据挖掘是从海量信息中进行搜索提取有价值信息的过程,是一个由处理数据、得到信息、挖掘知识等环节组成的工作过程,在这个过程中可能用到机器学习等各种算法,最终的目的是进行智能决策,而这个智能也可以理解为人工智能。比如说通过挖掘历史的销售数据找到商品之间的关联规则,大家熟知的啤酒尿布的故事就是一个典型案例。

模式识别

要想知道什么叫做模式识别,那就要先了解什么叫做模式,通常意义上,模式指用来说明事物结构的一种表达。它是从生产生活经验中经过抽象提炼出来的知识,说直白点就是可以用来表示事物的一些列特征的集合。

模式识别从十九世纪五十年代兴起,在二十世纪七八十年代风靡一时,是信息科学和人工智能的重要组成部分,主要被应用于图像分析与处理、语音识别、计算机辅助诊断、数据挖掘等方面。但是其效果似乎总是差强人意,因为模式识别中的事物特征是由人类设计总结的、主要基于人类在某一方面的领域知识,也就是说模式识别的效果不可能超过人类、有很大的局限性。

3. 数据挖掘 啤酒与尿布

在外国,往往是男人去为婴儿买尿布。所以沃尔玛商场就把啤酒和尿布放在同一个货架。这样男人们去购买尿布时,看到自己喜欢的啤酒,便会顺便捎上几瓶。这样大大增加了超市啤酒的销量,还会引来更多家中有小孩的男性回头客。

4. 啤酒与尿布事件体现的是数据挖掘的功能是

第一层:知其然

就是知道数据是多少,发生了什么情况。就如目前大多数企业都会有自己的数据库,严格一点会有对应的系统对应的业务数据库,数据收集的工作已经完备了,无论是通过报表还是数据分析的手段,都可以掌握发生了什么,程度如何,建立数据监控体系,做到“知其然”。也有一些企业,在管理内部数据的同时,也在考虑外部数据的引进,向第三方机构买数据,观察行业整体趋势、政策环境的影响,其次了解竞争对手的表现。这样的数据工作是长期的也可是周期性的管理。长期的可尽力数据展现模板,形成一定的管理规范,固化下来。短期性的比如监测某次营销活动的情况,可联合IT部门或者数据分析师自己动手,做到严格的“自省”。

1、数据是散的,看数据需要有框架。

数据展现很有讲究,把数据放到业务框架,能体现业务分析,才能发挥整体价值。所谓有效的框架至少包含两重作用:

(1)不同层级的人对数据的需求不同。比如市场销售数据,业务层需要指导自己每日指标的完成情况和等级排名,需要提交每日每周每月的数据。领导层需要知道固定周期的业绩完成率,各地区销售额,营销成本和组内业绩排名。管理层,CEO级别的可能需要知道每个业务部门的一些关键指标,比如总营收,市场增长率,重要的研发进度等等。有效的框架能够让不同的人各取所需。

(2)好的框架能定位问题,指导决策制定。例如电商销售额下降了30%,业务很可能出现了重大问题。我们需要分析问题原因,但如果只从客单价、交易单数、转化率难以说明问题,好的业务分析框架能够支持我们往下钻,从品类、流量渠道等找到问题所在,找到对应负责人。这也是我们通常所说的,看数据要落地。

2、数据,有对比才能考量。

日销售额100万,你说多还是少呢?一个孤零零的数据是很难说明问题的。数据判断要么有一个参考的指标,要么有能准确判断趋势的指标数据,如增长率上升率。这样一个基准可以是历史总结的同期数据,也可以是行业的平均水平,也可以是预先设定的而目标,一切脱离目标的数据分析都是“耍流氓”。

第二层:知其所以然

遇到问题寻找原因这是很顺当的衔接。但走到这一步还不够,解决问题才是真理。数据结合业务,找到数据表象背后的真正原因,解决之。解决问题的过程就会涉及数据整理、加工,还会涉及数据分析模型的建立和工具,这在以往的篇幅已经介绍的够多的了。

在第二层里也有两点分享:

1、 数据是客观的,但对数据的解读可能带有主观意识。

数据本身是客观的,但解读数据的人都是有主观能动性的。这样的问题往往是因为多数人通多数据先对问题定性,而不是通过问题解决问题,这样的事儿总有发生。

2、懂业务才能真正懂数据。

笔者认为,数据分析业务占6分,方法占4分。不懂业务无法理解数据的真正含义也是有理可寻的,这里特地拿出来强调一下。

第三层:辅助业务,发现机会

利用数据可以帮助业务发现机会。举个电商的例子,通过用户搜索的关键词与实际成交的数据比较,发现有很多需求并没有被很好地满足,反映出需求旺盛,但供给不足。假如发现了这样的细分市场,公布出来给行业小二,公布出来给卖家,是不是可以帮助大家更好地去服务消费者呢?这个例子就是现在我们在做的“潜力细分市场发现”项目。

讲这个案例不是想吹牛数据有多厉害,而是想告诉大家:数据就在那里,有些人熟视无睹,但有些人却可以从中挖出“宝贝”来。差异就在于商业感觉,对数据的直觉。搜索数据和成交数据很多人都能够看到,但并没有人把这两份数据联系在一起,这背后体现出的就是商业的感觉。

第四层:建立数据化运营体系

我理解的数据化运营,包含了两重意思:数据作为直接生产力和间接生产力。

1、数据作为直接生产力。

数据作为直接生产力是指数据能将价值直接投入到前线,作用于消费者,时髦点讲就是“数据变现”,这也是大家最为关注的。以前有沃尔玛将啤酒和尿布两个产品关联摆放,引出了商品关联度的概念。如今,又有餐饮企业利用数据统计分析,选型餐厅面积,优化前后厅布置,使得单位面积营收最大。

2、数据作为间接生产力。

所谓间接生产力,是指数据价值不直接传递给消费者或企业,而是需要通过一系列的分析,制定策略传递给消费者,即通常所说的决策支持。数据工作者通常做的是产出报表、分析报告等供各级业务决策者参考。我们可以称之为决策支持1.0模式。然而随着业务开拓和业务人员对数据重要性理解的增强,对数据的需求会如雨后春笋般冒出来,显然单单依赖人数不多的分析师是满足不了的。授人以鱼不如授人以渔,让业务人员能够独立地进行数据分析,而不依赖于技术人员是我认为的决策支持2.0模式。

实现决策支持2.0模式有两个关键:工具和能力。

5. 啤酒与尿布案例分析答案

认真负责回答每一个问题:

阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据科技

大数据主要由以下三点作用:

第一,对大数据的处理分析正成为新一代信息技术融合应用的结点。

移动互联网、物联网、社交网络、数字家庭、电子商务等是新一代信息技术的应用形态,这些应用不断产生大数据。

云计算为这些海量、多样化的大数据提供存储和运算平台。

通过对不同来源数据的管理、处理、分析与优化,将结果反馈到上述应用中,将创造出巨大的经济和社会价值。

第二,大数据是信息产业持续高速增长的新引擎。

面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。

在硬件与集成设备领域,大数据将对芯片、存储产业产生重要影响,还将催生一体化数据存储处理服务器、内存计算等市场。

在软件与服务领域,大数据将引发数据快速处理分析、数据挖掘技术和软件产品的发展。

第三,大数据利用将成为提高核心竞争力的关键因素。

各行各业的决策正在从“业务驱动” 转变“数据驱动”。

"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "

大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;

其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。

接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。

最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。

大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。

下面具体说一说。

大数据宣传营销是基于多平台的大量数据,依托大数据技术的基础上,应用于互联网广告行业的营销方式,

心在于让网络广告在合适的时间,通过合适的载体,以合适的方式,投给合适的人。

大数据营销衍生于互联行业,又作用于互联网行业。

依托多平台的大数据采集,以及大数据技术的分析与预测能力,

能够使广告更加精准有效,给品牌企业带来更高的投资回报率。

第一,用户行为与特征分析。只有积累足够的用户数据,才能分析出用户的喜好与购买习惯,

甚至做到“比用户更了解用户自己”。这一点,才是许多大数据营销的前提与出发点。

第二,精准营销信息推送支撑。精准营销总在被提及,但是真正做到的少之又少,反而是垃圾信息泛滥。

究其原因,主要就是过去名义上的精准营销并不怎么精准,因为其缺少用户特征数据支撑及详细准确的分析。

第三,引导产品及营销活动投用户所好。如果能在产品生产之前了解潜在用户的主要特征,

以及他们对产品的期待,那么你的产品生产即可投其所好。

第四,竞争对手监测与品牌传播。竞争对手在干什么是许多企业想了解的,即使对方不会告诉你,但你却可以通过大数据监测分析得知。

品牌传播的有效性亦可通过大数据分析找准方向。例如,可以进行传播趋势分析、内容特征分析、互动用户分析、正负情绪分类、口碑品类分析、产品属性分布等,可以通过监测掌握竞争对手传播态势,并可以参考行业标杆用户策划,根据用户声音策划内容,甚至可以评估微博矩阵运营效果。

第五,品牌危机监测及管理支持。新媒体时代,品牌危机使许多企业谈虎色变,然而大数据可以让企业提前有所洞悉。

在危机爆发过程中,最需要的是跟踪危机传播趋势,识别重要参与人员,方便快速应对。大数据可以采集负面定义内容,及时启动危机跟踪和报警,

按照人群社会属性分析,聚类事件过程中的观点,识别关键人物及传播路径,进而可以保护企业、产品的声誉,抓住源头和关键节点,快速有效地处理危机。

第六,企业重点客户筛选。许多企业家纠结的事是:在企业的用户、好友与粉丝中,哪些是最有价值的用户?

有了大数据,或许这一切都可以更加有事实支撑。从用户访问的各种网站可判断其最近关心的东西是否与你的企业相关;从用户在社会化媒体上所发布的各类内容及与他人互动的内容中,可以找出千丝万缕的信息,

利用某种规则关联及综合起来,就可以帮助企业筛选重点的目标用户。

第七,大数据用于改善用户体验。要改善用户体验,关键在于真正了解用户及他们所使用的你的产品的状况,做最适时的提醒。

例如,在大数据时代或许你正驾驶的汽车可提前救你一命。只要通过遍布全车的传感器收集车辆运行信息,在你的汽车关键部件发生问题之前,就会提前向你或4S店预警,这决不仅仅是节省金钱,而且对保护生命大有裨益。

事实上,美国的UPS快递公司早在2000年就利用这种基于大数据的预测性分析系统来检测全美60000辆车辆的实时车况,以便及时地进行防御性修理。

第八,SCRM中的客户分级管理支持。面对日新月异的新媒体,许多企业通过对粉丝的公开内容和互动记录分析,将粉丝转化为潜在用户,激活社会化资产价值,并对潜在用户进行多个维度的画像。

大数据可以分析活跃粉丝的互动内容,设定消费者画像各种规则,关联潜在用户与会员数据,关联潜在用户与客服数据,筛选目标群体做精准营销,进而可以使传统客户关系管理结合社会化数据,

丰富用户不同维度的标签,并可动态更新消费者生命周期数据,保持信息新鲜有效。

第九,发现新市场与新趋势。基于大数据的分析与预测,对于企业家提供洞察新市场与把握经济走向都是极大的支持。

第十,市场预测与决策分析支持。对于数据对市场预测及决策分析的支持,过去早就在数据分析与数据挖掘盛行的年代被提出过。

沃尔玛著名的“啤酒与尿布”案例即是那时的杰作。只是由于大数据时代上述Volume(规模大)及Variety(类型多)对数据分析与数据挖掘提出了新要求。更全面、速度更及时的大数据,必然对市场预测及决策分析进一步上台阶提供更好的支撑。似是而非或错误的、过时的数据对决策者是灾难。

如果您有更精彩的见解,欢迎在下方留下您的见解,我会及时和您互动讨论。

听说颜值高的读者都点赞加关注了哦