数据挖掘怎么入门(如何挖掘数据)

虚拟屋 2022-12-23 17:47 编辑:admin 61阅读

1. 如何挖掘数据

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘对象

1.数据的类型可以是结构化的、半结构化的,甚至是异构型的。发现知识的方法可以是数学的、非数学的,也可以是归纳的。最终被发现了的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等。

2.数据挖掘的对象可以是任何类型的数据源。可以是关系数据库,此类包含结构化数据的数据源;也可以是数据仓库、文本、多媒体数据、空间数据、时序数据、Web数据,此类包含半结构化数据甚至异构性数据的数据源。

3.发现知识的方法可以是数字的、非数字的,也可以是归纳的。最终被发现的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等。

数据挖掘步骤

在实施数据挖掘之前,先制定采取什么样的步骤,每一步都做什么,达到什么样的目标是必要的,有了好的计划才能保证数据挖掘有条不紊地实施并取得成功。很多软件供应商和数据挖掘顾问公司投提供了一些数据挖掘过程模型,来指导他们的用户一步步地进行数据挖掘工作。比如,SPSS公司的5A和SAS公司的SEMMA。

数据挖掘过程模型步骤主要包括定义问题、建立数据挖掘库、分析数据、准备数据、建立模型、评价模型和实施。下面让我们来具体看一下每个步骤的具体内容:

(1)定义问题。在开始知识发现之前最先的也是最重要的要求就是了解数据和业务问题。必须要对目标有一个清晰明确的定义,即决定到底想干什么。比如,想提高电子信箱的利用率时,想做的可能是“提高用户使用率”,也可能是“提高一次用户使用的价值”,要解决这两个问题而建立的模型几乎是完全不同的,必须做出决定。

(2)建立数据挖掘库。建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。

(3)分析数据。分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和累人的事情,这时需要选择一个具有好的界面和功能强大的工具软件来协助你完成这些事情。

(4)准备数据。这是建立模型之前的最后一步数据准备工作。可以把此步骤分为四个部分:选择变量,选择记录,创建新变量,转换变量。

(5)建立模型。建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型对面对的商业问题最有用。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分,一个用于模型训练,另一个用于模型测试。

(6)评价模型。模型建立好之后,必须评价得到的结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关费用的多少。经验证明,有效的模型并不一定是正确的模型。造成这一点的直接原因就是模型建立中隐含的各种假定,因此,直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意之后再向大范围推广。

(7)实施。模型建立并经验证之后,可以有两种主要的使用方法。第一种是提供给分析人员做参考;另一种是把此模型应用到不同的数据集上。

2. 如何挖掘数据背后的复杂关联关系

关联规则分析包括频繁模式挖掘、序列模式挖掘,用于发现能够描述数据项之间关系的规则。

关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组(Frequent Itemsets),第二阶段再由这些高频项目组中产生关联规则。

3. 如何挖掘数据的关联价值

价值链分析的基本构成,是由物质的属性,以及物质的相互关联,以及物质的价值体现,构成。

价值链分析的基本构成?

价值链分析的基本构成,是由物质的属性,以及物质的相互关联,以及物质的价值体现,构成。

价值链的组成部分?

价值链的增值活动可以分为基本增值活动和辅助性增值活动两大部分。 企业的基本增值活动,即一般意义上的“生产经营环节”,如材料供应、成品开发、生产运行、成品储运、市...

什么是价值链分析及其基本构成?

价值链分析是指产生价值的每一个环节的分析,它的基本构成是由相互关联相互影响价值产生的元素。

4. 如何挖掘数据的关联关系

数据挖掘的方法:

1.分类 (Classification)

2.估计(Estimation)

3.预测(Prediction)

4.相关性分组或关联规则(Affinity grouping or association rules)

6.复杂数据类型挖掘(Text,Web ,图形图像,视频,音频等)数据挖掘数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

5. 如何挖掘数据的价值

数据是对物理世界的记录,是对物理世界的事物在数字世界的映射。通过各种设备及系统形成的数据,像是物理世界的土地,它蕴藏着数字世界的“石油”、“铜矿”、“黄金”等各类数字世界所需的生产资源。

当前互联网经济中所依赖的用户的个人特征及行为方面的数据,已经被率先开采出来。同时在互联网行业的各类经济主体中被广泛通过大数据算法研究利用。这类数据是互联网经济的生产要素,是互联网企业提供虚拟产品或服务所必须的生产资源。

虽然个人特征行为数据已经被挖掘利用,但是还有绝大部分的数据虽然产生了,但是都还没有被高效利用。他们仍然沉默在数据的黑土地里(存储),等待人们的发掘开采。

数据被人类使用的路径大致是:原始数据转换为有用的信息,有用的信息总结沉淀为知识,最后将知识做抽象提炼形成智慧。

人类消费数据首先需要有载体。在从原始数据到信息、到知识、到智慧的过程中,人类基本不会直接消费原始数据。人类直接消费的更多的是通过数据和算法提炼加工后生产的各类虚拟服务。如淘宝的商品撮合交易服务、美团的生活匹配服务、微信的沟通交流服务、腾讯游戏的游戏服务等。

6. 如何挖掘数据下透漏的问题

获取股市信息的渠道很多,比如看一些行业研究报告、财经专家的股评;经常浏览一些咨询网站,比如巨潮资讯网,查看上市公司最新发布的公告,了解公司的业绩预告、限售解禁、重组进展等信息。

那么除了以上哪些获取股票信息的渠道外,还有没有其他的渠道供我们获取和股市相关的信息呢?,答案是当然有,一个非常重要的渠道,那就是通过电视新闻媒体,挖掘出和股市相关的,有紧密联系的信息。

我们这里讨论的新闻渠道,特指通过电视的新闻节目,解读来获知资本市场的动向。其他的新闻载体暂不讨论。

就我个人而言,获取和资本市场相关的信息,一般通过两个电视节目,一个是19点钟的“新闻联播”,一个是中央二台的财经频道。有时也看一些地方台的财经节目,比如北京卫视的《天下财经》。

实例说明

我们就以今天的新闻为例来说明,如何通过一些财经新闻来洞悉对股票市场的影响?

2019年10月15日中央二台财经频道晚上8点30分的”经济信息联播“节目中,我们获知中美贸易战经过13轮高级别磋商,终于达成了实质性的第一阶段协议,朝着最终达成协议的方向努力,并且双方在达成经贸协议上的态度是一致的。这条信息无疑利好股市,利好一些在经贸战中战中受到影响和限制的上市公司。对于投资者来说,长达两年的经贸磋商终于看到了曙光,压抑着情绪随着会释放,反映在股市上,就是投资者有了交易的信心,会重新积极的参与到股市当中,从而推动股市的上涨。

2019年10月15日,中国海洋经济博览会在深圳开幕。通过这个信息,我们了解到了海洋经济发展的成就,在一些海洋装备和关键技术方面:比如无人机、无人船等新的技术、5G技术在海洋信息产业的运用都取得了很大的进展。通过这个信息,我们获取到了一些自主研发的高端装备、国产替代海洋企业的发展前景和发展潜力,以及5G技术在海洋信息产业中的深入运用。这些消息对海洋生物医药、海水应用等行业个股来税会引来关注。

我们还了解到,对于海洋经济未来发展还有一个潜力很大的产业,那就是海洋金融,也是我们需要持续关注的发展方向。

就在前几天,即2019年10月11日,证监会新闻发言人表示:自2020年4月1日起,在全国范围内取消基金管理公司外资股比限制;自2020年12月1日起,在全国范围内取消证券公司外资股比限制。此信息一出,资本市场立刻引起了热议,这些消息意味着资本市场的改革开放又向前迈了一大步。对于股票市场来说,资本市场的进一步对外开放,就会加速外资流入A股,从而提高股市核心资产估值。对于股市长远健康发展是有利的,也可以短期刺激A股市场。

总结

新闻每天都发生,每个人的感受都不尽相同。其实每天的新闻联播里面都会透露出一些和资本市场有关的消息,这需要我们做到以下几点:

第一、要持续不断的关注新闻;

第二、要非常敏感、准确的捕获到这些信息

第三:要要能力解读出这些对股市的影响。

了解股市,从关注新闻开始!

7. 如何挖掘数据资产的价值

我们通常把财务分析分为两类:

第一类:狭义的财务分析 - 以财务报表为基础。

第二类:广义的财务分析 - 结合企业实际经营情况。

第一类,简单介绍一下分析的内容:财务管理建设模型。

第二类:框架、思维与要点:集团型企业的 BI 经营分析如何做?

财务管理建设模型

建立财务驾驶舱,指标:资产、负债、利润、现金流、存货等,以下 by 派可数据财务分析案例( 数据均已脱敏 )。

利润分析。分析企业利润总额、累计利润总额、净利润、累计净利润、营业利润率、净利润率及同环比情况。

营业利润趋势分析、年利润对比分析、月利润对比分析情况。

收入分析。营业总收入、累计营业总收入、主营业务收入、累计主营业务收入、其他业务收入、累计其他业务收入及同环比情况。

年收入分析趋势,联动月收入情况趋势分析。

主要收入类型占比情况 —— 主营业务收入、营业外收入、其他业务收入及趋势分析情况。

成本费用分析。营业成本、主营业务成本、期间费用、财务费用、管理费用、销售费用及同环比情况。

不同年份费用率对比情况 —— 期间费用率、成本费用利润率、财务费用率、管理费用率、销售费用率年及月度趋势情况。

年期间费用对比分析,联动到期间费用占比分析。

年成本对比分析,联动到月成本对比分析。

资产负债分析,资产合计、负债合计、所有者权益合计等。

资产负债率月度趋势分析。

资产负债总体情况分析,通过下钻可以看到不同月份不同资产、负债和所有者权益情况。

各项目分析钻取分析,例如通过下钻流动资产可以看到货币资金、应收账款、其他应收款、交易性金融资产、应收股利等情况。

应收账款、应付账款月度趋势分析,及同环比情况。

资产负债总体分析,可以通过下钻钻取到不同的项目。

资产总体情况、资产变化趋势等。

资产项目分析,流动资产、非流动资产分析。

不同的资产项目占比分析,例如流动资产中应收账款、应收票据、预付款项、存货、交易性金融资产等分析。

负债与所有者权益情况分析。

财务能力指标分析 – 净资产收益率、存货周转率、流动比率、总资产报酬率、应收账款周转率、速动比率分析等。

盈利能力指标分析 —— 净资产收益率、营业利润率、营业毛利率、成本费用利润率、净利润率、总资产净利率、营业净利率、主营业务毛利率、主营业务利润率、总资产报酬率、资本收益率、股本报酬率分析等。

营运能力指标分析 —— 固定资产周转率、应收账款周转率、股东权益周转率、存货周转率、总资产利润率、流动资产周转率、应收账款周转天数、存货周转天数等趋势分析。

偿债能力分析 —— 流动比率、速动比率、现金比率、资产负债率、营运比率、长期负债比率等。

发展能力分析 —— 总资产增长率、固定资产增长率、资本保值增值率分析等。

其他能力分析 —— 销售费用率、管理费用率、财务费用率、期间费用率、固定资产比率、应付账款周转率、主营业务成本率、销售利润率等趋势分析。

税负分析 —— 税金合计、应交增值税、应交所得税、应交城市维护建设税、应交教育附加、印花税等同环比分析、年度、月度趋势及占比情况。

框架、思维与要点:集团型企业的 BI 经营分析如何做?

在目前国内大部分的商业智能 BI 项目中,项目的发起与启动都是从单一的业务领域或者部门发起的,比如财务、销售、运营等部门,基本上都是由小往大、由点及面,很少一上来直接就从集团层面从顶层全面铺开整体规划。一方面有资金、人力投入成本因素的考虑,另外一方面在于项目的磨合、经验的积累。就如同打仗一样,先从小规模的作战、局部战争开始积累与培养人才与技术经验,再到最后大手笔来组织兵团级别的战役。

但也有越来越多的自身 IT 基础信息化能力沉淀比较好的集团性企业,为了更加长远的规划与考虑,需要从一开始就要有一个相对明确的建设方向和思路,因此整体性和框架性思维就很重要。

派可数据集团经营分析案例

基于我们多年在集团型企业项目建设上的经验,给大家简单总结一下。

说明:本文案例所演示的数据均已做脱敏处理,包括部分维度数据。为了突出一些比较,有些数据在实际业务中可能并不合理,请读者忽略,重点在于理解一些分析思路与框架。

一. 集团型企业成长轨迹与挑战

在讲集团化企业 BI 经营分析建设之前,先了解一下集团型企业的成长轨迹。集团型企业在早期都是通过单一业务开始的,逐步随着我国改革开放的进程以及经济宏观政策的调整,出现了很多新的经济热点。

这些企业在参与社会经济建设的过程中也成功的抓住了这些经济热点并得以壮大发展,通过兼并重组、新设、合资等逐步进入了新的事业领域,最后对外就呈现出来了一种多组织、多业务、多业态的企业集团。

当然,集团化的企业在发展过程中也会面临各种各样的挑战,例如战略协同、集团化管控、财务与风险管控、人才管理与激励等等,这就要求集团化企业需要通过 IT 技术信息化的手段来梳理企业的各类业务协同与管理流程,提升透明度和加快工作效率。

同时,集团化企业在面对这些挑战的时候就不得不对其增长模式、盈利模式、耦合模式做出更加深入的思考,而这些模式的背后一切都离不开数据的支撑,对数据分析结果的论证、判断与决策。

二. 集团型企业经营分析框架

对于集团型企业的经营分析还是一个比较复杂的、系统性的工程,对参与到经营分析的团队和个人需要具备整体性的框架分析思维,也需要具备局部细节的探究能力,更需要具备例如财务、业务、组织管理、行业知识等相关学习和总结能力,同时还要求对数据有比较高的敏感性和很强的数据逻辑能力、洞察力。

对于不同规模、不同行业、不同形态、不同管理方式的集团型企业分析的深度和广度无法完全囊括,但对于很多分析思路而言还是有很多共通性的。比如财务报表分析,基本对每一家企业而言都是相对标准和统一的,可以从比较宏观的角度了解一家企业的财务与经营业绩。

但单纯的财务报表分析是无法全面衡量企业具体职能领域和具体业务活动的业绩表现,所以更多的时候是需要结合财务与实际的业务一起形成联动,对企业的经营做全盘的了解。

专业的财务分析不在本篇文章展开,对于专业的财务分析可以看一些上市公司的年报,这里只从集团型企业经营分析的视角结合一定的财务视角来展开。

集团收入、利润、资金与预算情况

从集团层面首先重点应关注的就是集团收入、利润、资金以及预算执行情况。从营业收入了解到集团目前的收入规模,离预算指标差额、完成率情况;从利润了解到集团目前的利润、预算指标及完成率执行情况;包括目前的资金(主要是流动资金)情况和营业收入、利润近今年的同比情况。

集团经营分析总体指标

如果单纯的从集团层面看以上这些指标分析不出来什么问题,所以就要从构成集团的重要结构,即业务板块来分析。

集团板块收入与预算执行情况

从上面的三张图中基本上对集团的重点业务一目了然,可以清晰的看出在这家集团型企业中房地产的收入以 130亿的收入规模贡献达到了 80%,其次新能源的达到了 17%,家具制造业 1.4%,其它的基本上就可以忽略不计,都在1%以下。所以对于这家集团,房地产板块的业务就是它的主营业务,新能源次之。

实际上,每一家集团对自己的重点的主营业务太熟悉太了解了,基本上不用分析就能知道,在这里重点实际上要关注的有几个方面的点:

第一,集团有无需要战略转型的业务要开拓与发展,当前这个业务发展的如何。尽管这个新开展的业务可能暂时收入规模还不大,但总体趋势可能是比较不错的,所以重点分析的实际上反而是新领域、新业务的拓展情况。

第二,在战略转型的过程中,目标是既要保持集团总体收入规模的增长,同时也要下降主营业务的比重。这一点意思就很明确,主营业务也要增长,其它重点新开拓的业务也要增长,但是其它重点业务增长的速度要远远高于主营业务。

集团板块利润与预算执行情况

单纯的看集团的利润分析感觉不到太大的问题,但是结合收入来看,对比就会很强烈。房地产行业的收入贡献在集团达到了 80%,但是利润贡献却只有 30%左右,0.32 亿元。反而,新能源的收入贡献只有 17%,但对集团的利润贡献却达到了41%,0.43亿元。同时,有一个在收入规模上完全被忽略掉的家具制造业以 2.36亿,1.4%的收入占比贡献了 28% 的利润贡献。

因为数据做了一些处理,我们暂且忽略行业和数据真实性,来思考以下几个问题:

1. 在一家集团型企业中是否存在收入规模大,但是盈利不足的业务板块比如 A 板块。但同时也存在着收入贡献占比不多,但是盈利能力却很强的业务板块,例如 B 板块 ?

2. A 板块是朝阳产业、还是夕阳产业,在未来的 5-10 年中是否能够维持这种规模收入增长,在以往的几年时间收入增长率怎么样 ?

3. B 板块是朝阳产业、还是夕阳产业,在未来的 5-10 年中是否有足够的市场增长空间和天花板,目前的增长速度能够保持多长时间 ?

这种思考都是战略层面的深度思考,进攻的产业有哪些? 防守的产业有哪些?防守到什么时候就可以抛弃? 进攻到什么阶段会遇到阻力,这种阻力能够承受到什么时候?

最后又看了下资金情况,可以按照主产业与次要产业看看货币资金、应收票据、应收账款、存货的情况。有多少现金在手上,有多少是别人欠我的,主要是哪些板块欠的比较多,还有多少压在手上、仓库里没有卖出去。

以上的几个点基本上要重点体现出来的就是:收入决定发展规模,利润决定发展质量。还有,整个过程完成的好不好,有没有达到预算执行目标,每个数据的表现都是需要仔细考虑和反馈的。为什么完成的比较好,为什么没有完成,都需要认真思考。

毛利、毛利率的分析定位

在分析上面的收入和利润过程中,大家可能会感觉总少了一点什么,比如毛利、毛利率。确实如此,毛利、毛利率的分析非常重要,但之所以没有放到集团层面去考虑主要有这么几个重点因素:

第一,毛利比较高的业务板块不一定是企业集团的重点收入板块,单纯比较毛利是比较局限的。比如上面有些业态即使毛利再高,但是由于收入规模很小,最终利润贡献也会小到忽略不计,达不到集团重点的经营分析层面。

第二,集团层面的毛利分析一定是放在重点收入业务板块和重点、新关注的业务板块。重点收入业务板块在很大程度上决定了企业集团的收入规模大小,它的毛利对最终利润水平非常重要。重点、新关注的业务板块代表了集团未来的重点业务、新领域、新市场的开拓,在未来收入达到一定的增速、水平和规模的时候,毛利的高低直接影响最终利润的规模大小。

所以对于集团型企业而言,对于毛利水平的分析一定是围绕收入规模占比大的业务板块或是决定未来集团战略转型的新业务板块,或者是老业务板块中的新产品线。因此,关于毛利和毛利率的分析是需要从集团层面下沉到具体的业务板块、业务板块的重点企业、重点企业的重点产品线或新产品线这样的一种分析和比较。

简单总结,毛利、毛利率的分析结构:

1. 集团 -> 重点业务板块 -> 重点企业 -> 重点产品线。

2. 集团 -> 重点业务板块 -> 重点企业 -> 新产品线。

3. 集团 -> 新业务板块。

财务报表视角下的企业

在上面提到的经营分析中,实际上也会涉及到大量的财务分析指标,可以结合集团企业的实际情况从宏观的例如盈利能力、风险控制能力、成长能力三个层面、六个关键点来评价企业整体财务表现。

1. 盈利能力主要体现在获利性和资产使用效率两个方面:

获利性 —— 在同等业务量和营业收入水平下,降低成本以产生更多利润的能力,即如何最大化利润表的 最终行 Bottom Line (净利润)。

资产使用效率 —— 在同等资源占用和生产能力(资产规模)下,取得更高业务量、营业收入或现金流入的能力,即如何最大化利润表的第一行 Top Line (营业收入)或最大化经营利润的变现速度。

2. 财务风险控制能力主要体现在流动性、偿付性和财务结构三个方面:

流动性 —— 现金是否足够支撑日常运营的支出,以及流动负债是否可由足够的流动资产来偿还,即评价企业的短期偿债能力。

偿付性 —— 企业是否可以偿还长期负债,企业的长期偿债能力如何。

财务结构 —— 资本中不同股权与债权的比例,不同比例下财务杠杆作用以及对利润的影响。

3. 成长能力主要体现在经营增长方面:

经营增长 —— 企业在长期发展中业务量规模的扩张程度,资源投入的增加速度,以及所带来的收入和盈利的增长速度。

反映以上三个层次六大关注点的财务指标有很多,集团型企业也需要根据自身运营特点,围绕这个基本的财务分析框架来选择合适的财务指标进行科学评价。

行业影响、市场影响因素

任何数据的解读都离不开行业性,尤其是集团型的在收入规模达到一定水平下的企业,行业与市场因素对收入、毛利、利润的影响都会非常大,以下面几个行业为例:

光伏发电行业 - 资金密集性行业,主要以自有资金、银行借款、融资性租赁来筹措资金,整体负债较高。如未来宏观经济形势发生不利变化或信贷收缩,公司业务的持续发展可能会受到不利影响。同时,光伏电站项目投产到进入补贴名录时间较长,可再生能源基金收缴结算周期较长等因素,导致国家财政部发放可再生能源补贴存在一定的滞后,对标的公司现金流压力比较大。

医药行业 - 第一,容易受市场政策影响,例如:2019年国家卫健委发布的《关于印发第一批国家重点监控合理用药药品目录(化药及生物制品) 的通知》,对西医开具中药处方加强了管理,可能会导致中药品种在部分医院的处方和推广面临困难。第二,医保和基药目录产品进入医院需要通过药品招标采购流程,受医保支付压力影响,近年的招标采购中降价成为普遍的趋势。 第三,国家对通过一致性评价的产品实施带量采购,药品价格降幅明显。包括受环保等政策影响,近年来化学原料药价格大幅上涨,未来几年仍可能继续小幅上涨。

化工行业 - 化工行业主要上游行业为石化行业,市场波动受国际原油价格直接影响,下游行业多为民生行业,受宏观经济影响很大。包括主要原材料价格波动引发的成本增加无法直接向市场客户进行转移,利润空间缩小。同时,因安全生产监管、环保监管等各个方面的原因,企业的生产经营也会受到比较大的影响。

通过行业分析,了解所在行业整体发展收入规模、行业收入增速、整体毛利、利润情况对比集团各业务板块实际发展情况,以及在行业中处于一个什么样的市场位置基本上就可以大概判断出集团主要业务板块在市场的竞争力表现。行业收入增速快,但业务板块收入水平明显低于行业平均水平,是市场品牌宣传力度不够、市场没有打开还是产品竞争力不够,到底是哪些因素的影响 ? 行业细分领域毛利率整体水平高,但在该行业业态下的企业毛利率水平低下,又是哪些因素导致的 ?只有将数据置身于行业水平来对比了解,这样才更容易找到与行业内头部企业的差距,以及不断思考怎样做才能做得更好。

业态 - 企业 - 产品线,企业重点调整与决策影响的考虑

对于重点业态下的重点企业,重点业态下的重点产品线以及涉及到集团产业升级、战略调整目标下的新业态、新业务领域、新产品线均应该纳入到集团经营层面进行深入分析,重点仍然分析的是收入、成本、毛利、费用与利润。

重点业态追求效率。对重点业态的关注除了对收入规模的关注外,重点关注的是利润水平,因为重点业态的发展跟随行业发展水平可能增速已经达到一定的瓶颈,在发展增速能够保持在一定水平的前提下,通过对成本、费用的控制来提升利润率水平,本质上追求的是效率的提升。

新业态追求规模和占有率。对新业态的关注重点放在收入增长规模的变化,代表了集团型企业未来变革、升级转型的趋势和方向,寻找增长第二级,以市场占有率为目标,本质上这个阶段追求的是市场规模。

同时,也应该注意到集团型企业在未来一到两年重点决策的改变对各个业态下在收入、成本、毛利、费用和利润以及资金运作等方面的影响。例如在北京地区,因为产业调整、环保政策、安全等各个方面的原因,对很多企业特别是传统生产制造、化工行业就有很大的影响,特定环境下的停工停产、人力成本的上升、上下游产业链的重塑、物流成本的增加等都促使集团型企业需要从整体来考虑如何应对。

三. 总结

基本上到这里,围绕集团型企业的重点经营分析的介绍就可以告一个段落,大家也可以从中看到其复杂性,实际上是综合了财务、业务、经营管理、行业因素等各个方面的考虑,最终要形成一个对集团高层管理决策有价值的一种可视化分析,让他们能够从各种不同的视角对集团经营有一个相对比较全面的了解。

在这个过程中,我始终认为业务永远是第一位的,商业智能 BI 的作用和目的是用以一种更加便捷和简单的方式来解读业务,从总到分、自上而下的回答在业务解读过程中的各种问题。这就要求在项目建设过程中,商业智能 BI 实施交付的方法论要紧扣业务本身,呈现重点目标数据、体现集团经营管理思路、定位问题和发现问题。最终,商业智能 BI 仍然要回归到业务、回归到管理本身,帮助企业提升决策的效率与质量。

8. 数据挖掘流程

商务智能指利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数据统计分析工具对客户数据进行分析,提供各种分析报告,如客户价值评价、客户满意度评价、服务质量评价、营销效果评价、未来市场需求等,为企业的各种经营活动提供决策信息。 “商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。”

数据挖掘是个技术概念,商务智能是商业领域综合利用数据的很宽泛的应用概念。狭义的说商务智能是数据挖掘技术在商业领域的应用。

9. 如何挖掘数据相关性

1)根据挖掘的数据库类型分类:数据挖掘系统可以根据挖掘的数据库类型分类。数据库系统本身可以根据不同的标准(如数据模型、数据类型或所涉及的应用)分类,每一类可能需要自己的数据挖掘技术。这样,数据挖掘系统就可以相应分类。

例如,根据数据模型分类,可以有关系的、事务的、对象-关系的或数据仓库的挖掘系统。如果根据所处理数据的特定类型分类,可以有空间的、时间序列的、文本的、流数据的、多媒体的数据挖掘系统,或万维网挖掘系统。

2)根据挖掘的知识类型分类:数据挖掘系统可以根据所挖掘的知识类型分类,即根据数据挖掘的功能分类,如特征化、区分、关联和相关分析、分类、预测、聚类、离群点分析和演变分析。一个综合的数据挖掘系统通常提供多种和/或集成的数据挖掘功能。

此外,数据挖掘系统还可以根据所挖掘的知识的粒度或抽象层进行区分,包括广义知识(高抽象层)、原始层知识(原始数据层)或多层知识(考虑若干抽象层)。一个高级数据挖掘系统应当支持多抽象层的知识发现。数据挖掘系统还可以分类为挖掘数据的规则性(通常出现的模式)与挖掘数据的奇异性(如异常或离群点)。一般地,概念描述、关联和相关分析、分类、预测和聚类挖掘数据的规则性,将离群点作为噪声排除。这些方法也能帮助检测离群点。

3)根据所用的技术类型分类:数据挖掘系统也可以根据所用的数据挖掘技术分类。这些技术可以根据用户交互程度(例如自动系统、交互探查系统、查询驱动系统),或所用的数据分析方法(例如面向数据库或面向数据仓库的技术、机器学习、统计学、可视化、模式识别、神经网络等)描述。复杂的数据挖掘系统通常采用多种数据挖掘技术,或采用有效的、集成的技术,结合一些方法的优点。

4)根据应用分类:数据挖掘系统也可以根据其应用分类。例如,可能有些数据挖掘系统特别适合金融、电信、DNA、股票市场、e-mail等。不同的应用通常需要集成对于该应用特别有效的方法。因此,泛化的全能的数据挖掘系统可能并不适合特定领域的挖掘任务