1. 数据挖掘的书籍推荐
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模式。在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等。
数据挖掘涉及的学科领域和技术很多,有多种分类法。
(1)根据挖掘任务分,可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘对象分,有关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web。
(2)根据挖掘方法分,可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法,另外还有面向属性的归纳方法等等。
2. 数据挖掘相关的书籍
数据挖掘:Data mining,又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 举例:爬虫软件就是简单的数据挖掘 数据分析:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。 举例:通过对大量数据的分析马云知道了杭州地区的女性的...
3. 数据挖掘书籍推荐系统
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。
构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。 其作用大体不离以下几个方面: 精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;
用户统计,比如中国大学购买书籍人数 TOP10;
数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况; 进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务; 对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。
比如,某公司想推出一款面向5-10岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。 业务经营分析以及竞争分析,影响企业发展战略
4. 文本挖掘书籍推荐
文本层次分析理论意思是指文本是一个具备复杂特点的语言,要透过文本的表层去挖掘其深层次的含义。
5. 数据挖掘看哪本书好
1.双证书权威性:工业和信息化部证书颁发的《数据分析师职业技术证书》,是目前我国项目分析业界唯一的经国家认证的考核证书。中国商业联合会数据分析专业委员会颁发的《CPDA数据分析师证书 》是中国数据分析业由协会唯一认可的、具有从业特征的证书体系,五名以上分析师可以申请成立项目数据分析师事务所,是承接项目数据分析报告唯一被市场及客户认可的资质证书。获得证书是对自身能力的一个有力证明。全国统考、中数委与工信部共同命题,公平、公正、严格,更具含金量。
2.专业:CPDA数据分析师证书依照从业认证,从2003年设立开始,既不设立任何级别。学员只有通过严苛的考核并合格后,才能拿到行业协会颁发的数据分析师证书,取得从业资质。坚持CPDA数据分析师不区分等级,正是协会严格尊重国际惯例、遵守从业规范的结果。
6. 数据挖掘算法书籍推荐
数据挖掘得概念,关键技术及应用 数据挖掘的分类方法、概念、关键技术、图形图像得应用 数据挖掘的关联规则、概念、算法(以两种算法规则为例)归纳算法过程
7. 数据挖掘技术与应用书籍
spss是在电脑上用的,有Windows和Mac OS X等版本。SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"社会科学统计软件包"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。