1. 一般公司用什么数据库
一、Oracle数据库
Oracle数据库是被认为比较成功的一款关系型数据库,由世界第二大软件供应商Oracle公司于1983年推出。Oracle数据库具有运行稳定、功能齐全、性能优异等特点,在数据库产品中技术也比较先进。在多年的数据库市场竞争中,一直占据着比较有利的态势,尽管如此,Oracle并没有满足于现有的优势,在不断完善自身技术同时,也在开辟着新市场领域。Oracle数据库是一种大型数据库系统,一般用于商业,政府部门,它功能强大,在网络方面也用的非常多。
二、IBM DB2数据库
DB2数据库是IBM出口的一系列关系型数据库管理系统,分别在不同的操作系统平台上服务。虽然DB2产品是基于UNIX的系统和个人计算机操作系统,在基于UNIX系统和微软在windows系统下的Access方面,DB2追寻了ORACLE的数据库产品。
三、SQL Server数据库
SQL Server数据库是一款功能全面的数据库,可用于中大型企业单位,它由世界第一软件供应商Microsoft公司推出,与其他数据库相比,在操作性和交互性上有着很大的优势。SQL,结构化查询语言。SQL语言的主要功能就是同各种数据库建立联系,进行沟通。按照ANSI的规定,SQL被作为关系型数据库管理系统的标准语言。SQL语句可以用来执行各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。
四、PostgreSQL数据库
PostgreSQL数据库是一款功能强大的开源对象关系数据库管理系统(ORDBMS),用于安全地存储数据; 支持最佳做法,并允许在处理请求时检索它们。PostgreSQL由PostgreSQL全球开发集团(全球志愿者团队)开发。 它不受任何公司或其他私人实体控制。 它是开源的,其源代码是免费提供的。PostgreSQL是跨平台的,可以在许多操作系统上运行,如Linux,FreeBSD,OS X,Solaris和Microsoft Windows等。
五、MySQL数据库
MySQL数据库是一款开源的小型关系型数据库管理系统,开发者为瑞典MySQLAB公司,在2009年被Oracle公司收购,但是MySQL仍然是开源的,与其他数据库相比它有着体积小、速度快、使用灵活等特点,MySQL被广泛地应用在Internet上的中小型网站中。许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。
六、Sybase数据库
Sybase是美国Sybase公司研制的一种关系型数据库系统,是一种典型的UNIX或WindowsNT平台上客户机/服务器环境下的大型数据库系统。Sybase提供了一套应用程序编程接口,可以与非Sybase数据源及服务器集成,允许在多个数据库之间复制数据,适于创建多层应用。系统具有完备的触发器、存储过程、规则以及完整性定义,支持优化查询,具有较好的数据安全性。
七、南大通用GBase 8a数据库
南大通用分析型数据库GBase 8a是支撑大数据快速分析的新型数据库,作为列存储的分析型数据库,南大通用Gbase还是有其独到之处的,以新型的存储结构、数据压缩、数据映照和优化算法等技术大幅度提高对海量数据进行统计分析的运算速度。GBase 8a能够实现大数据的全数据(结构化数据、半结构化数据和非结构化数据)存储管理和高效分析,为大数据应用提供完整的数据库解决方案。GBase 8a以新型的存储结构、数据压缩、数据映照和优化算法等技术大幅度提高对海量数据进行统计分析的运算速度。
八、人大金仓KingbaseES数据库
人大金仓的核心产品金仓交易型数据库KingbaseES,具备高兼容、高可靠、高性能、高扩展、高安全、易使用和易管理的特点,是唯一入选国家自主创新产品目录的数据库产品,也是国家级、省部级实际项目中应用最广泛的国产数据库产品。人大金仓(全名:北京人大金仓信息技术股份有限公司)是中国自主研发数据库产品和数据管理解决方案的领导企业,由中国人民大学及一批最早在国内开展数据库教学、研究与开发的专家于1999年发起创立。
九、达梦数据库(DM)
达梦数据库管理系统是达梦公司推出的具有完全自主知识产权的高性能数据库管理系统,简称DM。DM7是达梦公司在总结DM系列产品研发与应用经验的基础之上,吸收主流数据库产品的优点,采用类JAVA的虚拟机技术设计的新一代数据库产品,其基于成熟的关系数据模型和标准的接口,是一个跨越多种软硬件平台、具有大数据管理与分析能力、高效稳定的数据库管理系统。
十、OpenBASE数据库
OpenBASE是东软集团有限公司软件产品事业部推出的我国第一个自主知识产权的商品化数据库管理系统,该产品由东软集团有限公司软件产品事业部研发并持有版权。10多年来,OpenBASE已逐渐形成了以大型通用关系型数据库管理系统为基础的产品系列,包括: OpenBASE多媒体数据库管理系统,OpenBASE Web应用服务器、OpenBASE Mini嵌入式数据库系统、 OpenBASE Secure安全数据库系统等。
2. 一般公司用什么数据库软件
数据库指的是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。它具有整体性、共享性。数据库软件有着整体性和共享性的特点。
数据库技术的发展,已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库技术最初产生于20世纪60年代中期,根据数据模型的发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的数据库系统。
做一个数据库,需要的软件可以是:
1、Sybase。开发公司成立于1984年11月,总部设在美国加州的Emeryville(现为美国加州的Dublin市)。作为全球最大的独立软件厂商之一,Sybase公司致力于帮助企业等各种机构进行应用、内容及数据的管理和发布。Sybase的产品和专业技术服务,为企业提供集成化的解决方案和全面的应用开发平台。
2、Informix。公司在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
3、MySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。而2009年,SUN又被Oracle收购。对于Mysql的前途,没有任何人抱乐观的态度。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。
4、Visual FoxPro。原名FoxBase,最初是由美国Fox SoVisual FoxProftware公司于1988年推出的数据库产品,在DOS上运行,与xBase系列兼容。FoxPro是FoxBase的加强版,最高版本曾出过2.6。之后于1992年,Fox Software公司被Microsoft收购,加以发展,使其可以在Windows上运行,并且更名为 Visual FoxPro。 FoxPro比FoxBASE在功能和性能上又有了很大的改进,主要是引入了窗口、按纽、列表框和文本框等控件,进一步提高了系统的开发能力。
3. 数据仓库一般用什么数据库
oracle数据仓库本质上是依赖于关系型数据库来实现了OLAP的,所以ORACLE数据仓库中在建模中会使用星型模型来实现
teradata的话,其实是依赖于teradata的硬件设备来实现,所以它的数据仓库在设计上就不需要设计成星型模型的
设计成星型模型的话,会有数据冗余,但是查询快,而teradata直接有穿透功能,所以就没有必要设计成星型模型了
4. 一般公司用什么数据库比较好
ElasticSearch最广泛的使用场景,是提供垂直搜索功能。什么是垂直搜索呢?
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
其实说白了就一句话,垂直搜索是在企业内部使用的搜索引擎。这种搜索引擎的特点是,内容可能是一些结构化的数据,而不像大搜索那样都是杂乱的内容。
一般被拿来解决一些什么样的问题?
数据库字段太多,查询太慢,索引没有办法再做优化;
数据库一个count就拖死全表;
MySQL的limit翻到几十几百万页后实在是太慢;
数据库like实在太慢,每次like整个服务器cpu内存飙高,拖慢整个线上服务;
想要对外/内提供db里的数据的全文检索服务;
提供日志(程序运行)查询功能;
下面来针对上面几方面的问题逐一进行说明。
数据库方面
MySQL对于一些较为固定,字段较少的查询方式,可以通过简单的增加索引来完成优化。在大多数公司,即使对索引优化不熟悉,也有专门的dba来帮忙完成一些简单的优化。甚至有些公司要求程序中不允许出现orm,必须用纯sql来完成业务逻辑,这样dba可以直接介入到代码中来。
不过到字段太多的时候,这种方法就失灵了。字段越多,查询自然就越慢(比如单条记录可能都超过了4k)。
MySQL表在普通查询过程中,比如select * from xxx limit 100w, 100;这种,数据量小的时候随便写sql,可能不会体会到翻页的痛。但在一个单表3000w的系统中写了limit 100w, 10。那数据库服务器就哭了。因为实际上数据库为了取出想要的那几条数据,需要把所有的数据也就是10000010条都取到内存中,复杂一点的select再加上order by则可能会同时涉及到多次磁盘读取和文件排序,慢上加慢。
除此之外,现在最流行的innodb之类的存储引擎在计算count的时候非常的慢。当然了,网络上会有人从乱七八糟的文章里看到换myisam应该就会更快的结论,但这其实是错的。如果在select语句的where条件中也有表达式时,这两种存储引擎本质上都是一样的,都会很慢很慢。
还有MySQL的like,其实没什么玄幻的,每次做like本质还是查询内容去和数据库字段做字符串匹配。非常地慢。
现在一般的互联网系统都是普遍的写少读多的系统,写/读搞不好会有1/5以上。但因为数据量庞大,为了读取效率而去做拆表或者拆库的话,有时候实在是有点得不偿失。而且拆表拆库对业务代码来说也并不透明,还可能会对本来支持的功能造成额外的影响。只是为了查询而去拆分的话,不是很合适。
上面这些问题,ES都可以解决。企业里对数据的查询一般可以分为三种:列表查询、详情查询和统计查询。列表一般就是列表页对应的查询,详情查询一般就是具体id对应的详情查询,而统计查询一般都是在看一些数值之类的报表,也就是一堆count值。
这三种查询里,MySQL做起来最困难的是1和3,即列表查询和统计查询。列表查询这种场景也会对应各种各样的查询条件,例如字段等于/小于/大于/不等判断,或者像字符串的严格匹配/前后缀模糊查询,时间字段的范围查询,in查询等等。这些查询都可以翻译为ES中的bool查询,举一个简单的例子:
例如上面这个es中的bool查询,就是从这种sql翻译过来的:
对应到业务里,常用的查询其实大多数都是这些很简单的条件并列,A && B && C && D。所以翻译起来也比较简单。
单表的count放在ES里做也非常的快,为什么呢?因为ES本身会把单个字段的一种值当作一个term,然后会记录这个term出现的所有文档和出现次数。举个例子,我们公司的业务,可能会去查询某个业务线下的所有工单。那么查询条件就类似于where business_type is 6这样。可能只需要一毫秒就返回了结果。很费解是不是?其实ES也只是去读了一下这个business_type是6的term出现的文档数,逻辑上是很简单的。
这是不是说明ES就是万能的了?
并不是。
首先是翻页的问题,ES里有上亿数据,翻到最后一页的时候还是会比较慢,并且会影响到整个系统的load,然后系统响应变慢。因为其原理还是拿一堆数据来做merge。
从传统的sql思维翻译到es的dsl过程也稍微有点痛苦。因为ES毕竟是从搜索引擎的角度去做这些事情,所以如果当DB来用的话,其DSL设计就显得很别扭。虽然有了上面的转换规则,但实际上业务转换起来并没有这么方便,比如在通常的查询里还可能会有where a = 1 or b = 2。显然想转成DSL就没有这么方便了。
ES不是数据库,所以如果想要实现联表查询也会变得很麻烦。如果还想实现事务,那么还是放弃吧。
在企业里用ES提供查询服务的话,一般都会做一层查询封装。直接提供sql接口。
但插件支持的功能也是有限的,并不是所以的特性都能很好的支持,比如join。所以也有一些公司的人会用druid之类的东西做一个sql parser层,然后来支持这些需求。
不过即使是直接用这种插件,也不能认为它就能一劳永逸,还是需要对ES内部的机制(例如mapping)和通常的查询方式(term/query_string/wild_card等)很了解才行。
比如必须知道wildcard查询必须对字符串字段设置为not_analyzed。还得知道term什么时候代表的是分词后的词,什么时候代表的是整个字段的值。
在了解了这些之后才会了解到ES的高性能like,其实也还是有一些限制。例如输入的字符串会被分词,这也就是说,想要高性能的时候只能用ES默认提供的基于词的字符串like,而且一旦分词,就没办法实现类似sql里的 x= "Hello world"这种准确匹配的逻辑。也就是说,在ES里查询hello world,hello world fuck也会出现在结果当中。不过这个对于大多数的业务来说实际上是无所谓的。
检索服务方面
搜索是人类的自然需求。如果不是的话,那Google和百度就不会诞生了。
而检索/搜索的基本原理就是对语句进行分词,然后再形成倒排索引,再根据词项出现次数对文档进行打分,最终按分数倒序展示给用户。
对于海量数据的公司来说,一个单机的方案很快就会遇到瓶颈,而去寻求或自行开发更好的解决方案。在ES之前solr更流行一些吧,不过solr的配置还是稍微麻烦,而es的集群搭建只要改改yml就好了。
有了ES以后,集群便可以非常方便地进行动态扩展。只要加硬盘加机器改配置就好,因为本身的副本分布策略比较科学。所以只要别一半以上的节点都挂掉,数据就不会丢失。而且还会在某些结点挂掉的时候自动进行分片relocate。
由于ES本身带的分词不是很科学,这样的话对doc打分可能会有一些影响。比如中国人可能不正确地分成了中/国人之类的。现在很多人会选择以插件的形式把ik分词器之类的插件挂载到es上来改善分词效果。这些插件的本质其实还是一个非常庞大的中文词库。内部设计有链接可以直接查看语句的分词结果,可以方便地直接查看效果。
所以要是有几亿的文档需要做些检索,那五六台配置不错的ES机器就足够了,甚至都不用ssd。
日志方面
企业里的系统一般都是分布式系统,所以无论是接入,还是api,还是db,都不太可能在一台机器上完成需求。
对于某一个服务模块来说,多台机器最麻烦的就是去查问题。在没有日志系统的时代,程序员大概只能登陆到机器去一台一台寻找可能的错误日志,然而因为负载均衡算法(比如可能是一致性哈希望/随机/RR/WR)的问题,可能一个用户在一次访问会话(session)中的请求都不是一台而是多台机器完成的响应。
所以日志系统的工作就是把日志汇集到一起,并提供统一的查询入口。
要收集日志一般会自行搭建一个elk平台,elasticsearch/logstash/kibana必不可少。
不过拿来的东西总会有那么一些问题,比如kibana里的按地图出数据默认用的是googlemap,在墙内使会有些问题,这个问题github上也有人已经解决了。再比如logstash这个程序可能只考虑了简单的收集 ,如果是大公司的业务讲究一个严谨。例如想要对日志收集端的资源使用做一些限制,不能随便占用系统资源而影响到业务系统。再比如还希望日志不要因为网络闪断之类的问题导致日志丢失什么的,所以还可能会在logstash后面再加一个kafka/redis。不管怎么说,工作基础还是elk。
日志系统还存在一个问题,因为海量的数据和海量的访问,日志的数据量一般都非常地庞大。所以一般数据都会有一个过期时间,一般来说,日志数据其实一般也就一周或者一个月。毕竟即使是一个边缘部门,一周的日志也都已经几个亿(100+GB)了。
查询起来也不希望太慢,所以还是尽量把日志索引的大小控制在一个范围内。当然,也有按照日期来生成索引的。每一天在一个独立的索引下,这样查询性能也会好一些。
同时又是因为这海量的数据,在写入到ES的时候必须使用bulk端口,相信使用过ES的人都知道使用和不使用分别意味着什么。
5. 数据库公司是做什么的
SQL(Structure Query Language)是结构化查询语言的缩写,是IBM公司在70年代开发的关系数据库原型System R的一部分。发展到现在,所有的关系数据库系统都支持它。
所以自从ibm公司1981年推出以来,sql语言,得到了广泛的应用。
如今无论是像oracle
,sybase,informix,sql
server这些大型的数据库管理系统。
还是像visual
foxporo,powerbuilder这些微机上常用的数据库开发系统,都支持sql语言作为查询语言。
6. 互联网公司用什么数据库
Webos或者我们称为网络操作系统,是一种基于浏览器的虚拟的操作系统,用户通过浏览器可以在这个Webos上进行应用程序的操作,而这个应用程序也不是普通的应用程序,是网络的应用程序。
举一个简单的例子,当我们要进行照片的处理时我们通常打开电脑,进入Windows操作系统,运行Photoshop程序来进行加工和操作。
而在Webos上,我们是通过打开一个浏览器,登录到我们的一个虚拟的桌面上,运行Picasa这样的网络应用程序来进行照片的加工和处理。
从用户的角度出发,两种运行方式在实际操作上不会有太明显的差别,唯一不同的地方就是Webos是运行在一个浏览器内。但是这点不同却能够导致根本性的变革,因为用户需求的将只是一个浏览器(我相信99%的计算机都已经安装了浏览器),这个浏览器可以运行在Windows的操作系统上,也可以运行在Linux上,而且用户并不需要安装各种的应用软件,因为webos只要有一套的应用软件,所有连入这个系统的用户将都可以使用。
7. 数据库是哪个公司的产品
中国知网隶属于A股上市公司同方股份(600100),同方股份拥有同方知网数字出版技术股份有限公司98.98%的股权。
同方知网主要从事互联网出版与服务业务,目前已经形成了“中国知网”(CNKI)门户网站,为用户提供《中国知识资源总库》《中国学术期刊数据库》《中国博硕士论文数据库》等一系列产品。中国知网文献总量达2.8亿篇,中外学术期刊品种达58000余种,个人用户达2亿以上。
8. 现在公司一般用什么数据库
随着技术和服务器硬件的升级,现在的网站居多以MSSQL或者MYSQL作为网站的数据库,ACCESS 的数据库网站已经比较少了。IDC商的虚机也会根据数据库和开发程序的不同分出一些类型,只有了解这些知识,才能找到合适的空间或服务器。
1、Access一般用在小网站上,类似企业站,功能比较简单,对数据要求不高;
2、Mssql是一个比较大的完善的数据库,在windows上常用,配NET ASP等程序。
3、Mysql是一个小型的公开源代码的免费数据库,在windows,linux上都常用,和PHP程序组成一对完美搭档。
9. 一般公司用什么数据库好
可信的。
其依靠的是数据爬虫技术,每当我们需要查询企业时,其数据库没有的,就会到全国企业信用信息公示系统、中国裁判文文书网等官方网站进行抓取,一般需要一分钟不到;其数据库有的,那我们搜索只需要毫秒。
所以依靠这种技术展示的企业信息都是来自官网,允许公开的数据,因此可信的。
10. 大企业用什么数据库
万方医学网主要侧重点是医学,具体网址:http://med.wanfangdata.com.cn/。万方数据库的内容涵盖各个方面,具体网址:http://www.wanfangdata.com.cn/。
万方医学网是万方数据股份有限公司秉承开放联合、专业精深的理念,联合国内医学权威机构、医学期刊编辑部、权威医学专家推出的,面向广大医院、医学院校、科研机构、药械企业及医疗卫生从业人员的医学信息整合服务、医学知识链接全开放平台。为用户提供期刊、学位论文、会议论文、科技成果等信息检索功能,并提供在线支持服务。旨在关注医学发展、关注全民健康、推动国内医学信息资源的共建、共享和沟通。万方数据公司是国内第一家以信息服务为核心的专业数据库服务公司。
万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;是一个以科技信息为主,集经济、金融、社会、人文信息为一体,以Internet为网络平台的大型科技、商务信息服务系统。也是和中国知网齐名的中国专业的学术数据库。其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。