1. 区块链的数据技术
初入链圈,很多人都可能被各种专业名词搞得晕头转向,因此,研究猿在这里整理了最常见48个区块链名词供大家参考。
1、Blockchain——区块链
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。是一个共享的分布式账本,其中交易通过附加块永久记录。
2、Block——区块
在比特币网络中,数据会以文件的形式被永久记录,我们称这些文件为区块。一个区块是一些或所有最新比特币交易的记录集,且未被其他先前的区块记录。
3、区块头
区块头里面存储着区块的头信息,包含上一个区块的哈希值(PreHash),本区块体的哈希值(Hash),以及时间戳(TimeStamp)等等。
4、中本聪
自称日裔美国人,日本媒体常译为中本哲史,此人是比特币协议及其相关软件Bitcoin-Qt的创造者,但真实身份未知。
5、加密货币
加密货币是数字货币(或称虚拟货币)的一种。是一种使用密码学原理来确保交易安全及控制交易单位创造的交易媒介。
6、Node——节点
由区块链网络的参与者操作的分类帐的副本。
7、Oracles
Oracle通过向智能合约提供数据,它现实世界和区块链之间的桥梁。
8、去中心化
去中心化是一种现象或结构,必须在拥有众多节点的系统中或在拥有众多个体的群中才能出现或存在。节点与节点之间的影响,会通过网络而形成非线性因果关系。
9、共识机制
共识机制是通过特殊节点的投票,在很短的时间内完成对交易的验证和确认;对一笔交易,如果利益不相干的若干个节点能够达成共识,我们就可以认为全网对此也能够达成共识。
10、Pow——工作量证明
Proofof Work,是指获得多少货币,取决于你挖矿贡献的工作量,电脑性能越好,分给你的矿就会越多。
11、PoS——权益证明
Proofof Stake,根据你持有货币的量和时间进行利息分配的制度,在POS模式下,你的“挖矿”收益正比于你的币龄,而与电脑的计算性能无关。
12、智能合约
智能合约是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。
13、时间戳
时间戳是指字符串或编码信息用于辨识记录下来的时间日期。国际标准为ISO 8601。
14、图灵完备
图灵完成是指机器执行任何其他可编程计算机能够执行计算的能力。一个例子是Ethereum虚拟机(EVM)。
15、51%攻击
当一个单一个体或者一个组超过一半的计算能力时,这个个体或组就可以控制整个加密货币网络,如果他们有一些恶意的想法,他们就有可能发出一些冲突的交易来损坏整个网络。
16、Dapp——去中心化应用
是一种开源的应用程序,自动运行,将其数据存储在区块链上,以密码令牌的形式激励,并以显示有价值证明的协议进行操作。
17、DAO——去中心化自治组织
可以认为是在没有任何人为干预的情况下运行的公司,并将一切形式的控制交给一套不可破坏的业务规则。
18、DistributedLedger——分布式账本
数据通过分布式节点网络进行存储。分布式账本不是必须具有自己的货币,它可能会被许可和私有。
19、DistributedNetwork——分布式网络
处理能力和数据分布在节点上而不是拥有集中式数据中心的一种网络。
20、预言机
预言机是一种可信任的实体,它通过签名引入关于外部世界状态的信息,从而允许确定的智能合约对不确定的外部世界作出反应。预言机具有不可篡改、服务稳定、可审计等特点,并具有经济激励机制以保证运行的动力。
21、零知识证明
零知识证明由S.Goldwasser、S.Micali及C.Rackoff在20世纪80年代初提出的。它指的是证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的。
22、PrivateKey——私钥
私钥是一串数据,它是允许您访问特定钱包中的令牌。它们作为密码,除了地址的所有者之外,都被隐藏。
23、PublicKey——公钥
是和私钥成对出现的,公钥可以算出币的地址,因此可以作为拥有这个币地址的凭证。
24、AES——高级加密标准
密码学中的高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法,是美国联邦政府采用的一种区块加密标准。
25、Wallet——钱包
一个包含私钥的文件。 它通常包含一个软件客户端,允许访问查看和创建钱包所设计的特定块链的交易。
26、冷钱包
通俗来说冷钱包就是将数字货币进行离线下储存的钱包,玩家在一台离线的钱包上面生成数字货币地址和私钥,再将其保存起来。而冷钱包是在不需要任何网络的情况下进行数字货币的储存,因此黑客是无法进入钱包获得私钥的。
27、SPV——轻钱包
轻钱包依赖比特币网络上其他全节点,仅同步与自己相关的数据,基本可以实现去中心化。
28、全节点
全节点是拥有完整区块链账本的节点,全节点需要占用内存同步所有的区块链数据,能够独立校验区块链上的所有交易并实时更新数据,主要负责区块链的交易的广播和验证。
29、Byzantinefailures——拜占庭将军问题
拜占庭将军问题是由莱斯利·兰伯特提出的点对点通信中的基本问题。含义是在存在消息丢失的不可靠信道上试图通过消息传递的方式达到一致性是不可能的。因此对一致性的研究一般假设信道是可靠的,或不存在本问题。
30、超级账本
超级账本(hyperledger)是Linux基金会于2015年发起的推进区块链数字技术和交易验证的开源项目。通过创建通用的分布式账本技术,协助组织扩展、建立行业专属应用程序、平台和硬件系统来支持成员各自的交易业务。
31、闪电网络
闪电网络的目的是实现安全地进行链下交易,其本质上是使用了哈希时间锁定智能合约来安全地进行0确认交易的一种机制,通过设置巧妙的“智能合约”,使得用户在闪电网络上进行未确认的交易和黄金一样安全。
32、P2P——对等网络
即对等计算机网络,是一种在对等者(Peer)之间分配任务和工作负载的分布式应用架构,是对等计算模型在应用层形成的一种组网或网络形式。
33、Mining——挖矿
挖矿是获取比特币的勘探方式的昵称。利用电脑硬件计算出币的位置并获取的过程称之为挖矿。
34、矿工
尝试创建区块并将其添加到区块链上的计算设备或者软件。在一个区块链网络中,当一个新的有效区块被创建时,系统一般会自动给予区块创建者(矿工)一定数量的代币,作为奖励。
35、矿池
是一个全自动的挖矿平台,使得矿工们能够贡献各自的算力一起挖矿以创建区块,获得区块奖励,并根据算力贡献比例分配利润(即矿机接入矿池—提供算力—获得收益)。
36、公有链
完全开放的区块链,是指任何人都可读取的、任何人都能发送交易且交易能获得有效确认的、全世界的人都可以参与系统维护工作,任何人都可以通过交易或挖矿读取和写入数据。
37、私有链
写入权限仅面向某个组织或者特定少数对象的区块链。读取权限可以对外开放,或者进行任意程度地限制。
38、联盟链
共识机制由指定若干机构共同控制的区块链。
39、主链
主链一词源于主网(mainnet,相对于测试网testnet),即正式上线的、独立的区块链网络。
40、侧链
楔入式侧链技术(pegged sidechains),它将实现比特币和其他数字资产在多个区块链间的转移,这就意味着用户们在使用他们已有资产的情况下,就可以访问新的加密货币系统。
41、跨链技术
跨链技术可以理解为连接各区块链的桥梁,其主要应用是实现各区块链之间的原子交易、资产转换、区块链内部信息互通,或解决Oracle的问题等。
42、硬分叉
区块链发生永久性分歧,在新共识规则发布后,部分没有升级的节点无法验证已经升级的节点生产的区块,通常硬分叉就会发生。
43、软分叉
当新共识规则发布后,没有升级的节点会因为不知道新共识规则下,而生产不合法的区块,就会产生临时性分叉。
44、Hash——哈希值
一般翻译做"散列",也有直接音译为"哈希"的。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
45、哈希率
假设挖矿是解一道方程题,而且只有把每个整数代入才能算出来,那么哈希率就是每秒处理数据的速度。
46、hashtree——哈希树
哈希树是一种树形数据结构,每个叶节点均以数据块的哈希作为标签,而非叶节点则以其子节点标签的加密哈希作为标签。
47、SHA256
SHA-256是比特币一些列数字货币使用的加密算法。然而,它使用了大量的计算能力和处理时间,迫使矿工组建采矿池以获取收益。
48、Kyc
KYC是Know Your Customer的缩写,意思是了解你的客户,在国际《反洗钱法》条例中,要求各组织要对自己的客户作出全面的了解,以预测和发现商业行为中的不合理之处和潜在违法行为。
2. 区块链技术数据分析与应用
通过区块链技术生成的经过验证的数据具有结构化和完整性,它是不可变的。区块链生成数据成为大数据增强的另一个重要领域是数据完整性,因为区块链通过相连的链来确定数据来源。
区块链在数据方面的五大优势
(1)确保信任(数据完整性)
区块链上记录的数据值得信赖,因为它们必须经过验证过程,这确保了其质量。它还提供透明度,因为可以溯源区块链网络上发生的活动和交易。
去年,联想展示了这种区块链技术用例来检测欺诈性文件和表格,联想使用区块链技术来验证用数字签名编码的实体文档。数字签名由计算机处理,文档的真实性通过区块链记录进行验证。
大多数情况下,当有关数据出处的详细信息和数据区块的交互被存储在区块链上,并且可以对其进行操作之前自动验证(或验证)时,数据完整性是可以得到保证的。
(2)防止恶意活动
由于区块链使用共识算法来验证交易,因此单个单元不可能对数据网络构成威胁。开始表现出异常行动的节点(或单元)可以很容易地从网络中识别和清除。
由于网络是分布式的,因此单个用户几乎不可能产生足够的计算能力来改变验证标准,允许系统中不需要的数据存在。要更改区块链规则,必须将大多数节点合并在一起创建共识,对于单个作恶者来说,这是不可能实现的。
(3)做出预测(预测分析)
与其他类型的数据一样,区块链数据可以进行分析,以揭示对行为、趋势的宝贵见解,因此可用于预测未来结果。更重要的是,区块链提供的是从个人或个人设备收集的结构化数据。
在预测分析中,数据科学家基于大量数据来准确地确定社交事件的结果,例如客户偏好、客户终身价值、动态价格和与业务相关的流失率。
然而,这不仅限于商业见解,因为几乎任何事件都可以通过正确的数据分析来预测,无论是社会情绪还是投资标识。
由于区块链的分布式特性以及通过它提供的巨大计算能力,即使在较小的组织中,数据科学家也可以进行广泛的预测分析任务。这些数据科学家可以利用连接在区块链网络上的数千台计算机的计算能力作为基于云的服务,以一种其他方式无法实现的规模分析社会结果。
(4)实时数据分析
正如金融和支付系统所展示的那样,区块链可以实现实时跨境交易。几家银行和金融科技创新者正在探索区块链,因为无论地理障碍如何,它都可以快速(实际上是实时的)结算巨额资金。
同样,需要对大规模数据进行实时分析的组织可以调用支持区块链的系统来实现它的目标。借助区块链、银行和其他组织可以实时观察数据变化,从而可以快速做出决策——无论是阻止可疑交易还是跟踪异常活动。
(5)管理数据共享
在这方面,从数据研究中获得的数据可以存储在区块链网络中。这样,项目团队不会重复其他团队已经执行的数据分析,也不会错误地重用已经使用过的数据。
区块链在大数据领域有什么优势?中琛魔方大数据(www.zcmorefun.com)表示区块链技术的引入可以解决传统大数据和数据库很多固有的弊端,特别是基于区块链的数字身份和数据空间的引入,不仅可以改善传统数据库和大数据在安全与风险方面存在的问题,甚至还可以引入新的业务模式“对象既业务”改善大数据和数据库的运行效率。
3. 区块链与数据挖掘
区块链与大数据之间的一些相同点:
分布式计算:MapReduce vs. 共识机制
大数据的分析挖掘是数据密集型计算,需要巨大的分布式计算能力。节点管理、任务调度、容错和高可靠性是关键技术。
区块链的共识机制,就是所有分布式节之间怎么达成共识,通过算法来生成和更新数据,去认定一个记录的有效性,这既是认定的手段,也是防止篡改的手段。区块链主要包括四种不同的共识机制,适用于不同的应用场景,在效率和安全性之间取得平衡。
区块链与大数据有几个显着差异:
结构化vs非结构化:区块链是结构定义严谨的块,通过指针组成的链,典型的结构化数据,而大数据需要处理的更多的是非结构化数据。
独立vs整合:区块链系统为保证安全性,信息是相对独立的,而大数据着重的是信息的整合分析。
直接vs间接:区块链系统本身就是一个数据库,而大数据指的是对数据的深度分析和挖掘,是一种间接的数据。
数学vs数据:区块链试图用数学说话,区块链主张“代码即法律”,而大数据试图用数据说话。
4. 区块链技术市场分析
金窝窝网络科技分析区块链最大的特点为:去中心化。目前传统数据库是是中心化记录、中心化储存的,即使是异地灾备、云存储,也只是将存储地从一处变为多处,从本地变为云端,如果中央服务器出现问题,则灾备数据库也将停止更新数据;而区块链数据库则是分布式记录、分布式储存、分布式传播的,每一条信息都由单个节点传播给全网其它所有节点,每个节点都负责数据的记录、储存,没有中心化或第三方机构负责管理,一个节点出现问题,其他节点会继续数据的更新和存储,通过去中心化的方式,维持系统稳定运行,信息完整可靠。
5. 区块链 数据分析
作为国内第一本从技术角度讲解区块链的书籍,值得一读,2016年出版以来一致评价不错。
6. 区块链技术数据分析论文
一、解决学历造假难题
由于造假成本较低,造假惩罚措施不健全,在求职中,学历造假的现象一直很普遍。对于造假行为,也没有相关诚信记录。这样就造成了不公平竞争。
区块链可以从根本上解决学历造假这一难题,学校通过统一的学历颁发、管理、认证的区块链平台,给学生颁发毕业证书,只要经过学生的授权,用人单位就可以验证学历。
有人说统一的学历颁发、管理、认证平台,现在的中心化系统也可以做啊?确实可以,但是,一是中心化的系统数据可以被篡改,而且是谁篡改的也很难被追踪;另一个是中心化的系统本身就存在被恶意攻击等安全隐患,数据的真实性受到很大的威胁和挑战。区块链系统采用分布式存储、数据一经记录无法篡改的特性,可以确保数据的真实性。
二、降低学籍档案管理成本
目前我们的档案都是纸质的,档案转移、管理困难。无法快速流通,同时也给调查,取证、征信等活动增加了难度和成本。目前,我们的档案管理存在三大弊端——信息不完整、不利于流通、信息容易篡改。
区块链系统可以把幼儿园、小学、中学、大学的所有学籍档案,在校表现、奖励和惩罚记录等所有事件如实记录,记录时间,记录人是谁,都历历在案,一经记录无法修改,在需要调取档案时,只要当事人授权,就可以很方便地从网络上查看到完整的、真实可靠的档案信息。
三、论文、教研成果得到有效保护
在目前的教育过程中,老师论文被抄袭的现象很普遍,一直得不到有效的解决措施。这严重打击了教师的教研、以及创新的积极性。
而基于区块链的教育平台是面向全球开放的平台,教师的教研、科研成果,哪怕是一个普通的教案、课件、论文都可以利用区块链一经发布无法篡改和可追溯的技术特点来得到知识产权保护,即使出现知识产权纠纷,利用区块链可追溯的特点,调查取证易如反掌。谁是原创、谁是盗版一目了然。
四、教育资源均可实现全球共享
现在的教育资源,受制于各自为政的中心化平台,师资、教研成果是无法共享的,没有解决个体间信任的开放平台,很难实现全球教育资源的共享配置,教育永远会受到地域、经济条件等客观因素限制。
晚上张三想找一个哈佛的学生陪练一个小时英语,如此简单的需求,目前其实很难实现。区块链网络可以构建一个解决个体与个体之间信任,面向全球开放的网络,正好能够彻底解决这一系列问题。人人都可以成为教育资源,而教育资源可以全球共享,人人都是受益者。
五、通过区块链网络传授知识获取收益
这是一个共享经济的时代,但共享的基础都需要由第三方系统信用背书,而在网上售卖知识,就存在两个问题,一是学生怎么找到靠谱的老师(或者老师怎么找到真正有需求的学生)? 二是如何保证安全支付?
区块链技术可以解决老师或学生的客观评价体系,老师可以在面向全球的区块链网络上发布自己的授课需求,学生可以发布自己的学习需求,因为区块链系统数据的无法篡改性,无论是老师的个人信息,还是学生对老师的评价都能够保持客观公正(也就是说,老师提供的信息是绝对真实的,授课记录和评价也无法通过刷单获得)。
六 方便享受更好的教育
在目前的教育体制下,很多优秀的老师可能有更好的教学方法和水平,但却没有一个很好的平台让他们去发挥和展示自己的才华。如果用中心化的平台来解决会存在这样几个难题——1、学校愿意配合吗?2、所有的信息真实吗?3、第三方平台的管理运营成本由谁买单?
而基于区块链的平台可以建立学生评价体系,学生可以对老师进行公正客观的评价,把知识点,科目,每一个方向最好的资源积累起来,形成更好的引导,就能让更多的学生用更少的成本享受到优秀老师的教育资源、优秀学校的资源、甚至可以让优秀的学生也成为优秀的教育资源,共享给有需要的人。
区块链解决了互联网上人与人之间的信任难题,“没有中间商赚差价”,数据无法篡改,通过授权数据可全球化公开,这是传统互联网系统很难做到的。区块链会带来更多的教育模式、倒逼出更优的教育体制,同时也会创造更多创业、创富的机会。