区块链技术原理及经区块链存证的知识产权证据在证据法上的效力
发布于 2021-05-13 13:35 ,所属分类:区块连和PHP开发学习资料
本文将对区块链的底层技术进行一定程度的解析,探讨存证于区块链上的知识产权证据作为民事证据在诉讼中存在的问题。

引言
自中本聪(Satoshi Nakamoto)于2008年发布《比特币:一种点对点的电子现金系统》(Bitcoin: A Peer-to-Peer Electronic Cash System)以来,距今已十二年有余,也对世界产生了深远的影响。首先是该文中提到的比特币系统,目前该虚拟货币已达57845美金/枚(约合人民币387624元/枚);其次是其底层技术——区块链。2019年10月24日,中共中央政治局就区块链技术发展现状和趋势进行第十八次集体学习。中共中央总书记习近平现在主持学习时强调,“区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。我们要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发展。”本文将对区块链的底层技术进行一定程度的解析,探讨存证于区块链上的知识产权证据作为民事证据在诉讼中存在的问题。

区块链技术概要
(一)区块链定义
自区块链技术这一技术术语被创制以来,其定义便被许多人解读过。笔者认为,区块链是通过一定的规则将交易数据打包成“区块”,并通过时间顺序结合为“链”,并将所有数据同步备份到所有系统参与者的计算机中以实现信息在一定程度上达到不可追溯更改或伪造的技术。因“比特币”系“区块链”的第一个广为人知的应用,在早期,多数人将“比特币”与“区块链”的概念等同。事实上,目前“区块链”的含义已经远远超过了“比特币”的内涵,简单来说,将数据批处理为带时间戳的块的任何数据结构[1],均可称为“区块链”。
(二)区块链的历史沿革及技术解析
David Chaum在其1982年的论文《由相互可疑的团体建立,维护和信任的计算机系统》(Computer Systems Established, Maintained, and Trusted by Mutually Suspicious Groups.)中首次提出了类似区块链的协议[2]。Stuart Haber和W. Scott Stornetta于1991年描述了对加密保护的区块链的进一步研究,他们想实施一个不会篡改文档时间戳的系统[3]。1992年,Haber,Stornetta和Dave Bayer将Merkle树合并到设计中,通过将多个文档证书收集到一个块中来提高了效率[4]。2008年,一个名叫中本聪的人对区块链的设计进行了重要改进,使用了类似于Hashcash[5]的方法为区块添加时间戳,引入一个困难参数用于稳定将块添加到链中的速率,而无需要求他们由受信任方签名。2009年,中本聪实现了该方法,并将其作为加密货币——比特币的核心组件。由前述可知,实现“区块链”的技术其实已经存在了几十年,但直至比特币才得以成型。现“区块链”技术虽有发展,但其核心仍未脱离比特币时代的框架。本部分将具体解释区块链技术的内在机理。
1、何为“挖矿”?
如果之前接触过数字货币,就会经常听见一个名词,谓之“挖矿”。那么何为“挖矿”呢?简单来说,就是为了获得记录区块的权利所进行的复杂的数学计算。例如比特币中的计算便是反向推算满足需求的散列函数值(代码见图3),其使用的散列函数为SHA256。具体的计算方式为,将“前块的头部+十分钟内的交易记录+打包时间的时间戳+随机数”作为一个字符串,并对该字符串作一次SHA-256运算,即SHA-256(字符串)。SHA-256是SHA-2下细分出的一种算法,SHA系Secure Hash Algorithm的简写,是一种密码散列函数算法标准,由美国国家安全局(NSA)研发,美国国家标准与技术研究院(NIST)发布,并经联邦资讯处理标准(FIPS)认证。我们知道,计算机中每一位都是由0和1构成,对于任意长度的输入,SHA-256算法的结果都会输出一个长度为256位的哈希值,称作信息摘要,该摘要相当于32个字节的数组,通常用一个长度为64的十六进制字符串,且即使在输入数据中轻微改动一个数值,则其结果都会完全不同,且该不同毫无规律可言(见下图)。
(图1:笔者姓名小写拼音SHA-256哈希值)
(图2:笔者姓名首字母大写拼音SHA-256哈希值)
因此,该结果几乎不可逆向解密。根据前述,在计算的字符串中,“前块的头部”、“十分钟内的交易记录”均为固定,而“打包时间的时间戳”虽为固定,但因信息传递有时间延迟,因此每位挖矿者“打包时间的时间戳”均不同,仅有“随机数”可以变化。所以,在比特币系统中,挖矿者想要获得记录区块的权利,没有任何捷径可走,只能由挖矿者由通过遍历随机数的方式正向计算得出,该遍历随机数的计算过程,便是“挖矿”。
(图3:bnProofOfWorklimit = ~uint256(0) >>32;即计算需求,要求256bit前32位为0)
2、如何验证电子签名
在现实世界中,因每个人的基因、习惯等不同,想要确认某一个人的身份,可以采用生物识别的方式,例如指纹、虹膜等方式验证;也可以采取例如笔迹鉴定等方式验证;而在计算机的世界中,因数据拷贝是计算机最擅长的事,无论是生物数据还是其他数据,均可以完美复制。因此,传统的验证方式在计算机的世界中无法实现,据此,如何确认某条信息是某个特定的人发出的呢?在区块链的世界中,该部分由“非对称加密”实现。我们以比特币系统为例,以经典的“爱丽丝与鲍勃”假设来解释,其加密与解密过程如下:
①爱丽丝进入比特币系统时,比特币系统会给其分配一个公钥a,私钥b与地址c,a、b、c均为一串字符串,使用公钥a可以解密爱丽丝用私钥b加密的密码,其中公钥a、地址c均为公开,任何人均可知晓,私钥b为私密,仅有爱丽丝知晓;
②爱丽丝向鲍勃转50个比特币,则其将该信息x打包,并使用SHA-256算法对该信息进行运算,得出SHA-256(x),并通过其私钥b对SHA-256(x)进行加密,得出密码b(SHA-256(x));
③爱丽丝将“爱丽丝向鲍勃转50个比特币”的信息x、其公钥a,以及密码b(SHA-256(x))向全网进行广播;
④收到广播的第三方将信息x进行一次SHA-256运算,得出SHA-256(x),假设该值为p;
⑤收到广播的第三方使用爱丽丝的公钥a解密密码b(SHA-256(x)),即a((b(SHA-256(x))),假设该值为q;
⑥如果p = q,则确认b(SHA-256(x))系爱丽丝使用其私钥b加密而成,又因私钥b仅有爱丽丝一人知道,则可确认该消息由爱丽丝发出。
3、如何避免信息篡改
我们在前述文章中提到,区块链中的“挖矿”即为了获取记录区块的权利所进行的复杂的数学计算。那么,如果区块链中的某一个挖矿者为了篡改区块链中的某一个数据,他要做哪些事呢?依旧以比特币系统为例:在比特币系统中有一个“最长链原则”,即全网只认定最长的链为有效链。我们以下图作说明:
(图4:区块链防篡改机制说明)
在一条A、B、C、D链中,如果爱丽丝想篡改(删除或改写)区块B中的交易数据,那么她就应当将其挖出的区块E接在区块A后面。但由于“最长链原则”的限制,此时全网的算力挖出的区块仍会接在区块D后,A、E事实上为无效链,因为长度不够而无法获得全网的认同,如果想将该链变为有效链,那爱丽丝就应当继续挖出F、H、I区块接在区块E后,且还要求全网算力还未算出任何一个区块接在区块D后,只要A、E、F、H、I的链在某一天长度大于A、B、C、D,爱丽丝篡改区块B交易数据的行为便会获得全网的认同,该次篡改即获得成功。在前述“挖矿”节中我们讲解过,在比特币系统中,挖矿者想要获得记录区块的权利,只能由挖矿者由通过遍历随机数的方式正向计算得出,即算力越高,其获得记账权的可能行就越大。这也是为什么比特币系统中存在一个集合全网51%算力即可篡改比特币数据说法的由来。在前述假设中,全网的算力仅49%,拥有51%算力的爱丽丝确实有可能将A、E、F、H、I链算得比A、B、C、D链长,届时,篡改了信息的A、E、F、H、I链将被全网确认为真正的适格链。
(三)区块链分类
区块链大体可分为公有链、私有链。公有链亦可称作公共区块链,系完全去中心化的区块链。任何人都可以参与,且任何人均自由访问该链,并在该链上发送、接收、认证交易。一些加密数字货币系统例如BTC、ETH、EOS均可归入该类别。私有链是指只对特定的团体开放,且仅限于特定成员参与,其共识过程受到预选节点的控制,且拟加入或退出该链均需要通过授权才可实现,该类区块链由中心化机构控制,并不具有去中心化的属性。例如德勤和ConsenSys于2016年宣布创建的数位银行ConsenSys计划、由以太坊、Chain.com、英特尔和IBM牵头的,连接42家银行分布式分类帐计划均属于私有链。

区块链存证知识产权民事证据之优劣
(一)区块链认证知识产权民事证据的优势
1、解决电子数据的原件、复制件之争
根据《最高人民法院关于民事诉讼证据的若干规定》(以下简称“《证据规定》”)第十一条之规定“当事人向人民法院提供证据,应当提供原件或者原物。如需自己保存证据原件、原物或者提供原件、原物确有困难的,可以提供经人民法院核对无异的复制件或者复制品。”根据《证据规定》第八十七条之规定,“审判人员对单一证据可以从下列方面进行审核认定:(一)证据是否为原件、原物,复制件、复制品与原件、原物是否相符;(二)证据与本案事实是否相关;(三)证据的形式、来源是否符合法律规定;(四)证据的内容是否真实;(五)证人或者提供证据的人与当事人有无利害关系。”根据《证据规定》第九十条之规定“下列证据不能单独作为认定案件事实的根据:(一)当事人的陈述;(二)无民事行为能力人或者限制民事行为能力人所作的与其年龄、智力状况或者精神健康状况不相当的证言;(三)与一方当事人或者其代理人有利害关系的证人陈述的证言;(四)存有疑点的视听资料、电子数据;(五)无法与原件、原物核对的复制件、复制品。释义引用统计”因此,“原始证据”作为“证据之王”在诉讼中具有无可匹敌的地位。对证据原件的重要性论断一般认为出自1700年首席大法官的论述,即“仅仅需要实物本身所能具有的最佳时证据”[6]。随着科技的发展,愈来愈多工作可以通过计算机完成,而电子数据又极易被修改,只要在任何一台计算机上具备打开相应格式文件的软件即可对文件内容进行修改,且其复制几乎无需耗费额外成本。因此,在计算机的世界里,原始证据与传来证据的界限正在变得模糊。然而,借助区块链技术,则可确定某一时间点传上链的电子数据为正本,且该正本可通过区块链下发的密钥在其链上进行认证,一旦认证无法通过,则证明电子数据系复制件。事实上,在艺术领域,该种操作已经远远超过了其在司法领域的发展。
例如英国画家、著名街头涂鸦艺术家班克西于2016 年创作了一份画作《白痴》,用于讽刺 1987 年拍卖梵高《向日葵》创纪录的销售历史。该画作在拍卖上中经过激烈角逐,最终被Injective Protocol 区块链公司花费 9.5 万美元买下。然后Injective Protocol 区块链公司进行了一场直播,在众目睽睽中烧毁了该份画作。随后,该公司宣布,他们会通过SuperFarm 区块链技术使该画作数位化保存,以 NFT(Non-Fungible Token)形式出售,拍卖《白痴》的电子版本所有权,把收益捐给慈善组织。这份经过经区块链技术处理后具有独一无二标识的虚拟画作,谁拥有了密钥,谁就相当于拥有了画作的所有权。最后经过数位化保存的电子版《白痴》由一位竞价者花费38万美元买下。因此,通过区块链技术可以解决人类无法识别电子数据复制件的问题,只要区块链中区块的内容可包括电子数据生成时所含的电子数据本身的信息以及其生成的附属信息即可。常规的计算机复制可复制电子数据本身的信息,但是其生成时的附属信息却无法回溯,因此,理论上设计合理的区块链可以明确区分电子数据的原件与复制件,一定程度上的保证电子数据的真实性。
2、减轻当事人负担
在笔者的办案过程中,需要向法院提交电子数据或者视听资料存在两种方式。
以QQ聊天的记录为例,第一种是以书证的方式提交,我们会与当事人共同审核QQ聊天记录内容,认为有必要提交给法院的就截屏保存,并将截屏的图片打印出来提交至法院;当然,该种操作需要当事人在庭审当天到场或将可查询QQ聊天记录内容的手机交给律师,以应对法官在庭审过程中要求当事人当庭出示聊天记录的要求。如当事人在开庭当天未到庭,且律师无法取得当事人的手机,则对方律师会提出真实性不予认可的抗辩;第二种是以公证方式提交,由当事人在公证员的见证下以全程录音录像的形式在公证处或公证员指定的地方现场打开手机并浏览聊天记录,由公证员出具公证文书,并由律师在庭上出示。但该种方式耗时耗力,需要律师、当事人、公证处三方配合,且公证员出具公证文书时的价格也常常难以令人接受。有了区块链技术后,通过将聊天记录上链的方式即可保证电子数据上链后未经过修改,且该费用与公证费相比往往价格低廉,一定程度上减轻了当事人的经济负担,且可保证上链电子数据中信息的真实性,便于法官、律师将争议焦点聚于事实问题与法律问题,减少程序问题的干扰。
(二)区块链认证知识产权民事证据的劣势
1、无法保证链下生成电子数据的真实性
笔者在办案过程中,经常能接触到一些律师使用可信时间戳认证涉嫌侵权产品的购买过程,并将可信时间戳认证证书作为证据提交,其上载“本证书时间戳由联合信任与国家授时中心的共同建设的联合信任时间戳服务中心签发,证明本证书附件中时间戳所对应的电子数据由联合信任移动客户端‘权利卫士’获取,自申请时间戳时起已经存在且内容保持完整、未被篡改”。
笔者认为,该段话也表明了其能证明的事项仅限于“自申请时间戳时已经存在且内容保持完整、未被篡改”,至于证据在申请时间戳之前的效力,包括取证环境的清洁性、取证时间的客观性、取证过程的规范性、取证结果的真实性、完整性、副本与初始取证结果的一致性、能否与在案其他证据相互印证等内容目前区块链技术尚无法解决。在成都日报社与北京全景视觉网络科技股份有限公司侵害作品信息网络传播权纠纷二审民事判决书(案号(2019)川01民终1050号)中,二审法院认为“第二,考虑到电子数据易复制、易篡改的特性,电子数据证据的审查应当包括取证环境的清洁性、取证时间的客观性、取证过程的规范性、取证结果的真实性、完整性、副本与初始取证结果的一致性、能否与在案其他证据相互印证等内容。根据本案查明的事实,涉案《电子数据保全证书》系一张微博网页截图,该网页截图本身无法反映其形成时间、形成方式、形成环境等形成过程的具体信息,并且涉案《电子数据保全证书》的验证方式仅能证明电子副本与留存于服务器上的电子数据一致,而不足以证明其留存于服务器上的电子数据形成过程中操作环境是否清洁性、取证方式是否规范性、取证结果是否真实、完整、取证结果上传服务器之前是否经过篡改,故无法排除因操作者不当介入、操作计算机不清洁、网络环境不真实等因素对该电子数据造成不良影响的可能;涉案《电子数据保全证书》所载保全时间,在缺乏技术说明和印证证据的情况,不足以自证该时间就是保全行为发生的真实时间。至于北京全景视觉公司举示的渝信证字第16904号《公证书》、《公证业务合作声明书》、《在线仲裁业务合作声明书》、《鉴定业务合作声明书》均不足以证明涉案《电子数据保全证书》取证过程的清洁、规范、客观、真实。”笔者深以为然。另外,笔者曾与杭州市东方公证处公证员交流PC端“实时保”之操作规程,并询问对于取证环境的清洁性保障问题。其公证员称,在申请人利用PC端“实时保”进行取证前,公证处会指导当事人进行清洁性操作,且整个操作过程会被录屏。当事人的证据会实时上传至公证处的服务器中,如当事人需出具公证书,公证处可对数据提取的过程进行公证,并将提取的数据刻盘。因此,目前所使用的区块链存证技术仍使用经国家公证机构的信用进行背书,尚未发挥区块链技术之全貌。换言之,虽然在区块链上的数据本身在理论上无法被更改,但区块链技术本身还无法依靠自身完成取证过程有效性的证明。亦即,目前区块链技术仍无法实现“技术自证。
2、信息存在被篡改可能
笔者在前述“如何避免信息篡改”节中讲解过,即使在类似于比特币系统的公有链上,拥有51%算力的爱丽丝理论上也有篡改数据的可能。而目前投入使用的一些区块链存证系统并非完全去中心化的系统,且其更接近于私有链。换言之,这些系统仍存在被侵入的风险,而一旦系统被侵入,拥有这些区块链系统中51%的算力并非难事。因此,其链上数据也并非所设想的“不可篡改”那般美好。笔者认为,目前投入使用的区块链存证系统不但需要在节点选择上做好确认,更应当在网络攻击防范与物理攻击防范上进一步提升其安全性,以防数据被他人恶意篡改。

结论
笔者在本文中分析了区块链技术的内核与经区块链认证的数据在证据法上的效力,对于使用区块链技术存证的证据,笔者认为“区块链存证第一案”[8]中的审判员沙丽法官作了非常精彩的论述,即“采用区块链等技术手段进行存证固定的电子数据,应秉承开放、中立的态度进行个案分析认定。既不能因为区块链等技术本身属于当前新型复杂技术手段而排斥或者提高其认定标准,也不能因该技术具有难以篡改、删除的特点而降低认定标准,而应根据电子数据的相关法律规定综合判断其证据效力;其中应重点审核电子数据来源和内容的完整性、技术手段的安全性、方法的可靠性、形成的合法性,以及与其他证据相互印证的关联度,并由此认定证据效力。”笔者认为,目前经区块链技术存证的证据尚无法直接认可其真实性,原被告对该类证据的真实性仍需对其数据的来源、内容的完整性、技术手段的安全性、方法的可靠性等方面进行论证。笔者相信,随着技术的发展,区块链技术在证据法上的应用可使经其存证的证据满足自我鉴真而无需外来证据另做补强,届时,区块链技术在法律上的应用以及司法机构的认可度都将进一步提升。
参考资料

相关资源