京东万象推数据溯源 邀约共建数据共享公约组织

 中国电子报、电子信息产业网  作者:李佳师
发布时间:2017-02-20
放大缩小

         

推动大数据应用,大数据的流通和交易是关键的环节,但由于大数据交易缺乏相应的法律法规、尚未形成完整生态链等诸多因素都使得大数据交易和流通不那么容易。究竟应该如何来破解大数据交易和流通难题。日前,《中国电子报》记者采访了京东万象总经理杜宇甫。杜宇甫透露,京东万象在2017年推出数据溯源服务、个人授权服务等五大核心产品,同时,联合业内百余家企业共同成立中国数据共享公约组织。

五大难题阻碍数据交易

眼下,包括数据定价到数据红线、数据交易规则等都被认为是影响数据交易的因素。杜宇甫认为,在数据流通的环节有五个问题影响着其发展。

第一是版权问题。数据与其他产品不同,复制成本及其低廉,盗版问题极其严重。在这种情况下,会有很多拥有数据的企业,不愿意把自己的数据贡献出来,如果没有很好的数据版权保护机制,数据广泛流通的愿望将形如泡影。

第二是应用指导问题。今天,我们言必谈大数据,动辄说数据就是资源,数据要变成价值。然而,什么样的数据在什么样的时间会变成什么样的价值?很多时候,企业并不清楚。BATJ这样的企业可以做的很好,但小企业也想利用数据,很多时候却无从下手。

第三是合规性问题。数据行业的人都清楚,必须强授权的个人数据交易是违法行为,但很多的业务场景中却对个人数据有强烈的诉求。当我们想通过个人数据产生更大价值的时候该怎么办?

第四是集成应用问题。任何事物都有一定的门槛,大数据作为当今炙手可热的新技术之一,对于很多企业而言,并非易事,在选择了数据之后,还要面对集成、分析等一系列问题。企业想要快速地让数据产生价值,需要投入更多的资源,甚至借助外力来实现。

第五是数据质量问题。和实物商品一样,数据作为商品进行流通时,同样存在质量问题,且数据质量比实物商品更难界定。很多数据的质量无从知晓,数据使用方需要通过大量的测试来验证所需数据的质量,不仅耗时耗力,很多时候还难以避免空手而归的尴尬结果。

大数据流通交易需要强大技术支撑

要破解这些问题,杜宇甫认为应该从宏观的政策及微观的技术两大层面来解决。比如大数据的合规问题,需要政府制定政策来解决,究竟哪些数据可以流通,哪些数据不能交易,哪些数据可以开放,哪些数据必须保密等作出明确规定。对大数据而言,落地离不开技术。我们可以看到,即便是传统意义上的物品流通,也在随着技术的发展变革而不断变革,不论B2C、C2C、O2O还是C2F,都离不开技术的支撑。大数据本身技术含量就非常高,因此想要推动其流通,更需要强大的技术支撑来实现。

有观点表示,现在大数据之所以难以流通还有一个因素是缺乏完整价值交易链。杜宇甫表示,说到交易,无外乎买卖东西。其种有几个关键,一个是数据源,巧妇难为无米之炊,如果没有数据,谈何数据流通。目前很多有价值的数据没有真正意义上实现数据开放,导致黑色数据地下交易暗涌激荡,正当的交易反而不敢摆在台面上进行。另一个是买和卖,在此不得不重提版权问题。传统买卖是物权转移,数据买卖则不尽然,如何建立整套的数据版权保障体系,避免数据流通后的泄露、窃取、篡改、复制等问题,关乎数据流通发展的命脉。

因此,完善大数据交易价值链,得充分开放数据,得让交易变得阳光透明。

谈到大数据交易的价格体系,杜宇甫表示,由于数据商品的特殊性,同样的数据之于不同的企业,价值差异很大,然而流通既然存在,价格自然就要存在。就目前而言,数据交易仍以用户定价为多。但相信随着市场的不断成熟,数据商品定价最终会回归市场机制,让数据回归合理价位。即依照二八法则,让数据商品价格可以保障大多数数据提供者的利益,满足大多数数据使用者能的预期。可以说,所有的商品都是随着市场定价,不论是实物商品、虚拟商品,相信数据商品最终也是一样。

最近,国家发改委正式批复“将建大数据流通与交易技术国家工程实验室”,杜宇甫认为这个实验室要解决这些核心问题:首先让有价值的数据真正开放流通,其次要让流通的数据真正产生价值,最后要让更多实体从数据中真正受益。

京东万象提供五大核心数据产品和服务

目前,数据交易流通的主要形式是通过API,但我们对数据API性能到底了解多少呢?当它出现问题的时候,我们是不是能第一个知道是不是能够及时止损?这都是问题,我相信只要用过,这个问题都能碰到过。杜宇甫说:“我2011年加入京东,做的是开放平台,面对几百个API,在京东API一旦出现问题就会掉脑袋。所以我们一定要监控每个API的质量性能,它的最大响应时间,最小响应时间,并发量、吞吐量等等,同时还需要对数据的调用情况进行分析,针对负载进行必要的调整。”

杜宇甫谈到了区块链技术,区块链作为一种新型去中心化协议,能够安全透明地记录交易或其它数据,且记录不能被篡改。因此,京东万象采用区块链技术后,无需第三方认证,即具有可确权、可溯源的功能。通过采用区块链技术,京东万象平台把数据变成受保护的虚拟资产,每笔交易和数据都有确权证书。而未经许可的盗卖没有确权证书,或者证书与区块链确权不匹配,数据提供方就可要求法律保护。此举将通过凸显正版数据价值,打击盗卖,重塑数据市场的流通规则,激发数据交易的积极性,促进流通的繁荣。

据杜宇甫介绍,目前京东万象主要提供的技术和服务主要包括:个人数据授权:主要基于公安部eID(网络身份证)技术的个人身份认证授权服务,实现全网个人数据的安全、可信、合法流通。数据行业图谱:基于图计算及图形数据库技术,形成数据类目与不同行业间的流通关系动态热力图谱,实现全行业数据使用经验的可视化展现及实时性优化。数据确权溯源:基于区块链的数据资产确权及流通溯源服务,实现数据共享流通过程中的正版数据保护以及交易合法化。灵活数据集成:基于QL语言的调用服务:实现多数据接口高效集成,提高开发效率,提高可维护性,降低性能损耗。数据质量体系:基于API技术指标,数据接口使用效果评估管理、监控告警服务,实现数据接口技术质量标准的客观评判。

京东万象自2016年全面对外推广以来,已拥有300+个数据提供商,1,000+个数据源,100+个数据子类目,数据产品覆盖金融、通信、交通、营销、应用开发、商贸、机器学习、海关贸易等多个数据领域。且在2017年初推出数据溯源服务、个人授权服务等五大核心产品,致力解决数据流通行业重点问题。同时,京东将联合业内百余家企业共同成立中国数据共享公约组织。


来源:中国电子报、电子信息产业网            责任编辑:李佳师
分享到:
0