数据集市

来自典枢
Andrew Parno讨论 | 贡献2024年4月26日 (五) 10:01的版本 →‎可用不可见
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索

典枢是一个“更省心的数据集市”。

做为一个数据集市,典枢允许任意的数据卖方在平台上出售数据,也允许任意的数据买方寻找并购买自己所需的数据。典枢是开放的:不但没有设置任何的准入门槛,也没有设置特定的交易数据内容或类别。

在以往,由于数据极易被伪造,数据交易的风险很高,也就是付费之后不一定能购买到卖方所声称的数据。例如,卖方虚报数据大小,虚报数据内容,伪造数据内容等。 类似于“逛集市”时,顾客可以通过观察、触摸、听音、闻味等方式对商品进行验证,在典枢中,买方以如同“逛集市”一样的方式对感兴趣数据的质量或真伪进行验证。例如,一个文本数据声称是某小说,有15000字,那么买方可以验证文本中的某些片段,典枢平台也会提供关于字数、大小等方面的信息;同样的,用户也可以对CSV、视频等数据进行验证,以确保该数据符合自己的预期。目前,典枢提供了一些固定的数据验证方式,未来,典枢还将允许用户按照自己的方式定制数据验证程序。

通过“先验后买”的方式,典枢上的买方总是可以购买到自己预期的数据;这使得卖方也倾向于提供更高质量、更有竞争力的数据。买、卖双方的权益都得到了保护,也有了更繁荣的数据集市。

数据隐私与安全

典枢使用了隐私计算技术保证数据隐私与安全,卖方上传的数据、买方购买的数据对于典枢平台而言是不可见的。具体而言,数据在上传之前,会(使用卖方密钥)进行加密,典枢平台仅存储密文数据,在买方购买数据时,密文数据会基于“二次加密技术”使用买方密钥重新加密,因此整个过程中,数据仅买卖双方可见。更详细的技术原理可以查看技术原理

可用不可见

如前所属,数据对典枢平台是不可见的,但是在某些场景下,卖方希望数据对买方是可用不可见的,即买方仅能基于数据得到一个计算或查询结果,而不能得到整个原始数据。典枢平台基于隐私计算框架提供了对该功能的支持,会在未来的版本中逐步上线相应的功能。

法律与合规

做为一个开放的数据集市,典枢上会出现各种数据,但是由于数据对典枢是不可见的,因此典枢无法对数据内容本身的合规性进行审核。典枢从以下四个方面保证了数据的合规性:

  1. 要求用户在上传数据前保证相应的数据是合规的;
  2. 对平台用户的交易记录进行存证,以确保交易的可追溯性;
  3. 设立举报机制,一旦发现不合规数据,立刻进行下架、封号处理;
  4. 配合相关部门对不合规数据进行处理;