2. 云南省区块链应用技术重点实验室, 昆明 650233
2. Blockchain Application Technology Key Laboratory of Yunnan Province, Kunming 650233, China
开放科学(资源服务)标志码(OSID):
在大数据时代,数据流动和信息共享对人类科技进步至关重要,数据共享社区是促进科学数据开放共享的重要载体[1-2]。近年来,我国在促进科学数据共享方面出台了一系列举措,然而,最近的一项调查研究结果表明,我国的研究人员虽有分享数据的意愿,但也担心数据被误用以及版权和许可受到侵犯[3],最终绝大多数学者都不愿意分享自己的数据,即无意愿开放共享,导致数据缺乏流动性,无法有效发挥数据共享社区的功能和优势。共享社区长期缺乏有效且科学的激励机制,普遍面临用户参与积极性低、归属感弱、知识生成动力不足、数据共享程度低等挑战,缓解这一问题的关键是构建一个合理有效的数据共享模型[4]。
区块链技术[5-6]的出现为解决数据共享所面临的问题提供了新的思路。区块链的本质是一个分布式账本,账本上的每一笔交易都由区块链网络上的各个节点来查看和验证。首先,区块链的分布式特性保证了数据共享流通的透明性,用户可以清晰地看到自己的数据流通过程,防止数据信息被滥用的情况发生;再次,利用区块链智能合约自动执行的特性,可以将数据共享的激励机制写入智能合约,将奖励与惩罚信息公开,规范流程从而实现奖惩透明;最后,区块链也解决了数据共享过程中的确权问题,通过区块链,所有的数据都可以逐一溯源,既可以保证数据的归属权,又可以检验数据信息的真伪。因此,将区块链与数据共享相结合,可以扩大数据规模,规范数据管理流程,实现对共享数据的确权,从而建立一个开放的数据共享生态体系。
当前,数据共享被越来越多的学者关注,其中的一个研究热点便是激励机制。庄倩等[7]建立了一种参与科学数据共享的科研人员的演化博弈模型,通过该模型分析数据共享的演化过程。WEN等[8]提出一种基于讨价还价理论的群智感知激励机制,其着重研究数据质量对数据收集者的影响。郝世博等[9]使用区块链以及智能合约,从技术维度来解决数据共享中所存在的信任问题。石进等[10]在其提出的基于区块链的中小企业竞争情报共享平台模型中,采用信用积分制度激励用户进行共享。张宝等[11]也提出了基于智能合约的积分激励体制,当用户上传数据或数据被查看时奖励用户积分,以此来激励用户共享数据。张旺等[12]通过双向委托代理分析,验证了在不承担风险的情况下,选择不共享策略能够最大限度地减少共享成本,从而说明了激励机制在数据共享中的重要性。GAN等[13]提出一种基于区块链的eHealth系统,并在该系统中根据医疗数据的质量以及患者参与共享的积极性来对患者进行激励。SHEN等[14]在研究多云数据共享时,利用Shapley值构建一个动态公平的激励方案,为多云数据共享协作提供了一种收入分配方法。SHRESTHA等[15]在建立一个基于区块链的共享平台的基础上,构建一种在以太坊上部署智能合约的用户激励模型。LI等[16]在设计一个基于区块链的车载人群感知框架时,提出一种基于用户声誉的激励机制,其在确保公平交易的同时提高了数据的质量。梁小燕[17]为促进医疗机构数据共享,提出一种基于信息熵的医疗数据共享激励机制,通过计算信息熵来判断信息的价值,并提出基于Shapley值的利益分配策略。蔡婷等[18]提出一个高效的区块链物联网数据激励共享框架ShareBC,并在此框架中设计了一种基于层次数据拍卖模型的激励机制。王倩等[19]基于区块链技术与演化博弈论,构建一种面向科技服务数据共享策略的智能合约激励机制。
虽然已有很多学者提出了各种不同的激励机制,但是这些激励机制仍然存在局限性,例如,某些激励机制不能满足用户的需求,导致用户在该机制下没有数据共享的意愿,或激励机制的奖励过多导致社区通货膨胀,从而使奖励贬值,短时间内虽然可以激励用户进行数据共享,但是该激励并不能长期保持。针对上述问题,本文建立一种基于演化博弈论的数据共享激励模型EGDSI,从数据共享社区的角度设计合理的激励机制,以促进数据的收集、流通和使用。
1 基于演化博弈论的数据共享激励模型早期的博弈论认为所有的参与者均是完全理性的[20],他们总是能思考所有情况,最终选择对自己最有利的方案。完全理性的人总是会遵行优势策略,即玩家从不会在决策时考虑其他玩家对他们的决定会如何回应。完全理性的人是完全的个人主义者,但在现实生活中,完全理性是很难达到的[21]。
演化博弈论是将达尔文的生物进化论与博弈论相结合,其不再要求参与人完全理性,而是假定参与人有限理性,所谓的有限理性是指博弈方可以对所处的不同环境进行学习、试错和模仿,在这个过程中动态调整自己的策略,从而寻找最优方案。在数据共享社区中,用户具有共享与不共享这2种行为策略,用户之间会相互影响,即利用有限的认知和信息获取能力,通过不断地学习和模仿他人策略来调整自身策略,以此实现自身利益最大化。
1.1 模型构建数据共享是一个动态选择及学习调整的过程,为了构建模型和简化计算,本文进行如下假设:
1)演化博弈双方具有相同的主体,即数据共享社区的用户,他们具有相同的策略空间
2)在数据共享的过程中,用户需要付出一定的成本,此处的成本包括但不限于数据制作的时间成本、数据被滥用的经济成本等。在本文模型中,数据成本记为
3)假定在博弈的初级阶段,主体
4)用户上传数据会给他们带来一些效用收益,该效用收益与用户在社区内的等级以及数据成本
5)假定
6)收益函数是指每个参与人在参与博弈时依据其所属类型和选择的策略可获得的收益。本文采取对数收益函数ln(以e为底数的对数函数)来计算收益,该函数特征符合现实社会经济学特征,即收益是有一定增长抑制的,不会随着成本的增加而无限提高,最大收益总会趋近于某一阈值[22]。
7)在数据共享社区中,为了鼓励用户共享数据,需要一定的外部激励奖励
本文基于演化博弈论的数据共享激励模型EGDSI是一个二元组的形式,表示为
根据上述假设,成本收益
$ B=l\cdot \mathrm{l}\mathrm{n}(1+G), l\in \{\mathrm{1, 2}, \mathrm{3, 4}, 5\}, G > 0 $ | (1) |
其中:
共享收益
$ y=\alpha \cdot \mathrm{l}\mathrm{n}(1+G), \alpha > 0 $ | (2) |
博弈双方的收益矩阵如表 1所示,其中,上方为
![]() |
下载CSV 表 1 数据共享博弈收益矩阵 Table 1 Data sharing game revenue matrix |
收益矩阵的含义如下:
1)情况1。进行博弈的双方主体都选择
2)情况2。进行博弈的双方主体一个选择
3)情况3。进行博弈的双方主体均选择
在EGDSI模型中,由于参与主体均是有限理性的,因此在博弈开始阶段不可能直接达到纳什均衡状态,需要一个演化模拟学习他人策略的过程,以进行动态调节并反复尝试,最终达到一种最优的平衡状态,实现整体利益的最大化。
1.2 演化稳定策略分析在演化博弈论中,假设使用该策略的个体在群体中所占比例的增长率等价于群体中使用某个策略的个体适应度,只要一个策略的个体适应度比群体的平均适应度高,则使用该策略的个体数就会增加,且不会被其他策略入侵[23]。
由前文假设可知,在博弈的初级阶段
$ \begin{array}{l}{U}_{\left(t\right)}^{1}={p}_{\left(t\right)}[l·\mathrm{l}\mathrm{n}(1+G)+\alpha ·\mathrm{l}\mathrm{n}(1+G)-I]+\\\;\;\;\;\;\; \;\;\;(1-{p}_{\left(t\right)})[l·\mathrm{l}\mathrm{n}(1+G)-I]\end{array} $ | (3) |
选择不共享数据策略的期望收益为:
$ {U}_{\left(t\right)}^{2}={p}_{\left(t\right)}[l·\mathrm{l}\mathrm{n}(1+G\left)\right]+(1-{p}_{\left(t\right)})[l·\mathrm{l}\mathrm{n}(1+G\left)\right] $ | (4) |
数据共享社区的平均期望收益为:
$ {\stackrel{-}{U}}_{\left(t\right)}={p}_{\left(t\right)}·{U}_{\left(t\right)}^{1}+(1-{p}_{\left(t\right)})\cdot {U}_{\left(t\right)}^{2} $ | (5) |
因此,计算出复制动力学方程[24]为:
$ {Y}_{\left({p}_{\left(t\right)}\right)}={p}_{\left(t\right)}·\mathrm{ }({U}_{\left(t\right)}^{1}-{\stackrel{-}{U}}_{\left(t\right)}) $ | (6) |
化简得:
$ {Y}_{\left({p}_{\left(t\right)}\right)}={p}_{\left(t\right)}·\mathrm{ }(1-{p}_{\left(t\right)})\mathrm{ }·\mathrm{ }\left(\right(\alpha ·\mathrm{l}\mathrm{n}(1+G)){p}_{\left(t\right)}-I) $ | (7) |
令
$ {p}_{1}^{\mathrm{*}}=0 $ | (8) |
$ {p}_{2}^{\mathrm{*}}=1 $ | (9) |
$ {p}_{3}^{\mathrm{*}}=\frac{I}{\alpha ·\mathrm{l}\mathrm{n}(1+G)} $ | (10) |
上述演化稳定点在条件成立的情况下就是演化稳定策略(Evolutionarily Stable Strategy,ESS)的稳定状态。一种演化稳定策略一旦确立,就会稳定下来,偏离演化稳定策略的行为或个体将会被自然选择所淘汰。
如果一个点为稳定状态,那么一定满足
$ \begin{array}{l}{Y}_{\left({p}_{\left(t\right)}\right)}^{{'}}=-3(\alpha \cdot \mathrm{l}\mathrm{n}(1+G\left)\right)\cdot ({p}_{\left(t\right)}{)}^{2}+\\\;\;\;\;\;\;\;\; 2\cdot [I+\alpha \cdot \mathrm{l}\mathrm{n}(1+G\left)\right]{p}_{\left(t\right)}-I\end{array} $ | (11) |
分别将
$ {Y}_{\left(0\right)}^{{'}}=-I $ | (12) |
$ {Y}_{\left(1\right)}^{{'}}=I-\alpha \cdot \mathrm{l}\mathrm{n}(1+G) $ | (13) |
$ {Y}_{\left(\frac{I}{\alpha \cdot \mathrm{l}\mathrm{n}(1+G)}\right)}^{{'}}=\frac{I(\alpha \cdot \mathrm{l}\mathrm{n}(1+G)-I)}{\alpha \cdot \mathrm{l}\mathrm{n}(1+G)} $ | (14) |
演化稳态点
1)条件1。
假设
(1)对于
(2)对于
(3)对于
条件1说明:在
2)条件2。
假设
(1)对于
(2)对于
(3)对于
条件2说明:
3)条件3。
假设
(1)对于
(2)对于
(3)对于
条件3说明:
从条件1~条件3可以看出,数据共享的演化稳定策略并不唯一。参与数据共享和不参与数据共享均具有演化潜力。EGDSI模型演化稳定策略的趋势如图 1所示。
![]() |
Download:
|
图 1 EGDSI模型演化稳定策略趋势 Fig. 1 Trend of EGDSI model evolutionarily stable strategy |
为了促使更多人参与到数据共享中,有必要根据数据共享程度对激励/成本
社区用户在每一个博弈阶段都对应一个参与成本,这会导致每一阶段的阈值
![]() |
Download:
|
图 2 社区成员博弈阶段流程 Fig. 2 Community members game stage process |
数据共享模板引擎(Data Sharing Incentive Template Engine,DSITE)将EGDSI模型以区块链智能合约的形式在数据共享社区中进行应用。智能合约是可以在区块链上自动执行的特殊程序,其程序代码及数据均存储在链上,具有防篡改等特性,所有节点必须按照智能合约预置的触发条件和相应规则进行计算。基于上述特性,可以在数据共享社区中将数据共享激励机制写入智能合约,用户在社区内进行数据共享时,会自动触发执行数据共享模板引擎进行共享激励,从而为数据共享激励提供可信、安全的保障。
由于EGDSI模型假定所有参与博弈方的本质都是相同的,因此与所有博弈方相关的参数也应相同。参数设定如表 2所示。
![]() |
下载CSV 表 2 参数设定 Table 2 Parameters setting |
数据共享激励的计算过程如下:
步骤1 初始化全局参数信息,包括数据成本
步骤2 根据当前博弈阶段
步骤3 计算出当前时间参与数据共享人数占数据共享社区总人数的比例
步骤4 返回相应的数据共享成本
算法1 DSITE智能合约-数据共享激励算法
输入
Data cost of uploaded data,
Data sharing cost parameter sequence,
Data sharing incentives,
Data sharing saturation rate,
Cost index used in the current stage,
输出
Cost or incentive,
1.
2.
3.
4. if
5.
6. else
7. if
8.
9.
10. end if
11.
12. end if
13. return
算法1解释说明:当数据共享社区用户参与数据共享时,会自动触发上述智能合约,调用其方法。首先,计算参与共享的用户比例,通过数组寻找当前博弈阶段下的成本并计算该成本下的阈值,如果参与共享的用户比例小于阈值,则返回相应的激励;如果大于阈值,再判断当前共享用户比例是否大于饱和率,本文设定饱和率为98%,如果达到了当前的社区数据共享饱和率,则进入下一阶段的演化博弈,重置相应的参数,最后返回相应的数据共享成本。值得注意的是,计算激励/成本是一个取模运算,这是因为需要动态调整激励/成本,以重置社区用户博弈阶段,而数组本身不可能无穷大,因此采用取模运算,这也体现了社区成员数据共享相互博弈的一个过程。
3 实验验证本节通过控制变量法设计不同的横向与纵向对比实验,分析EGDSI数据共享模型中的3个演化稳定策略条件,验证数据共享激励模型对社区演化稳定所起的作用,并将EGDSI模型与其他数据共享演化博弈模型进行对比。
3.1 演化稳定策略验证分析1.2节通过演化博弈论求解演化稳定策略,推导出条件1~条件3。本节通过模拟实验验证其结论的正确性。为满足条件1~条件3,对条件参数进行设置,具体如表 3所示。
![]() |
下载CSV 表 3 条件参数设置 Table 3 Condition parameters setting |
通过Matlab进行演化模拟仿真,针对条件1,其演化曲线如图 3所示。
![]() |
Download:
|
图 3 条件1的演化曲线 Fig. 3 Evolution curves of condition 1 |
共享收益缩放系数
针对条件2与条件3,可得演化曲线如图 4所示。当设定共享收益缩放系数
![]() |
Download:
|
图 4 条件2与条件3的演化曲线 Fig. 4 Evolution curves of condition 2 and condition 3 |
为了证明激励机制在用户选择决策时是否发挥促进数据共享的作用,设定共享收益缩放系数
![]() |
下载CSV 表 4 激励机制条件参数设置 Table 4 Incentive mechanism condition parameters setting |
使用上述参数可得EGDSI演化曲线如图 5所示。由条件1可知,不同的激励/成本
![]() |
Download:
|
图 5 EGDSI激励模型演化曲线 Fig. 5 Evolution curves of EGDSI excitation model |
本文提出一种基于演化博弈论的数据共享激励模型EGDSI,目的是为了进一步促进数据的收集、共享与流通。文献[19]针对数据共享激励提出一种EGI模型,EGI模型对共享成员的等级未进行划分,没有考虑个体之间奖励的差异性,所有共享成员均采用相同的激励机制对数据共享进行奖励。本节对这2种模型进行对比,设定共享收益缩放系数
![]() |
Download:
|
图 6 2种模型的数据共享演化曲线对比 Fig. 6 Comparison of data sharing evolution curves of two models |
由图 6可知,在不同的初始共享比例情况下,本文模型达到数据共享饱和状态的速度均优于EGI模型,即本文模型可以在更早的博弈阶段达到数据共享,提升数据共享的效率,其具有更好的激励作用。
4 结束语数据共享社区普遍面临用户参与积极性低、归属感弱、缺乏相应数据共享激励机制等问题,为此,本文构建一种基于演化博弈论的数据共享激励模型,并在已有的区块链共享平台上利用智能合约技术实现该模型所对应的智能合约数据共享激励引擎。仿真结果表明,该模型可以在数据共享社区中激励更多用户参与数据共享,进一步促进数据的收集、流通和使用。下一步将结合可信数据共享与安全存储相关技术,提升数据在共享过程中的访问权限控制,防止数据非授权访问等风险发生,同时提高数据在共享社区存储时的安全性与隐私性。
[1] |
MUKHERJEE M, MATAM R, SHU L, et al. Security and privacy in fog computing: challenges[J]. IEEE Access, 2017, 5: 19293-19304. DOI:10.1109/ACCESS.2017.2749422 |
[2] |
毕达天, 曹冉, 杜小民. 科学数据共享研究现状与展望[J]. 图书情报工作, 2019, 63(24): 69-77. BI D T, CAO R, DU X M. A summary of researches on research data sharing and development trends at home and abroad[J]. Library and Information Service, 2019, 63(24): 69-77. (in Chinese) |
[3] |
胥婷, 于广军. 国内健康医疗数据开放共享现状研究[J]. 中国数字医学, 2020, 15(9): 64-66, 103. XU T, YU G J. Research on the current situation of open access and sharing of health and medical data in China[J]. China Digital Medicine, 2020, 15(9): 64-66, 103. (in Chinese) DOI:10.3969/j.issn.1673-7571.2020.09.020 |
[4] |
WANG Z, TIAN Y L, ZHU J M. Data sharing and tracing scheme based on blockchain[C]//Proceedings of the 8th International Conference on Logistics, Informatics and Service Sciences. Washington D. C., USA: IEEE Press, 2018: 1-6.
|
[5] |
NOFER M, GOMBER P, HINZ O, et al. Blockchain[J]. Business & Information Systems Engineering, 2017, 59(3): 183-187. |
[6] |
张亮, 刘百祥, 张如意, 等. 区块链技术综述[J]. 计算机工程, 2019, 45(5): 1-12. ZHANG L, LIU B X, ZHANG R Y, et al. Overview of blockchain technology[J]. Computer Engineering, 2019, 45(5): 1-12. (in Chinese) |
[7] |
庄倩, 何琳. 科学数据共享中科研人员共享行为的演化博弈分析[J]. 情报杂志, 2015, 34(8): 152-157, 168. ZHUANG Q, HE L. Analysis of scientific researchers sharing behavior based on evolutionary game theory[J]. Journal of Intelligence, 2015, 34(8): 152-157, 168. (in Chinese) DOI:10.3969/j.issn.1002-1965.2015.08.029 |
[8] |
WEN Y T, SHI J Y, ZHANG Q, et al. Quality-driven auction-based incentive mechanism for mobile crowd sensing[J]. IEEE Transactions on Vehicular Technology, 2015, 64(9): 4203-4214. DOI:10.1109/TVT.2014.2363842 |
[9] |
郝世博, 徐文哲, 唐正韵. 科学数据共享区块链模型及实现机理研究[J]. 情报理论与实践, 2018, 41(11): 57-62. HAO S B, XU W Z, TANG Z Y. Research on blockchain model and implementation mechanism of scientific data sharing[J]. Information Studies: Theory & Application, 2018, 41(11): 57-62. (in Chinese) |
[10] |
石进, 邵波, 苗杰. 基于区块链的中小企业竞争情报共享平台研究[J]. 图书情报工作, 2019, 63(20): 112-120. SHI J, SHAO B, MIAO J. Research on competitive intelligence sharing platform for SME based on blockchain[J]. Library and Information Service, 2019, 63(20): 112-120. (in Chinese) |
[11] |
张宝, 王梦寒. 基于区块链技术的数据共享新模式[J]. 当代金融家, 2019(10): 121-123. ZHANG B, WANG M H. A new data sharing model based on blockchain technology[J]. Modern Bankers, 2019(10): 121-123. (in Chinese) |
[12] |
张旺, 程慧平. 科学数据开放共享策略机制及优化路径研究[J]. 情报杂志, 2020, 39(5): 154-161. ZHANG W, CHENG H P. Research on open sharing strategy mechanism and optimization path of scientific data[J]. Journal of Intelligence, 2020, 39(5): 154-161. (in Chinese) |
[13] |
GAN C Q, SAINI A, ZHU Q Y, et al. Blockchain-based access control scheme with incentive mechanism for eHealth systems: patient as supervisor[J]. Multimedia Tools and Applications, 2021, 80(20): 30605-30621. |
[14] |
SHEN M, DUAN J X, ZHU L H, et al. Blockchain-based incentives for secure and collaborative data sharing in multiple clouds[J]. IEEE Journal on Selected Areas in Communications, 2020, 38(6): 1229-1241. |
[15] |
SHRESTHA A K, VASSILEVA J, DETERS R. A blockchain platform for user data sharing ensuring user control and incentives[J]. Frontiers in Blockchain, 2020, 3: 497985. |
[16] |
LI F, FU Y C, ZHAO P C, et al. An incentive mechanism for nondeterministic vehicular crowdsensing with blockchain[C]//Proceedings of 2020 IEEE/CIC International Conference on Communications in China. Washington D. C., USA: IEEE Press, 2020: 1074-1079.
|
[17] |
梁小燕. 区块链环境下基于信息熵的医疗数据共享激励机制[D]. 兰州: 西北师范大学, 2020. LIANG X Y. Incentive mechanism of medical data sharing based on information entropy in blockchain environment[D]. Lanzhou: Northwest Normal University, 2020. (in Chinese) |
[18] |
蔡婷, 林晖, 陈武辉, 等. 区块链赋能的高效物联网数据激励共享方案[J]. 软件学报, 2021, 32(4): 953-972. CAI T, LIN H, CHEN W H, et al. Efficient blockchain-empowered data sharing incentive scheme for Internet of Things[J]. Journal of Software, 2021, 32(4): 953-972. (in Chinese) |
[19] |
王倩, 徐尚英, 陈冬林, 等. 面向科技服务数据共享策略的智能合约激励机制研究[J]. 情报杂志, 2021, 40(10): 157-165. WANG Q, XU S Y, CHEN D L, et al. Research on smart contract incentive mechanism oriented to sci-tech services data sharing strategy[J]. Journal of Intelligence, 2021, 40(10): 157-165. (in Chinese) |
[20] |
COLMAN A M. Cooperation, psychological game theory, and limitations of rationality in social interaction[J]. The Behavioral and Brain Sciences, 2003, 26(2): 139-153. |
[21] |
朱雅敏, 魏永波. 完全理性到有限理性: 博弈论理性基础的变更[J]. 科技视界, 2015(27): 165-166. ZHU Y M, WEI Y B. Complete rationality to bounded rationality: the change of the rational basis of game theory[J]. Science and Technology Vision, 2015(27): 165-166. (in Chinese) |
[22] |
SENGUPTA S, CHATTERJEE M. An economic framework for dynamic spectrum access and service pricing[J]. ACM Transactions on Networking, 2009, 17(4): 1200-1213. |
[23] |
张维迎. 博弈论与信息经济学[M]. 上海: 上海人民出版社, 2004. ZHANG W Y. Game theory and information economics[M]. Shanghai: Shanghai People's Publishing House, 2004. (in Chinese) |
[24] |
FUDENBERG D, DREW F, LEVINE D K, et al. The theory of learning in games[M]. Cambridge, USA: MIT press, 1998.
|
[25] |
FRIEDMAN D. Evolutionary games in economics[J]. Econometrica, 1991, 59(3): 637-666. |