數(shù)據(jù)密集型科研范式下,科學研究越來越依賴大量的、規(guī)范的、可靠的數(shù)據(jù),但可用的大數(shù)據(jù)集難以獨立生成,科學數(shù)據(jù)共享是解決可用數(shù)據(jù)缺乏、實現(xiàn)數(shù)據(jù)潛在價值的重要途徑。在此背景下,有必要進一步關注不同視角下科研人員在日常科研活動中的數(shù)據(jù)共享需求、影響機理、模式及演化博弈策略,并針對特定問題展開實證分析,以豐富科學數(shù)據(jù)領域的研究成果,為后續(xù)研究提供一定的理論參考和實證支持,并為科學數(shù)據(jù)管理與共享實踐提供新思路、新方案。
為此,本書開展了以下工作。第一,分別設計數(shù)據(jù)提供者與使用者雙重視角下的科學數(shù)據(jù)共享需求量表,并利用一手數(shù)據(jù)進行驗證與分析。采用形式概念分析的方法構建使用者需求概念格,提取關聯(lián)規(guī)則,進而揭示不同需求之間的關聯(lián)性。第二,結合社會資本、計劃行為、雙路徑等理論,分別構建雙重視角下科學數(shù)據(jù)共享影響因素理論模型,并展開實證檢驗或仿真分析。第三,初步搭建基于區(qū)塊鏈的數(shù)據(jù)共享模式架構,分析其流程、特點與實現(xiàn)技術。構建數(shù)據(jù)密集型科研范式下的科學數(shù)據(jù)管理模式。第四,結合主體間性理論與演化博弈理論,針對科學數(shù)據(jù)共享活動中的數(shù)據(jù)生產者、數(shù)據(jù)使用者及數(shù)據(jù)管理平臺,構建三方演化博弈模型,探討各主體共享的演化策略與系統(tǒng)演化均衡點。從科技計劃項目科學數(shù)據(jù)匯交政策、科學數(shù)據(jù)與科技文獻的關聯(lián)、科學數(shù)據(jù)管理方面提出共享策略。
本書的主要研究發(fā)現(xiàn)有以下幾點。第一,提供者視角的需求包含數(shù)據(jù)安全、數(shù)據(jù)管理平臺、自我價值實現(xiàn)、社交、利益回報 5個維度,其中,數(shù)據(jù)安全是其最為強烈的需求。從使用者角度來看,數(shù)據(jù)內容質量、數(shù)據(jù)獲取效率及平臺的安全性是焦點需求,且性別與學科背景是造成需求差異的主要因素。第二,提供者的信任、互惠、社會互動正向影響共享態(tài)度,且共享態(tài)度與感知行為控制正向影響共享意愿;數(shù)據(jù)質量正向調節(jié)感知行為控制、共享態(tài)度、主觀規(guī)范與共享意愿之間的關系。此外,信任共享態(tài)度共享意愿路徑是驅動科學數(shù)據(jù)共享的基本邏輯,互惠、社會互動、數(shù)據(jù)質量對信任有顯著的正向影響,而主觀規(guī)范對共享意愿的影響不顯著。不同情境下的信任速率、初始感
科學數(shù)據(jù)共享機理與實證研究
知行為控制、初始共享意愿均對科學數(shù)據(jù)共享意愿產生影響。使用者的感知有用性和感知易用性受到數(shù)據(jù)來源可信度的正向影響,并通過共享意愿影響共享行為,且感知易用性正向影響感知有用性。第三,基于區(qū)塊鏈的去中心化共享模式具有靈活性高、安全性強、可追溯、可信任等優(yōu)勢,可有效促進數(shù)據(jù)共享。在數(shù)據(jù)密集型科研范式下,科學數(shù)據(jù)管理模式的創(chuàng)新與發(fā)展非常重要,構建的新模式有助于更好地實現(xiàn)科學數(shù)據(jù)的價值。第四,各主體受相關收益、成本和風險的影響有所差別,其共同點是兩種策略下的凈收益差值越大越有利于選擇凈收益數(shù)值大的策略。在一定條件下,該三方博弈系統(tǒng)能夠最終穩(wěn)定于數(shù)據(jù)生產者和數(shù)據(jù)使用者均參與共享、數(shù)據(jù)管理平臺積極監(jiān)管的理想狀態(tài)。
本書是團隊對多年研究成果的系統(tǒng)梳理與完善,是集體智慧的結晶。本書由中國科學技術信息研究所科技報告服務與產業(yè)情報研究中心鄭彥寧主任大力指導,支鳳穩(wěn)主筆統(tǒng)稿。團隊的其他成員也做出了突出貢獻,陳佳琪參與第1、第4章的撰寫,孟佳琪參與第2章的撰寫,張萌參與第3、第5、第6、第7、第 8章的撰寫,彭兆祺參與第 4、第 11章的撰寫,趙夢凡參與第 5、第 8、第11、第 12章的撰寫,云仲倫、張閃閃參與第 9章的撰寫,史潔參與第 10章的撰寫,韓夢嬌參與第 11、第 13章的撰寫,書中部分繪圖由徐楊嬌完成,陳佳琪、韓夢嬌、馬小琪參與本書的文字校對工作。
本書是河北省高等學校人文社會科學研究項目元宇宙時代科學數(shù)據(jù)共享模式及其應用研究(項目編號:BJS2022027)、中國博士后基金面上項目科學數(shù)據(jù)共享模式及驅動機制研究(項目編號:2018M641446)和河北省數(shù)字治理與協(xié)同治理研究基地的研究成果之一。另外,本書的出版得到了河北大學管理學院、科學技術文獻出版社的大力支持,在此一并致謝!
第一篇基礎篇 1
第 1章 緒論3
11 研究背景 3 12研究問題與意義 5 13研究思路與方法 6 14研究內容安排 8 15創(chuàng)新之處 9
第 2章國內外研究現(xiàn)狀11
21方法與數(shù)據(jù)來源 11 22國內研究現(xiàn)狀 13 23國外研究現(xiàn)狀 17 24國內外對比 22 25研究評論 23
第 3章科學數(shù)據(jù)共享的理論基礎25
31社會學視角 25 311社會交換理論26 312制度理論26 313仿真理論27
32心理學視角 28 321社會認知理論28 322計劃行為理論28 323雙路徑理論29
33管理學視角 30
331技術接受模型30
332利益相關者理論30 34不同理論視角的比較分析31 35科學數(shù)據(jù)共享的動因、方式與價值33 351科學數(shù)據(jù)共享的動因 33 352科學數(shù)據(jù)共享的方式 34 353科學數(shù)據(jù)共享的價值 34 36整合理論框架構建35
第二篇需求篇 37
第 4章提供者的科學數(shù)據(jù)共享需求分析39
41調查問卷設計與數(shù)據(jù)收集40 411調查問卷設計40 412數(shù)據(jù)來源與預處理 41 413樣本特征描述性統(tǒng)計 41 42數(shù)據(jù)分析 43 421信度檢驗43 422效度檢驗45 43信度重測與最終量表50 44需求分析與討論 51 441提供者的共享需求特征 51 442不同共享意愿提供者的需求對比52
第 5章使用者的科學數(shù)據(jù)共享需求分析55
51科學數(shù)據(jù)共享需求調查56 511問卷設計56 512數(shù)據(jù)收集與樣本特征 57 513數(shù)據(jù)分析與預處理 58 52形式背景與概念格59
521形式背景導出59
522概念格生成61 53關聯(lián)規(guī)則 62 531總體關聯(lián)規(guī)則挖掘 62 532不同類型關聯(lián)規(guī)則挖掘 63 54結果分析與討論 66
第三篇機理篇 69
第 6章提供者科學數(shù)據(jù)共享意愿影響因素實證基于 TSC與 TPB71
61理論進展 72 611社會資本理論72 612計劃行為理論72 62研究假設與理論模型73 621社會資本與共享態(tài)度 73 622計劃行為與共享意愿 75 623數(shù)據(jù)質量的調節(jié)作用 75 624理論模型76 63問卷設計與數(shù)據(jù)收集77 631問卷設計77 632數(shù)據(jù)收集78 64數(shù)據(jù)分析與模型檢驗78 641描述性統(tǒng)計分析78 642信效度分析80 643模型擬合檢驗82 644調節(jié)效應檢驗83 65實證結果分析 83
第 7章提供者科學數(shù)據(jù)共享意愿影響因素實證與仿真基于 SOR和 SD87
71理論進展 88 711共享意愿影響因素 88 712刺激機體反應理論 88 72研究假設與理論模型89 721刺激與機體89 722刺激與反應90 723機體與反應91 724共享態(tài)度與共享意愿 91 73實證檢驗 92 731數(shù)據(jù)獲取92 732描述性統(tǒng)計分析93 733信度與效度檢驗93 734結構方程模型檢驗 95 74系統(tǒng)動力學仿真 96 741存量流量圖構建96 742自然狀態(tài)下的科學數(shù)據(jù)共享意愿仿真98 743不同情境下的科學數(shù)據(jù)共享意愿仿真99 75結果分析與討論 102
第 8章使用者科學數(shù)據(jù)共享行為影響因素實證基于 ELM和 TAM 105
81理論進展 106 811雙路徑模型106 812技術接受模型107 82研究假設與理論模型108 821科學數(shù)據(jù)質量與感知有用性、感知易用性108 822數(shù)據(jù)來源可信度與感知有用性、感知易用性108 823感知易用性與感知有用性 109
824感知有用性、感知易用性與共享意愿109
825共享意愿與共享行為 110 826理論模型構建110 83問卷設計與數(shù)據(jù)收集111 831問卷設計111 832數(shù)據(jù)收集113 84數(shù)據(jù)分析和模型檢驗113 841描述性統(tǒng)計分析113 842信度分析115 843效度分析115 844模型檢驗117 85實證結果分析 118
第四篇模式篇 121
第 9章基于區(qū)塊鏈的科學數(shù)據(jù)共享模式 123
91理論進展 124 911個人科學數(shù)據(jù)共享 124 912區(qū)塊鏈應用于科學數(shù)據(jù)共享的相關研究124 92現(xiàn)有共享模式的問題分析126 921數(shù)據(jù)確權問題126 922數(shù)據(jù)安全問題126 923隱私保護問題127 924數(shù)據(jù)標準不統(tǒng)一問題 127 925數(shù)據(jù)近似化問題127 926激勵機制問題128 93基于區(qū)塊鏈的科學數(shù)據(jù)共享模式構建128 931模式架構模型128 932模式所涉及的具體流程 130 933模式特點分析130
94共享模式實現(xiàn) 132
941區(qū)塊鏈與 SQL數(shù)據(jù)庫結合實現(xiàn)分布式數(shù)據(jù)存儲132
942基于 SQL的智能合約激勵共享參與主體133 943萬能數(shù)據(jù)結構表實現(xiàn)數(shù)據(jù)標準化134 944加密算法實現(xiàn)數(shù)據(jù)可用不可見135 945共識機制控制數(shù)據(jù)調用規(guī)模 136
第 10章數(shù)據(jù)密集型科研范式下的科學數(shù)據(jù)管理模式 139
101傳統(tǒng)科學數(shù)據(jù)管理模式139 102新范式對科學數(shù)據(jù)管理模式的新要求140 1021整合數(shù)據(jù)資源,建立數(shù)據(jù)關聯(lián)性140 1022管理模式智能化、動態(tài)化 141 1023應用新興技術,挖掘潛在價值 141 103不同生命周期階段的科學數(shù)據(jù)管理任務 141 1031數(shù)據(jù)產生與采集143 1032數(shù)據(jù)處理與分析143 1033數(shù)據(jù)描述與組織143 1034數(shù)據(jù)保存與歸檔144 1035數(shù)據(jù)發(fā)布與共享144 1036數(shù)據(jù)挖掘與再利用 145 104新范式下科學數(shù)據(jù)管理模式構建145 1041科學數(shù)據(jù)管理過程 146 1042科學數(shù)據(jù)管理手段 147 1043科學數(shù)據(jù)管理與共享機制 147
第五篇策略篇 149
第 11章科學數(shù)據(jù)共享主體的演化博弈策略 151
111理論發(fā)展 152 1111主體間性理論152
1112演化博弈理論153
112演化博弈模型構建154 1121問題描述154 1122模型假設156 1123收益矩陣158 113模型演化穩(wěn)定分析159 1131數(shù)據(jù)生產者159 1132數(shù)據(jù)使用者161 1133數(shù)據(jù)管理平臺163 1134三方博弈系統(tǒng)165 114數(shù)值仿真與驗證 168 1141三方博弈系統(tǒng)的演化路徑 169 1142不同參數(shù)對各主體策略選擇的影響172 115結果分析與啟示 175
第 12章促進科學數(shù)據(jù)共享的策略建議 179
121完善科學數(shù)據(jù)匯交政策179 1211具體化涉密數(shù)據(jù)的匯交辦法 179 1212增強數(shù)據(jù)匯交政策的創(chuàng)新性 180 1213完善數(shù)據(jù)匯交的評價體系 181 1214健全數(shù)據(jù)匯交的激勵機制 181 1215嚴格數(shù)據(jù)匯交制度 182 122強化科學數(shù)據(jù)與科技文獻的關聯(lián)182 1221完善科學數(shù)據(jù)相關政策體系 182 1222豐富科學數(shù)據(jù)平臺的服務功能 183 1223增加可關聯(lián)文獻的類型 185 1224加強相關主體之間的合作 185 123加強科學數(shù)據(jù)管理與共享186 1231完善相關框架、設施與政策 187 1232增強科學數(shù)據(jù)平臺的安全性與透明性187 1233加大科研資助機構支持力度 188
1234加強對數(shù)據(jù)共享的宣傳、管理與保護188
1235注重數(shù)據(jù)質量與安全 189 1236提升科學數(shù)據(jù)重用意愿 189
第六篇總結篇 193
第 13章研究總結與展望 195
131主要研究結論 195 132研究貢獻 196 133研究不足與展望 196
參考文獻 199