国际期刊对二手数据(Secondary Data)使用时的伦理要求

B站影视 内地电影 2025-09-19 16:38 1

摘要:与直接从人类参与者那里收集数据(原始数据)相比,二手数据的收集不需要面对面的接触参与者,可以:

与直接从人类参与者那里收集数据(原始数据)相比,二手数据的收集不需要面对面的接触参与者,可以:

- 更好地了解研究课题: 二手数据可用于提供研究课题的来龙去脉和背景信息。这有助于研究人员了解其研究的历史和社会背景,并深入了解相关变量和关系。

- 节省时间和资源: 收集新的原始数据既费时又费钱。使用现有的二手数据源可以让研究人员获得已经收集和整理过的数据,从而节省时间和资源。

- 提供比较数据: 二手数据可用于比较和对比不同研究或数据集的发现。这可以帮助研究人员识别单项研究中可能并不明显的趋势、模式和关系。

- 补充原始数据: 第二手数据可用于补充第一手数据,提供第一手研究未捕捉到的额外信息或见解。这可以帮助研究人员更全面地了解研究主题。

但需要注意的是,与人类受试者有关的二手数据通常需要伦理批准,这取决于数据的来源和性质。

下面介绍了与使用二手数据有关的一些伦理问题:

· 二手数据包括个人数据(与可识别的在世者有关的数据)的项目必须获得伦理批准。

· 与死者有关的数据

当数据与已故人类受试者有关时,如果数据包括以下内容之一,则需要伦理批准:

- 涉及在世人类研究对象的敏感个人数据

- 与过去 100 年的健康或人口普查信息有关的数据。

而且,如果这些数据能识别或可能识别已故个人或其他人的身份。

需要进行伦理审查的原因包括

- 敏感的个人数据可能会对在世的亲属产生影响

- 某些数据可能受数据保护法保护。

匿名数据

完全可靠的匿名数据不包含个人数据,因此通常不需要伦理审查和批准。

为避免疑义,这指的是已经匿名化的数据,而不是以可识别或假名形式接收,然后由研究人员匿名化的数据。

不过,在涉及匿名数据的某些情况下,可能需要获得伦理批准(如果您不确定,请与机构伦理委员会讨论):

有可能重新识别个人身份的数据

如果数据可能被用于重新识别个人身份,则可能需要申请伦理审查。

例如:

合并数据--合并数据可能会导致重新识别个人身份,尤其是在通过匹配唯一参考号或数据点在个人层面进行数据关联的情况下。

罕见、不寻常或数量少的数据--罕见或独特的数据,如与不寻常特征或罕见健康状况有关的数据,很难真正匿名化,因为具有这些特征或状况的个人往往很少。

合理手段--GDPR 建议,研究人员应考虑 “合理可能使用的手段”,并考虑所涉及的成本、时间和可用技术等因素,以防被识别的风险。

有其他伦理考虑因素的数据

如果有额外的伦理考虑因素,可以提交伦理审查申请。例如,如果数据在以下方面引起关注

- 原始参与者是否同意将来使用数据

- 数据的来源

- 获取尚未公开的敏感数据

- 社会特征分析

- 研究、数据或结果对特定群体或社区产生不利影响

请参阅下面有关伦理考虑因素的部分。

- 二手数据类型

二手数据--内部数据集

二次数据集有时可能来自大学内部,即作为学校以前项目的一部分而收集的数据。重要的是要考虑重新使用这些数据是否符合最初的伦理批准和参与者的同意。可能需要对允许共享数据的原始伦理批准和新研究项目的新伦理审查申请(如果有足够的不同)进行伦理修订。

内部来源的数据仍应得到承认和适当引用,并应与其他二手数据来源一样,考虑到访问权限、数据管理和保密性等问题。研究人员还应考虑使用此类二手数据是否符合自己的需要(即是否符合学术研究项目的要求)。

二手数据--大型定量数据集

常用的二手数据来源是大型定量数据集,如人口普查数据、健康数据、家庭调查和市场研究。

有多种来源可以提供这些类型的数据,访问这些数据所需的条件因来源和数据的性质而异,例如:

- 可免费下载数据的 “开放式 ”数据集

- “封闭式”数据集,用户必须在数据源注册,但只需很少的额外工作

- 包含较敏感信息的数据集,用户可能需要完成数据管理计划等文书工作。

有时,敏感性较高的数据集只能通过安全的门户网站访问,不能保留本地副本。

二手数据--定性和混合方法数据

二手定性数据并不常见,这主要是由于很难对定性数据进行匿名处理。不过,二手定性数据也有来源,包括英国数据服务和图书馆数据,如口述历史、日记和传记。

二级数据--生物数据

有多种资源可用于获取生物数据,包括与人类相关的数据。生物数据和生物信息学的使用范围很广,在保密性、DNA 和基因组学研究的影响、偏差和特征描述、确定与疾病相关的风险水平的敏感性等方面存在一些伦理问题。研究人员在计划涉及生物数据或生物信息学的研究时,应咨询学科指南和组织以及具有特定专业知识的同事。如果使用此类二手数据,研究人员必须确保按照数据来源的要求进行。研究人员还应确保检查是否需要任何国家医疗服务系统的伦理批准、管理或研发批准。

访问、权限和同意

必须始终按照数据源的要求、GDPR 和普通法的保密义务来访问二手数据。必须始终适当引用和确认二手数据。即使在使用二手数据时,研究人员也应始终按照 “Principles of Good Research Conduct(良好研究行为原则) ”行事。

研究人员应检查其使用是否符合最初从参与者处获得的同意,并就此向数据来源寻求保证。

如果数据是以匿名形式获取的,研究人员应意识到通过对多个数据点或数据集进行三角测量(triangulation of several data points or sets)而导致数据去匿名化的风险。

虽然有些开放访问的数据集可以免费获取,但数据源或控制者通常会就谁可以访问数据以及如何使用数据提出一些条件和要求。例如,这可能包括

· - 研究人员签署使用条款

· - 研究人员制定全面的数据管理计划

· - 研究人员在掌握数据后能保证数据的安全

· - 核实访问数据的人员是否有合法理由,即证明您是某个公认机构的研究人员

· - 通过安全门户访问数据

· - 不保留本地副本

· - 在一定期限内销毁任何数据副本(可能需要销毁证书)

· - 原始数据在发布前由数据源处理成匿名形式

在后一种情况下,如果有更复杂的要求,而且数据源正在提供准备和审核访问权限等服务,这可能会产生费用,需要将其纳入研究人员的计划和预算。

需要考虑的伦理问题:

伦理申请表包括一个关于使用二手资料来源的早期筛选问题。这意味着,如果研究人员在使用二手数据时没有其他伦理问题,他们可以跳到表格的最后--声明部分。但是,如果存在伦理问题,研究人员应在表格后面的 “伦理考虑因素 ”自由文本字段中描述这些问题以及如何缓解这些问题。

如果数据特别敏感,或者数据源有此要求,研究人员不妨填写伦理审查申请表(Word)的数据管理部分或单独的数据管理计划。

在申请使用二手数据进行研究的伦理批准时,研究人员应考虑:

- 研究是否符合参与者最初的知情同意?数据来源能否保证获得参与者的原始同意?

-如何管理数据?如果存在可识别数据、个人数据或敏感数据,将如何保密并确保数据安全?

-研究数据的使用、管理和存储是否符合数据源的要求?是否已完成所有适当文件并获得许可?

- 数据来源是得到致谢和引用?

- 数据是否存在版权问题?

- 将多个数据源整合在一起,是否存在参与者去匿名化的风险?

- 使用这些数据或将其与其他数据相结合是否会造成偏差或对特定群体进行 “特征分析”?

- 您将如何展示数据或分析?这能否确保参与者的保密性和匿名性?

- 这些数据是否会发现一些人有可能罹患某种病症或疾病?

· 二手数据涉及伦理问题的文献参考:

· Association of internet researchers – ethics guidance

· The European Commission (2018) – Use of previously collected data (‘secondary use’). Ethics and Data Protection, VII, 12-14

· Irwin, S. (2013). Qualitative secondary data analysis: Ethics, epistemology and context. Progress in development studies, 13(4), 295-306.

· Morrow, Virginia and Boddy, Janet and Lamb, Rowena (2014) The ethics of secondary data analysis. NCRM Working Paper. NOVELLA.

· Rodriquez, L. (2018) Secondary data analysis with young people. Some ethical and methodological considerations from practice. Children’s Research Digest Volume 4, Issue 3. The Childrens Research Network.

· Salerno, J., Knoppers, B. M., Lee, L. M., Hlaing, W. M., & Goodman, K. W. (2017). Ethics, big data and computing in epidemiology and public health. Annals of epidemiology, 27(5), 297-301.

· UK Data Service guidance on secondary analysis

因为敏感数据是二手数据的一种特殊类型的数据,因此下面对其定义及使用方法进行进一步介绍:

敏感数据

拥有敏感数据或其他不能公开共享的数据的作者,应在共享数据前施加适当的限制。作者应尽可能将数据存放在存储库中,只有在没有其他共享选择的情况下,才完全限制数据访问。

将数据放入存储库是透明、长期存储和管理访问请求的最佳选择。

敏感数据或受限数据包括:

1. 可识别的人类数据:涉及人类研究参与者的数据如果公开共享,可能会带来重新识别的风险。这包括定量和定性研究数据。可提供人类数据中的标识符列表。

2. 其他敏感数据:还应考虑非人类数据的敏感性,从濒危物种或考古敏感区的位置,到敏感的军事或政府数据。

3. 专有/第三方数据:在通过任何方式共享数据之前,作者必须确保自己拥有必要的权利和许可。版权和数据所有权应与研究参与者的敏感性分开考虑。作者应尽早确定任何限制,并确定允许共享的内容(如有)。请参阅英国数据服务部门提供的指导。

如果上述情况适用,作者应考虑以下方法,以促进敏感数据的安全共享。在收集数据之前,还应获得参与者同意共享数据(除使用或收集数据外)并记录在案。

- 对数据进行匿名处理,创建可共享版本。在公开共享数据之前,可以删除或替换数据中的身份识别信息。

- 使用受控访问存储库来管理谁可以访问数据以及访问条件。某些存储库提供此功能,例如让数据所有者知道谁可以访问数据和/或应用额外的限制,如同意不重新识别参与者。请参阅合适的受控访问存储库指南或咨询ClinicalStudyDataRequest.com。

- 使用可信研究环境或数据安全港(Trusted Research Environments or data safe havens)。某些研究机构会管理一些环境,在这些环境中,只有受信任方可以查询和访问数据,而无需从系统中删除数据。这些环境主要与临床医疗机构有关。请联系您的研究机构,确认您的数据是否可以选择这种方式。

- 在存储库中使用元数据记录,以保存不能公开共享的数据。这为另一位研究人员提供了有关可用数据的持久、长期的背景信息,即使这些数据只能应要求提供。

来源:中国组织工程研究杂志

相关推荐