数据管理和共享
什么是数据管理?
数据管理是对研究过程中产生的信息进行控制的过程 项目,包括整个研究过程中数据的存储、访问和保存 生命周期及以后. 任何研究项目都会涉及到一定程度的数据管理; 研究的结果在一定程度上取决于这些数据管理得如何.
许多联邦资助机构现在开始要求正式的数据管理 计划. 不管资金如何,所有的研究项目都应该有一份书面计划, 并与所有参与项目的关键人员分享.
有效的数据管理措施包括:
- 指定参与研究的每个人的责任;
- 决定如何存储和备份数据,包括长期存档,
- 实施数据管理计划,以及
- 决定如何通过研究的每次修改来处理数据.
数据管理的一般角色和职责
- 首席研究员(PI): 数据的主要所有者. PI负责识别信息 保管人,制定书面数据管理计划,制定必要的流程 确认是否符合计划,并确保保留和共享数据 根据担保人和大学的要求.
- 学院/部门/机构/中心: 负责为数据管理、寻址提供必要的资源 相关的信息安全问题,并确保调查人员遵守数据 管理需求.
- 研究和赞助项目办公室(ORSP): 负责制定校园范围内的数据管理和审查政策(见 (上图),核实大学是否有能力满足赞助商的数据要求,进行调查 不合规或不当行为,并在PI离开时促进所有权转移 大学.
- 资讯科技署: 负责监督与数据管理和培训相关的软件和系统 指定信息保管人.
数据管理计划模板 & 资源
- 国家科学基金会(NSF)模板
- 美国国立卫生研究院(NIH)模板
- 美国国家航空航天局(NASA)模板
德州数据扫盲计划 由卫生保健中心机构研究办公室提供的培训
数据管理计划的外部资源:
- 康奈尔大学:数据管理服务组
- 麻省理工图书馆:数据管理
- 的 DMP工具网站 还提供了许多用于创建数据管理计划的模板.
什么是数据共享?
研究数据是一种宝贵的资源,通常需要大量的时间和金钱 生产. 许多数据在原始研究之外具有重要的使用价值.
此外,数据共享:
- 是政府资助机构(例如.g. NSF, NIH, NASA)和一些出版商
- 允许数据被用来回答新的问题,这促进了可能性 新的发明和发现
- 最大限度地提高透明度和问责制
- 促进了科学界的合作和协作,这使得科学更加 开放
- 使你的论文更有用,更容易被其他科学家引用
如何共享您的数据:
- 保存在适当的数据存储库或存档中
- 通过项目或机构网站在线发布
- 向期刊文章提交数据
联邦机构数据管理和共享资源:
元数据简介
“元数据”一词的意思是“关于数据的数据”.“它为你的研究数据提供了背景 通过提供关于它的描述性细节. 的对象的上下文 兴趣——“资源”,如MP3文件、图书馆图书或卫星图像——在 “资源描述”的形式.“它包括以下内容:
- 变量、记录及其值的名称、标签和描述
- 使用的代码和分类方案的说明
- 缺失值的代码和原因
- 派生数据收集后创建,用代码、算法或命令文件来使用 创建它们
- 所创建的权重和总收入变量以及如何使用它们
- 例如,对所研究的病例、个人或项目进行描述的数据清单 记录定性访谈
有关元数据的进一步信息和元数据模式示例,请参阅 Dublin核心元数据模式.
参见…的选择 通用和特定于学科的元数据标准.
数据存储/归档的最佳实践
- 数据必须存档在一个受控制的、安全的环境中,以一种保护的方式 原始资料原始资料、观察或记录. 档案必须对欧洲杯竞猜网站开放 分析数据,并提供给合作者或其他有权访问的人.
- 原始研究数据应在发表后安全保存足够的时间。 分析或终止项目. 数据应保留的年数 因领域而异,可能取决于数据和研究的性质.
- 可持续的数据管理对研究的价值至关重要,对确保 持续的奖学金. 通常,在数据存储中,有一个访问副本, 还有一份档案副本,主要是为了保存和备份. 就像自然灾害和故障一样,备份数据再怎么强调也不为过 在系统和软件中是无法预测的. 尽早并经常备份你的数据.
- 选择数据格式和软件主要取决于研究者的偏好 但通常是由特定学科的标准和习俗决定的. 同时确保 数据的长期可用性和可持续性需要注意标准 可互换的软件,也有 首选格式(PDF) (从 英国数据档案馆)进行数据创建和保存.
- 长期数据存储:密切关注存储、备份、安全性和可持续性 保护您的数据意味着您降低了损害其质量和可访问性的风险 从长远来看. 与存储相关的问题包括考虑数据的速度 在研究项目的整个生命周期内预计会增加多少. 回答的一部分 这个问题涉及到确定数据是否将以自动化的方式收集, 哪些可能会增加数据收集的规模,或者项目上的员工 将自己收集数据(e.g.(通过在数据库或实验笔记本中输入). 短期存储的选择包括硬盘驱动器和便携式媒体(例如.g., dvd及cd).
这个页面是基于欧洲杯竞猜网站的配套页面, 数据管理和共享.