TCGA数据库使用教程:官网、数据下载与数据挖掘分析
肿瘤基因组图谱 (TCGA) 计划由美国 National Cancer Institute(NCI) 和 National Human Genome Research Institute(NHGRI
网络 - 数据挖掘,TCGA数据库 - 2020-08-15
2016 数据科学:健康大数据产业论坛
2016 数据科学:健康大数据产业论坛 将于9月22日~23日在上海召开。 一百多年来,现代医学经历了飞速的发展,医疗实施过程、药物研发及评价、药品疗效信息、基因信息、生物标志物、临床试验等积累了大量数据。在数据驱动的医学时代,如何从海量医学数据中找出数据的价值所在,解决大规模数据引发的问题、利用好数据挖掘所带来的竞争力,需要多学科的协同和创新。当前,适应于生物医学大数据的软硬件平台、大
MedSci原创 - 大数据,数据 - 2016-09-22
大数据时代,有数据和分析数据不难,提出重要临床问题才是关键
大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据。大量、高速、多样、低价值密度、真实的大数据,正在改变着各行各业,医学也不例外。在中国心脏大会(CHC)2019、深圳心血管健康和疾病防治高峰论坛上,广州市妇女儿童医疗中心临床研究总监唐金陵教授认为,拥有数据并不困难,进行分析也不难。
中国循环杂志 - 大数据时代,数据分析,重要临床问题 - 2019-11-08
Hadoop和大数据:60款顶级大数据开源工具,包括平台,数据,分析等
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。IBM更是非常看好开源大数据
MedSci原创 - Hadoop,大数据 - 2015-12-20
儿童罕见病队列数据库数据共享机制专家共识
儿童罕见病由于其发病率低、症状复杂且重叠等特点在诊疗中亟需数据共享,但由于包括遗传信息等特殊敏感信息,目前缺乏细致的共享机制。中国妇幼协会精准医学专委会专家组就此进行了深入讨论,并依托上海申康医院发展
中国数字医学 - 罕见病队列数据库 - 2024-03-28
大数据领域中十大数据算法介绍
国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5、k-Means
MedSci原创 - 大数据 - 2016-06-23
卫生健康信息数据集元数据标准(代替WS/T 305—2009)
本标准适用于作为卫生健康信息数据集属性的统一规范化描述,也可用于卫生健康领域针对数据集制定专用元数据标准的依据。
中华人民共和国国家卫生健康委员会 - 数据集元数据 - 2023-08-29
利用真实世界数据做好研究:关键的数据质量问题
本文我们来聊一聊真实世界数据质量的相关问题。原始数据的质量在使用RWD的研究中,原始数据的质量取决于数据完整性和准确性。一个关键问题在于数据随机缺失(missing at random)的程度:随机缺失数据会减低测量的准确性,而非随机缺失会导致结果偏倚。因此,研究者需要仔细判断数据的真实性(即该数据是否可以反映真实的情况)和可靠性(即收集的数据是否具有一致性)。除了数据质量,还需要考虑数据的全
医咖会 - 真实世界数据 - 2019-03-12
詹启敏:健康大数据将成为未来最大的数据
在健康报社、中国信息通信研究院、贵阳日报传媒集团联合主办的“从理念到应用——健康大数据高峰论坛”上,中国工程院院士、北京大学医学部主任詹启敏教授作为一位大数据的粉丝,讲述了他对健康大数据的理解,整个报告感染力极强报告之后,现场嘉宾、听众、媒体纷纷加入大数据“粉丝团”,气氛热烈。 詹启敏认为,大健康发展策略应该是关注生命全过程,即从生命出生第一天开始,一直到生命的终结。正因
健康报 - 詹启敏院士,健康大数据,医疗数据 - 2016-06-13
基于既有医疗数据构建研究型数据库的方法学探讨及实例解读(二):数据治理的方法
本文以“中西医结合治疗新型冠状病毒感染研究型数据库”为例,对研究中数据治理的方法进行介绍,以供研究人员参考。
中国中医药信息杂志 - 数据治理 - 2023-07-07
“科研数据管理与分享”调研,分享您的数据经验
中国正处于创新发展的重要阶段,而开放的科学数据共享对于科技发展至关重要。《科学数据管理办法》的出台标志着我国的科学数据工作已步入正轨。值此之际,中国科学院文献情报中心携手施普林格•自然对中国科研数据的管理与分享开展首份调研,旨在探索科研人员对数据分享和管理的想法及态度,以及所面临的挑战。
MedSci原创 - 2018-09-13
Spark Streaming:大规模流式数据分析与数据挖掘利器
提到Spark Streaming,我们不得不说一下BDAS(Berkeley Data Analytics Stack),这个伯克利大学提出的关于数据分析的软件栈。从它的视角来看,目前的大数据处理可以分为如以下三个类型。 复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间。基于历史数据的交互式查询(interactive quer
MedSci原创 - 数据,挖掘 - 2015-09-08
收藏:常用医学公共数据库(含临床数据库,生信数据库和机器学习数据库)
美国国家癌症数据库(National Cancer Database, NCDB),SEER(Surveillance, Epidemiology, and EndResults Program)
网络 - 公共数据库 - 2020-06-14
临床试验数据管理之数据记录
一.数据记录的作用 记录是安全性、有效性的评价和报告依据,也是遵循GCP的证据, 只有存在记录: 1.才能证明相关行为发生过;  
MedSci原创 - 数据管理 - 2012-12-13
为您找到相关结果约500个