大数据领域中十大数据算法介绍

2016-06-23 MedSci MedSci原创

国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5、k-Means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Naive Bayes 和 CART。不仅仅是选中的十大算法,其实参加评选的18 

国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5、k-Means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Naive Bayes 和 CART。不仅仅是选中的十大算法,其实参加评选的18 种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。 1.C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进行剪枝; 3) 能够完成对连续属性的离散化处理; 4) 能够对不完整数据进行处理。 C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (5)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=91056, encodeId=5cf49105631, content=医学生学统计,感觉还是有很多需要跨越的地方, beContent=null, objectType=article, channel=null, level=null, likeNumber=98, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cfb791835, createdName=CHBLY, createdTime=Fri Jun 24 23:45:00 CST 2016, time=2016-06-24, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90943, encodeId=3a11909431f, content=很不错啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=162, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90944, encodeId=2c9a909441d, content=大数据啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=125, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90930, encodeId=a6a490930a9, content=大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。, beContent=null, objectType=article, channel=null, level=null, likeNumber=109, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=c4a5105539, createdName=lovetcm, createdTime=Thu Jun 23 12:45:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90924, encodeId=a4a5909243d, content=大数据时代, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b3781729882, createdName=WEIXINa82df6bc, createdTime=Thu Jun 23 12:08:00 CST 2016, time=2016-06-23, status=1, ipAttribution=)]
    2016-06-24 CHBLY

    医学生学统计,感觉还是有很多需要跨越的地方

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=91056, encodeId=5cf49105631, content=医学生学统计,感觉还是有很多需要跨越的地方, beContent=null, objectType=article, channel=null, level=null, likeNumber=98, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cfb791835, createdName=CHBLY, createdTime=Fri Jun 24 23:45:00 CST 2016, time=2016-06-24, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90943, encodeId=3a11909431f, content=很不错啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=162, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90944, encodeId=2c9a909441d, content=大数据啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=125, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90930, encodeId=a6a490930a9, content=大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。, beContent=null, objectType=article, channel=null, level=null, likeNumber=109, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=c4a5105539, createdName=lovetcm, createdTime=Thu Jun 23 12:45:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90924, encodeId=a4a5909243d, content=大数据时代, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b3781729882, createdName=WEIXINa82df6bc, createdTime=Thu Jun 23 12:08:00 CST 2016, time=2016-06-23, status=1, ipAttribution=)]
    2016-06-23 milkshark

    很不错啊

    0

  3. [GetPortalCommentsPageByObjectIdResponse(id=91056, encodeId=5cf49105631, content=医学生学统计,感觉还是有很多需要跨越的地方, beContent=null, objectType=article, channel=null, level=null, likeNumber=98, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cfb791835, createdName=CHBLY, createdTime=Fri Jun 24 23:45:00 CST 2016, time=2016-06-24, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90943, encodeId=3a11909431f, content=很不错啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=162, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90944, encodeId=2c9a909441d, content=大数据啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=125, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90930, encodeId=a6a490930a9, content=大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。, beContent=null, objectType=article, channel=null, level=null, likeNumber=109, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=c4a5105539, createdName=lovetcm, createdTime=Thu Jun 23 12:45:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90924, encodeId=a4a5909243d, content=大数据时代, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b3781729882, createdName=WEIXINa82df6bc, createdTime=Thu Jun 23 12:08:00 CST 2016, time=2016-06-23, status=1, ipAttribution=)]
    2016-06-23 milkshark

    大数据啊

    0

  4. [GetPortalCommentsPageByObjectIdResponse(id=91056, encodeId=5cf49105631, content=医学生学统计,感觉还是有很多需要跨越的地方, beContent=null, objectType=article, channel=null, level=null, likeNumber=98, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cfb791835, createdName=CHBLY, createdTime=Fri Jun 24 23:45:00 CST 2016, time=2016-06-24, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90943, encodeId=3a11909431f, content=很不错啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=162, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90944, encodeId=2c9a909441d, content=大数据啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=125, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90930, encodeId=a6a490930a9, content=大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。, beContent=null, objectType=article, channel=null, level=null, likeNumber=109, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=c4a5105539, createdName=lovetcm, createdTime=Thu Jun 23 12:45:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90924, encodeId=a4a5909243d, content=大数据时代, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b3781729882, createdName=WEIXINa82df6bc, createdTime=Thu Jun 23 12:08:00 CST 2016, time=2016-06-23, status=1, ipAttribution=)]
    2016-06-23 lovetcm

    大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。

    0

  5. [GetPortalCommentsPageByObjectIdResponse(id=91056, encodeId=5cf49105631, content=医学生学统计,感觉还是有很多需要跨越的地方, beContent=null, objectType=article, channel=null, level=null, likeNumber=98, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cfb791835, createdName=CHBLY, createdTime=Fri Jun 24 23:45:00 CST 2016, time=2016-06-24, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90943, encodeId=3a11909431f, content=很不错啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=162, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90944, encodeId=2c9a909441d, content=大数据啊, beContent=null, objectType=article, channel=null, level=null, likeNumber=125, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7cde98330, createdName=milkshark, createdTime=Thu Jun 23 13:42:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90930, encodeId=a6a490930a9, content=大数据时代的各种算法扬眉吐气,但是每一种方法都有自身的优点和弱点,关键在于合理的选择。临床数据也需要通过不同的方法找到最优的组合。, beContent=null, objectType=article, channel=null, level=null, likeNumber=109, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=c4a5105539, createdName=lovetcm, createdTime=Thu Jun 23 12:45:00 CST 2016, time=2016-06-23, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=90924, encodeId=a4a5909243d, content=大数据时代, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=b3781729882, createdName=WEIXINa82df6bc, createdTime=Thu Jun 23 12:08:00 CST 2016, time=2016-06-23, status=1, ipAttribution=)]
    2016-06-23 WEIXINa82df6bc

    大数据时代

    0

相关资讯

大数据环境下科研人员对数据的需求有多强烈

当大数据时代扑面而来的时候,图书馆是提前应对,还是被扑倒?提到这个问题,估计同行们都心情沉重,或佯装思考,或蹙眉挠头。我也没能力去想象,在苍茫的数据大海上,图书馆这只海燕该如何飞翔。好吧,依然从图书馆最擅长的需求调查入手,探一探科研人员或学者们对数据的需求到底是怎样的。 从3月1日起,我们在中科院内发布“数据服务需求调查问卷”。截至到3月9日,收集问卷269份。 调查结果:

Nat Med:癌症专家倡议共享癌症基因组信息 共建大数据网络

                据贝尔法斯特女王大学的一位癌症研究专家介绍,全世界癌症患者的基因信息共享或可成为癌症预防和治疗的关键所在。 相关内容发表在国际学术期刊Nature Medicine上,文章通讯作者是来自女王大学癌症和细胞生物学中心的Mark Lawler教授。这篇文章着重强调了大数据在癌细胞研究和开发有效个体化治疗策略方面的潜

[案例]大数据时代医院信息化建设之机遇与挑战

由51CTO举办的WOT”互联网+”时代大数据技术峰会上,就职北京大学人民医院院长助理、信息中心主任、医疗大数据研究中心副主任、骨关节科副主任医师的刘帆做了以《大数据时代医院信息化建设之机遇与挑战》为主题的演讲。此次分享主要围绕医疗大数据展开,从中用户可以了解到医疗大数据到底是什么?现在到底有什么样的数据?大数据解决怎么样的问题?本文章是把本次分享干货亮点的整理成文字形式,呈献广大的用户。

大数据在癌症领域应用的场景

“大数据”是有效的,这是因为有重大的信息可以从大数据集合里分析。越是大样本的体量,越能发现一些在小样本体量中难以发现的小问题。另一些研究者则表示:“大数据”岂止于大?而是越多越好。 来自美国 St. Jude儿童研究中心的首席信息官、高级副总裁Keith Perry认为,“大数据”包含额外的三层意思:多个品种的数据类型、数据生成的速度和数据集成的程度。在他看来,目前的许多数据库之间无相互接口

区块链+大数据=医疗行业的数据安全和患者隐私的革命

数据安全和患者隐私,是医疗领域永远无法回避的关键问题!移动医疗也罢,智慧医疗也罢,只要触碰到数据安全问题,都会自然而然受阻!这也是移动医疗无法颠覆医疗的原因之一。然而,技术是无尽的,一种新的技术完美解决这个问题!区块链!你可能还不知道,就立即阅读下面内容吧。医疗行业安全问题医疗保健行业目前面临严重的数据质量问题,也许来源于医师、临床医生的失误,黑客的攻击,或者实时编辑过程中没有及时更新电子健康记录

专家呼吁建立精准医学发展共享机制

6月16日~17日,以“精准医学与肿瘤治疗”为主题的首届雁栖湖医学高峰论坛在京召开。会上,中国工程院院士、北大医学部主任詹启敏指出,发展精准医学需要建立医院间的共享机制,破除各单位“各立门派”、互不往来的弊端。 詹启敏介绍说,精准医学的一大重要支撑平台是“大数据平台”。通过聚集海量的队列数据、临床数据、组学数据、结构生物学数据、药物分子信息,再经由生物信息技术处理,才能发现新靶点、新结构,