有哪些做机器学习和数据挖掘比较知名的组或者导师

2,425被浏览223,850分享邀请回答20437 条评论分享收藏感谢收起25038 条评论分享收藏感谢收起该文章内容可能包含未经证实信息,如您已证实,请点击举报,了解更多内容请查看
R语言机器学习与数据挖掘核心技术与应用
“R语言机器学习与数据挖掘核心技术与应用”
培 训 通 知
各企事业单位:
当Alphago在围棋届横扫人类围棋冠军,小度在《最强大脑》里的高超表现,机器对疾病的诊断准确率要高于行医多年经验丰富的病理医生等等,人工智能在社会各个领域应用越来越广,并大有取代人类的趋势。而人工智能背后的方法主要是机器学习和数据挖掘方法。作为生活在人工智能快速发展的时代,我们只有与时俱进,才不会被社会淘汰,因此非常必要去了解机器学习和数据挖掘的思想和方法!学会这些方法和工具,并将之应用到实际的工作中!在这个背景下,为了培养更多大数据分析与挖掘复合型人才,满足行业对专业人才的迫切需求,中国管理科学院人才战略研究所将于7月举办“R语言机器学习与数据挖掘核心技术”培训班。同时,本次课程以具体案例的形式,引导学员自己动手实践编程,具体事宜如下:
一、培训目的和特色
(1)让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
(2)本课程以案例为导向,先通过讲解案例,引入到机器学习和数据挖掘的方法,再深入浅出地讲解使用R语言进行实战分析,让学员不仅掌握机器学习的方法与思想,而且学会R语言的进行实战分析。
(3)学完本课程后,使学员基本上可以使用R语言进行实际数据挖掘分析。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。
(4)该培训课程先后在全国讲授了50多场次,反响热烈。
二、时间地点
2017年 07月17日—日
浙江省*杭州市
时间安排:第一天报到,授课三天
三、培训对象
从事计算机、云计算、大数据、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员;各地方政府信息中心负责人、技术骨干;大数据产业投资团队,大数据应用开发商,大数据服务提供商等;有志于R机器学习研究和应用的个人及从业者,高校相关专业的教学科研人员、高年级本科生及研究生。
四、课程内容&&&&&&&
R语言机器学习与数据挖掘核心技术课程大纲
&&第1讲R语言入门
课程目标:掌握R语言的基本用法和基本数据分析1.R语言介绍;2.编辑软件Rstudio使用;3.R程序包的载入与使用;4.数据对象及运算(向量、矩阵、数组、列表与数据框处理);案例1:工资数据的分析。
&&&第2讲数据清洗与探索性分析&
课程目标:掌握用R编写函数和对实际数据描述统计分析1.R数据读入与读出 (读入txt、xls、SPSS、SAS、stata以及数据库文件);2.R 函数编写;3.R的条件与循环函数;4.高效编程技巧介绍;5.数据探索性分析与作图;案例1:汽车数据描述统计分析;案例2: 财政收入与税收描述统计分析。
&&第3讲线性回归与logistic回归
课程目标:掌握线性回归方法与实际的建模分析1.一元线性回归;2.多元线性回归;3.logistic回归;案例1:中国增长案例分析;案例2:新教学方法的效果;案例3:信用卡违约预测。
&&第4讲决策树与Ensemble learning
课程目标:掌握数据挖掘中常用的聚类和分类方法及其实际应用。1.决策树分析;2.Bagging;3.随机森林分析;4.Boosting;案例1:信用卡违约预测;案例2:银行贷款违约预测。
&&第5讲支持向量机
课程目标:掌握支持向量机分类方法1.Maximal margin 分类器2.Support vector 分类器3.Support vector machine案例:方向预测;心脏病预测
&&第6讲神经网络互动交流讨论
课程目标:掌握文本挖掘、词云分析与智能推荐。1.单神经元模型;2.单层感知器;3.BP神经网络;4.RProp神经网络;案例分析;互动交流与讨论。
五、培训费用
培训费用3900元/人(含培训费、教材费、考试费、证书申报、场地等关费用),食宿统一安排,费用自理。参加相关培训并通过考试的学员,可获得:中国管理科学院人才战略研究所颁发高级《数据挖掘核心技术与应用管理师》专业能力证书,该证书可作为有关单位专业技术人员能力评价、考核和任职的重要依据。注:请学员带两寸照片2张(背面注明姓名)、身份证复印各两张。请学员自带笔记本电脑,讲师以U盘的形式提供全部教学课件、源代码、实验数据、编程操作步骤.
六、主讲专家
方老师,厦门大学教授,博士生导师,耶鲁大学博士后。主要研究:数据挖掘、应用统计。2007年出版了国内第一本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。有10多年的R语言使用经验和丰富的数据挖掘和机器学习实战经验。曾先后在在 Journal of Multivariate Analysis、Nature子刊、Computational Statistics and Data Analysis等国内外权威期刊发表论文70多篇。先后主持了、国家社科基金等多个项目。承担了多个企业数据挖掘项目,有丰富的数据挖掘实战经验。长期讲授《数据挖掘》、《机器学习》等课程,讲课生动活泼、深入浅出、以实际案例引出统计方法,再通过编程讲解实际操作和结果分析。
七、联系方式
联 系 人:柴老师
邮 & 箱:@qq.com
有意者请添加柴老师QQ,
索要《报名回执表》和正式版的《培训通知》。
&选自kdnuggets机器之心编译参与:王宇欣、杜夏德TheDataIncubator中,有着最新的数据科学(datascience)课程。其中大部分的课程都是基于企业和政府合作伙伴的需求而设立的。现在他们希望开发一更偏向数据为驱动的方式,以了解应该为数据科学企业的培训(datasciencecorporatetraining,以及享受其提供的免费助学金的有意愿进入业界数据科学领域的硕博士生们教授...&üPython可以使你把精力集中在逻辑上而不是语言本身上。用python,你要做的就是真正理解搜索算法,之后的实现会很简单。üPython适合做数据挖掘的另一个原因是社区现在比较成熟。üPython对于非计算机科班出身不会有技术问题,本身是非常便于使用的。üPython在数据挖掘领域有很多成熟的框架和算法库,如numpy,scipy等等,而且在国外作为一门教学语言,一些新提出的算法理论也大都倾向于...&版权声明本文来源于数据挖掘入门与实战本文由数据之王(ID:shujuzhiwang)编辑整理,版权归原作者所有数据之王(ID:shujuzhiwang)由大中华大数据协会运营,如有邀约合作,首页回复合作需求,我们将及时回复利用机器学习可以很方便地做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由开发的情感分析以及更一般的文本挖掘包已经得到了很好的发展。你可以查看下...&【小编摘要】  学习能力是智能行为的一个非常重要的特征,不具有学习能力的系统很难称之为一个真正的智能系统,机器学习不仅涉及对人的认知学习过程的探索,还涉及对数据的分析处理。实际上,机器学习已经成为计算机数据分析技术的创新源头之一。  机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其专门研究计算机是怎样模拟或实现人...&来源:DataCastle数据城堡随着数据科学在人工智能发展中大放异彩,数据挖掘、机器学习进入了越来越多人的视野。而对于很多人来说,诸如机器学习之类的名次听起来是神乎其技,但其真正的内涵却不为一般人所知。特别是对于从事数据科学领域的人来说,如何向外行人解释自己所从事的工作几乎是一个超级难题。那么到底什么是机器学习,如何用通俗易懂的语言来解释?我们通过以下几重境界来解释。一、专业理论型百科定义+专业...&
公众号推荐
股市沉浮十余载,只为博得颜欢笑。不求一叶
17年专业做股票,股票行情、大盘走势、每
北金所是财政部指定的金融类国有资产交易平
北京晟视天下投资管理有限公司于2013年
我们努力做好您的投资助手!
买哪种币能翻倍,币司令告诉你
《胡润财富榜》专注于财经、金融、商业领域
业精于“禽”,服务水禽产业链!不只是资讯
我的建筑网(www.wdjianzhu.
俺是潍坊最有态度的媒体公众号,潍坊最任性&&&&数据挖掘与机器学习——WEKA应用技术与实践
自营订单满49元(含)免运费
不足金额订单收取运费5元起
邀请好友参加吧
版 次:1页 数:字 数:印刷时间:日开 本:16开纸 张:胶版纸包 装:平装是否套装:否国际标准书号ISBN:8所属分类:&&&
下载免费当当读书APP
下载当当读书APP,免费阅读万本电子书。
本商品暂无详情。
当当价:为商品的销售价,具体的成交价可能因会员使用优惠券、积分等发生变化,最终以订单结算页价格为准。
划线价:划线价格可能是图书封底定价、商品吊牌价、品牌专柜价或由品牌供应商提供的正品零售价(如厂商指导价、建议零售价等)或该商品曾经展示过的销售价等,由于地区、时间的差异化和市场行情波动,商品吊牌价、品牌专柜价等可能会与您购物时展示的不一致,该价格仅供您参考。
折扣:折扣指在划线价(图书定价、商品吊牌价、品牌专柜价、厂商指导价等)某一价格基础上计算出的优惠比例或优惠金额。如有疑问,您可在购买前联系客服咨询。
异常问题:如您发现活动商品销售价或促销信息有异常,请立即联系我们补正,以便您能顺利购物。
当当购物客户端手机端1元秒
当当读书客户端万本电子书免费读数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系? - Donx - 博客园
随笔 - 7, 文章 - 0, 评论 - 3, 引用 - 0
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答不出来,我在知乎和博客上查了查这个问题,发现还没有人写过比较详细和有说服力的对比和解释。那我根据以前读的书和论文,还有和与导师之间的交流,尝试着说一说这几者的区别吧,毕竟一个好的定义在未来的学习和交流中能够发挥很大的作用。同时补上数据科学和商业分析之间的关系。能力有限,如有疏漏,请包涵和指正。
本文主要分为两部分,第一部分阐述数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)之间的区别。这三者的区别主要是目的不同,其手段(算法,模型)有很大的重叠,所以容易混淆。第二部分主要阐述以上的技能与数据科学(data science)的关系,以及数据科学(data science)和商业分析(business analytics)之间的关系。其实,数据科学家本身就是商业分析师在大数据时代的延伸。
数据挖掘VS. 机器学习VS. 人工智能
数据挖掘 (data mining): 有目的地从现有大数据中提取数据的模式(pattern)和模型(model)
关键字:模式提取,大数据
数据挖掘是从现有的信息(existing information)中提取数据的模式(pattern)和模型(model),即精选出最重要的信息,以用于未来机器学习和AI的数据使用。其核心目的是找到数据变量之间的关系。其发展出来的主要原因是大数据的发展,用传统的数据分析的方式已经无能处理那么多大量的看似不相关的数据的处理,因此需要数据挖掘技术去提取各种数据和变量之间的相互关系,从而精炼数据。数据挖掘本质上像是机器学习和人工智能的基础,他的主要目的是从各种各样的数据来源中,提取出超集(superset)的信息,然后将这些信息合并让你发现你从来没有想到过的模式和内在关系。这就意味着,数据挖掘不是一种用来证明假说的方法,而是用来构建各种各样的假说的方法。数据挖掘不能告诉你这些问题的答案,他只能告诉你,A和B可能存在相关关系,但是它无法告诉你A和B存在什么相关关系。当然,数据挖掘会使用大量机器学习的算法,但是其特定的环境和目的和机器学习不太一样。
机器学习(machine learning): 自动地从过往的经验中学习新的知识。
关键字: 自动化,自我优化,预测,需要training data,推荐系统
机器学习其实是人工智能很重要的一部分,因为目前,在实践过程中,大多数的人工智能处理的任务,其实是用机器学习的方式完成的。机器学习可以用程序和算法自动地学习,只要被设计好了,这个程序可以进行自我优化。同时,机器学习需要一定数量的训练数据集(training data set),用于构建来自过往经验的&知识& 。且机器学习目前在实践中最重要的功能便是预测结果。比如机器学习已经学习结束了,现在有一个新的数据集x,需要预测其分类,机器学习算法会根据这个新数据与学习后的&知识&相匹配(实际上,知识指的是学习后的数学模型),然后将这个数据集x分类某类C去。再比较常见的机器学习,比如amazon的推荐系统。
人工智能(AI): 一个广泛的概念,本质是用数据和模型去为现有的问题(existing problems)提供解决方法(solutions).
关键字:和人一样处理问题,技术的合集
人工智能是一个与机器学习和数据挖掘相对不同的概念,人工智能的目的是为了去创造有智力的电脑(不知道怎么翻译好,可以假设其为机器人)。在实践中,我们希望这个电脑可以像有智力的人一样处理一个任务。因此,理论上人工智能几乎包括了所有和机器能做的内容,当然也包括了数据挖掘和机器学习的内容,同时还会有监视(monitor)和控制进程(process control)的内容。
数据科学(data science)和商业分析(business analytics)的关系?
其实以前,我们是没有数据科学家(data scientist),和数据科学(data science)这个概念的。我们称呼做相关内容的方式更多叫商业分析(business analytics)。
在2011年的时候,麦肯锡发表了提出了现在很多的公司已经开始往分析才能(analytical talent)中获得竞争优势。虽然这不是第一篇提出这个概念的公司,但是是第一次提出,数据分析能力也有助于商业公司去发现潜在的机会,而不仅仅只对技术公司有效。接着麦肯锡认为到了2018年,美国大约会有190,000的项目缺少&深度分析能力(Deep Analytical Talent)&,而这些深度分析能力,是由大数据(big data)驱动的。至此,麦肯锡将&商业分析&进一步形容为&深度分析能力&。
接着DJ Patil和Jeff Hammerbacher在其写的,将麦肯锡的&深度分析能力&称为了&数据科学家(data scientists)&。他们在文中提到:
商业分析师(business analyst)看起来太局限了,数据分析师(data anlyst)是他们的竞争者,但是我们还是觉得这个称呼太局限了。....我们认为最好的称呼应该是&数据科学家(data scientist)&,因为这些人需要同时使用数据(data)和科学(science)去创造一些新的东西。
紧接着,DJ Patil加了一些关键特点用于去寻找一个数据科学家(data scientist):
专业技术(Technical expertise): 最好的数据科学家需要有关于某些科学学科的深度专业知识(deep expertise)。
好奇心(Curiosity): 一个优秀的数据科学家需要有挖掘潜在关系,解决问题和证明假说的强烈好奇心和渴望。
讲故事的能力(Storytelling): 能用数据讲一个生动的故事的能力,它能使交流更加有效。
聪明(Cleverness): 能够创造性地解决问题的能力。
随后,数据科学家这个概念才开始被广为流传。那么数据科学家需要具备哪些专业能力?不同的公司有不同的看法和意见(反正大家好像都喜欢把所有一切的期许都放在一个新兴的行业中),这里列举一个比较流行的看法:1.Drew Conway&s&
2.Drew Tierney&s&
最后附赠一张&作弊纸&,列出几乎所有的商业问题(Business Problems),想要入门成为一个优秀的商业分析师,或者是数据科学家,强烈推荐保存!!!!!!!!!!!!以后有时间,我会尝试着逐一翻译和解说一下。
拓展阅读(英文):
:不知道为什么现在什么&独角兽&型的这种理念会那么流行,企业也爱叫独角兽,行业内也爱叫独角兽。。但为什么一提到独角兽,我先想到的是巫师系列游戏。(捂脸~)
:用于商业分析的十大工具,强烈推荐阅读!!!
:第二部分内容主要来源的原文。
参考文献:
各种乱七八糟的书和课件的笔记。
Drew Conway&s&
Drew Tierney&s&当前位置:
&国内机器学习数据挖掘方向比较好的院系和老师推荐
国内机器学习数据挖掘方向比较好的院系和老师推荐
作者 zhoujianshan
本人小硕一枚,快毕业了,想在机器学习或者数据挖掘,智能计算方向深造,恳请有经验的师兄师姐推荐咋们国内在这个方向比较好的院系和老师
南大周志华、人大孟小峰、南航陈松灿、清华唐杰等比较牛!就看你要选择什么学校了。
南航吧,申请考核不用考试
引用回帖:: Originally posted by vehicle_Yang at
南航吧,申请考核不用考试 能具体介绍一下南航那边做这个方向的老师嘛?
南航做这个方向的主要是陈松灿比较牛。将来要搞学术可以选陈老师,人很有学术气,没有架子,很随和。学术上比较牛,对学生的要求也比较高。跟他读博的学生也比较多,他的博士生发展的也比较好,跟南大的大牛周志华关系很好。
李航: us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性等问题的研究曾在人大听过一场他的讲座,对实际应用的问题抽象,转化和解决能力值得学习。
周志华:,是南京大学的杰青,机器学习和数据挖掘方面国内的领军人物,其好几个研究生都进入了美国一流高校如uiuc,cmu等学习和深造。周教授在半监督学习,multi-label学习和集成学习方面在国际上有一定的影响力。
杨强:,香港科技大学教授,也是KDD 2012的会议主席,可见功力非同一般。杨教授是迁移学习的国际领军人物,曾经的中国第一位acm全球冠军上交的戴文渊硕士期间就是跟他合作发表了一系列高水平的文章。还有,杨教授曾有一个关
于机器学习和数据挖掘有意思的比喻:比如你训练一只狗,若干年后,如果它忽然有一天能
帮你擦鞋洗衣服,那么这就是数据挖掘;要是忽然有一天,你发现狗发装成一个老太婆消失了,那么这就是机器学习。
李建中:,哈工大和黑大共有教授,是分布式数据库的领军人物。近年来,其团队在不确定性数据,sensor network方面也发表了一系列有名文章。李教授为人师表,教书育人都做得了最好,在圈内是让人称道的好老师和好学者。
唐杰:,清华大学副教授,是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统,该系统也是多个会议的支持商。
张钹:清华大学教授,中科院院士,。现任清华大学信息技术研究院指导委员会主任,微软亚洲研究院技术顾问等。主要从事人工智能、神经网络、遗传算法、智能机器人、模式识别以及智能控制等领域的研究工作。在过去二十多年中,张钹教授系统地提出了问题求解的商空间理论。近年来,他建立了神经与认知计算研究中心以及多媒体信息处理研究组。该研究组已在图像和视频的分析与检索方面取得一些重要研究成果。
刘铁岩: MSRA研究主管,是Learning to rank的国际知名学者。近年逐步转向管理,研究兴趣则开始关注计算广告学方面。
王海峰: 信息检索,自然语言处理,机器翻译方面的专家,ACL的副主席,百度高级科学家。近年,在百度主持研发了百度翻译产品。
何晓飞: 浙江大学教授,多媒体处理,图像检索以及流型学习的国际领先学者。
朱军: 清华大学副教授,机器学习绝对重量级新星。主要研究
领域是latent variable models, large-margin learning, Bayesian nonparametrics, and sparse Learning in high dimensions.他也是今年龙星计划的机器学习领域的主讲人之一
吴军:腾讯副总裁,前google研究员著名《数学之美》和《浪潮之巅》系列的作者。
张栋:前百度科学家和google研究员,机器学习工业界
的代表人物之一。
戴文渊:现百度凤巢ctr预估组leader前ACM大赛冠军,硕士期间一系列transfer learning方面的高水平论文让人瞠目结舌,
引用回帖:: Originally posted by zhoujianshan at
能具体介绍一下南航那边做这个方向的老师嘛?... 你看看吧,我只知道南航不用考试
引用回帖:: Originally posted by zhenwuhuang at
张磊:http://research.microsoft.com/en-us/um/people/leizhang/
李航:http://research.microsoft.com/en- us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自 ... 狗的比如感觉很好玩啊,学习之后意想不到的事情就发生了
24小时热帖
下载小木虫APP
与700万科研达人随时交流

我要回帖

 

随机推荐