求解答,有人解决了win ACT不能民政统计数据自查报告的情况了吗

如果只是需要用统计,对数理没有要求,强烈推荐看 Coursera 上Princeton的 &a href=&///?target=https%3A//www.coursera.org/course/stats1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Statistics One&i class=&icon-external&&&/i&&/a& 。已经停课,但是可以在百度盘搜到下载。&br&&br&Open course不说了,课程视频比较短,但是内容非常丰富,有广度,涉及太深的地方点到为止,但是基本原理,什么情况做什么样的统计,以及为什么要做xx操作,如何避免一些pitfalls都讲到了!而且还包括了一个很短的R语言操作讲解,这方面不是太够推荐再去看一下JHU的视频了解R的语法。&br&&br&像我是医学背景,整个大学基本没接触到过真正的理科课程,一个学期的统计课也完全无好感,之后一直对次处于半糊涂状态,做分析也是follow傻瓜式SPSS。后来需要的统计场景变多,自觉无力开始自学。幸亏碰到了这门课,感觉一下子天窗打亮了,统计原来可以这么简单有趣,原来国内的统计教材是这么垃圾(叫做工具书差不多,而不应该称为教材),原来还有一种叫做Bayes的统计学派。上完这门课再回过头去看内容更翔实的书籍,我感觉效果更好
如果只是需要用统计,对数理没有要求,强烈推荐看 Coursera 上Princeton的
。已经停课,但是可以在百度盘搜到下载。 Open course不说了,课程视频比较短,但是内容非常丰富,有广度,涉及太深的地方点到为止,但是基本原理,什么情况做什么…
以下书目和课程基于我个人经历:&br&1)高中是文科生&br&2)大学里没学高数(微积分,线代...)&br&3)没学过美国统计基础课(intro to statistics, probability, regression)&br&&br&&b&民间土方,野路子,学神请退散 ----------------------&/b&&br&&br&&b&&u&视频&/u&&/b&&br&1. 零门槛 &b&统计概念介绍&/b&&br&网易公开课&b&:&/b&&br&&b&&a href=&///?target=http%3A///special/Khan/khstatistics.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&可汗学院公开课:统计学&i class=&icon-external&&&/i&&/a&&br&&/b&&br&看这个把统计学的中英文术语,基本的假设检验理解后,看其他英文教材会快很多。&br&&br&&br&2. Coursera 上的系列课程&br&&br&a)DUKE University &br&新开的&a href=&///?target=https%3A//www.coursera.org/specializations/statistics& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Specialization&i class=&icon-external&&&/i&&/a&,去年我上DUKE的统计入门还只有一门statistical inference,现在做得更加细化了。主讲人Dr. Mine ?etinkaya-Rundel 就是后面我列的OpenIntro的创始人之一。DUKE的Coursera视频做得非常赞,课程例子很多,容易听懂&br&&br&b) Johns Hopkins University&br&特别经典的&a href=&///?target=https%3A//www.coursera.org/specializations/jhu-data-science& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Specialization&i class=&icon-external&&&/i&&/a&,去年跳着过了一遍。Johns Hopkins 应该是推广R 的大功臣,而且他家的public health很不错,课程的例子可能比较适合学动物科学的楼主(相比DUKE更具Biostatistics 特色)。不过我个人更喜欢DUKE制作的课程视频,所以答案里先推DUKE。&br&&br&c) University of Amsterdam&br&去年夏天我初学统计的时候这个&a href=&///?target=https%3A//www.coursera.org/specializations/social-science& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Specialization&i class=&icon-external&&&/i&&/a&还没开放,年底的时候看了视频,制作得很精美,很多概念都用手绘动画讲解地生动有趣。特别适合学社科或者对社科定量方法感兴趣的同学(和上面Johns Hopkins 的生统风相比,飘荡着哲学文艺气息)。&br&&br&把Coursera上的课都认真看了,能形成一个基本认识,接下来可能需要回头看书巩固一下。&br&&br&&u&教材&/u&&br&1.入门级&br&a) 社科定量入门&br&&img src=&/74eac18c37e9d257c97d6c2dccd63f52_b.png& data-rawwidth=&1246& data-rawheight=&1060& class=&origin_image zh-lightbox-thumb& width=&1246& data-original=&/74eac18c37e9d257c97d6c2dccd63f52_r.png&&&br&我在另一个问题里提过这本书,普林斯顿的教授写的,为政治学(文科生)写的定量入门书。书中的例子都是政治学和经济学的研究。(楼主是动物学的,这一点上只能凑合看了。要找本专业的定量入门可能要多Google一下)&br&&br&b) 数理入门 &img src=&/5e58a060afbd6120cea48e_b.png& data-rawwidth=&596& data-rawheight=&934& class=&origin_image zh-lightbox-thumb& width=&596& data-original=&/5e58a060afbd6120cea48e_r.png&&这本书是&a href=&///?target=https%3A//www.openintro.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&OpenIntro&i class=&icon-external&&&/i&&/a&出品的教材,网站上有三本免费下载的教材,这一本是在大学里面比较流行的。下载的PDF里还自带YouTube的讲解视频。(OpenIntro真是利国利民)&br&&br&2.初阶应用&br&a) 经典的计量经济学教材&br&&img src=&/ab84b1a525ec8da1c977_b.png& data-rawwidth=&362& data-rawheight=&474& class=&content_image& width=&362&&我看的是这一本。在国内最流行的貌似的古扎拉蒂和伍德里奇的译本都行(来自国内上过计量的同学,然而我并没有上过计量这门课)&br&&br&b) 在美国风评很好的计量教材&img src=&/a8adb441da9dff1dbf97ee4_b.png& data-rawwidth=&620& data-rawheight=&262& class=&origin_image zh-lightbox-thumb& width=&620& data-original=&/a8adb441da9dff1dbf97ee4_r.png&&Angrist做了太多经典的研究,计量教材里总绕不开他的paper,他写的教材也不会差。&br&&br&3.中阶应用&br&a) Gelman & Hill &br&&img src=&/a33bfe74e615d9360be71_b.png& data-rawwidth=&470& data-rawheight=&668& class=&origin_image zh-lightbox-thumb& width=&470& data-original=&/a33bfe74e615d9360be71_r.png&&&br&&br&出现在多家大学课程大纲里的一本教材。这本书非常厚,从PART1 - 2 -3算是初阶到中阶过渡。今年上Gelman的课,他讲统计模型非常通俗易懂(就是书太厚了,课上完了我也没看完)。&br&&br&&br&&br&b) 贝叶斯学派&br&&img src=&/dc9566fac3b1df965e59a_b.png& data-rawwidth=&454& data-rawheight=&672& class=&origin_image zh-lightbox-thumb& width=&454& data-original=&/dc9566fac3b1df965e59a_r.png&&统计一般从频率学派入门,讲到后面才会系统介绍贝叶斯学派,所以我就把贝叶斯教材放在放在应用层面了。又是Gelman 领衔,╮(╯▽╰)╭谁让人家是贝叶斯的大牛呢。我这样帮他推销教材他也不会谢我(╯_╰),傲娇如他。&br&&br&4. 高阶应用&br&高阶应用是没有教材的,我所指的高阶就是“走在学界先锋的模型”,一般都发在Journal上。等整成教材就变中阶了(我在说笑话吗:)。要学这类应用,要么跟着大牛做研究,要么上PhD的讨论课,要么看新发的paper。&br&&img src=&/dee80ace4f7f150e00835ccda9e6cabf_b.jpg& data-rawwidth=&2448& data-rawheight=&2448& class=&origin_image zh-lightbox-thumb& width=&2448& data-original=&/dee80ace4f7f150e00835ccda9e6cabf_r.jpg&&&br&我比较喜欢这一本,为此还去定了纸质版(又要吃土了)。楼主关心哪个领域去看哪个领域的定量模型就好。&br&&br&目前就说这么多(学沫我也只看过这些)。讲真我就是交换的时候随便选了一门政治系的定量课,因为老师长得帅,所以入了定量的坑。然后接下来的学期全选政治系的定量方法论,又遇到了男神Green和Gelman。然而我知道,这并没有什么X用,我还是一个没学高数的学沫。&br&&br&-----------------&br&╮(╯▽╰)╭学习这种事,重在体验,未来都是Top 2 和 hypsm students的,我就是分母中的一员,人艰不拆。能去office hour和老师聊聊人生就行了,开心最重要。&br&&br&至今听不懂概率论的我捂脸走了~
以下书目和课程基于我个人经历: 1)高中是文科生 2)大学里没学高数(微积分,线代...) 3)没学过美国统计基础课(intro to statistics, probability, regression) 民间土方,野路子,学神请退散 ---------------------- 视频 1. 零门槛 统计概念介绍 网易…
关于什么是大规模机器学习,可以参考[1, 2, 3]的讨论。显然,大小是个相对的概念,在机器学习的语境下也不例外,什么是大规模,这很大程度上取决于你所面对的应用以及可用的计算资源。在互联网应用成为机器学习主要应用领域之一的今天,能不能处理Google或者淘宝这样重量级的网站所生成的数据,成为互联网从业人员心目中大规模的标尺。&br&&br&从技术角度看,统计学习算法所能处理的数据规模有几个分水岭:&br&&br&1)算法是否依赖于对训练集的随机访问。依赖于训练集随机访问的算法需要将训练集全部加载进内存,所能处理的数据量受内存大小的限制。&br&&br&2)算法是否能有效地利用分布式(或并行的)计算资源。单台计算机(或单处理器)的处理能力毕竟是有限的。如果可用的计算资源增长100倍,算法能处理的数据量的增长远小于100倍,则算法的适用范围也会有很大的限制。&br&&br&以上主要是围绕训练集的规模在讨论,实际上还会有更多需要考虑的问题,比如数据的维数、分类类别的数目、检测时的效率等等问题,可以参考[2]及其中提到的相关文献。如[3]中所说,(传统的?)统计学习的核心问题是样本不足时如何得到泛化能力很强的模型,但对于大规模学习来说,障碍往往在于算法的计算能力不足,不是数据不够,所以也可以说传统的统计学习方法都不适合大规模数据处理(不只是SVM)。&br&&br&因为互联网应用的推动,最近几年这个领域新结果非常多。总体来说,对于基于支持向量机的大规模线性分类问题,目前已经能比较好地解决。[4]对现有结果做了比较好的总结,[2]则对需要进一步解决的问题有很好的概述。&br&&br&对于非线性分类问题,基于Dual Decomposition(或者SMO)方法的SVM-Light和LibSVM目前仍被广泛使用,他们最坏情况下复杂度是O(训练样本数的平方),并不适合在大规模数据集上做训练。Pegasos[5]的复杂度同训练样本数呈线性关系,但实验中效率并不高于SMO方法。盛佳提到的PSVM[6]利用分布式计算资源降低训练耗时。不过在我接触过的应用场景里(比如对象检测),非线性SVM的最大问题不是训练时代价问题,而是检测时代价太高,在实际应用中基本上已经退出竞争。当然,相关的研究并没有终止——毕竟不同的应用场景会有不同的需求。&br&&br&对于未来的发展,还是多看看[2]吧。&br&&br&[1] &a href=&///?target=http%3A//hunch.net/%3Fp%3D330& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&hunch.net/?&/span&&span class=&invisible&&p=330&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[2] &a href=&///?target=http%3A//hunch.net/%3Fp%3D1729& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&hunch.net/?&/span&&span class=&invisible&&p=1729&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[3] &a href=&///?target=http%3A///exdb/publis/pdf/bottou-lecun-04b.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/exdb/pub&/span&&span class=&invisible&&lis/pdf/bottou-lecun-04b.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[4] &a href=&///?target=http%3A//cseweb.ucsd.edu/%7Eakmenon/ResearchExam.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&cseweb.ucsd.edu/~akmeno&/span&&span class=&invisible&&n/ResearchExam.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[5] &a href=&///?target=http%3A//portal.acm.org/citation.cfm%3Fid%3D1273598& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&portal.acm.org/citation&/span&&span class=&invisible&&.cfm?id=1273598&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[6] &a href=&///?target=http%3A///p/psvm/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/p/psvm/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&
关于什么是大规模机器学习,可以参考[1, 2, 3]的讨论。显然,大小是个相对的概念,在机器学习的语境下也不例外,什么是大规模,这很大程度上取决于你所面对的应用以及可用的计算资源。在互联网应用成为机器学习主要应用领域之一的今天,能不能处理Google或…
1. Web performance APIs ,可以得到各种时间比如dns解析时间、连接时间、跳转时间、加载时间等指标,具体请自行查资料,不赘述。&br&2. 浏览器的私有API,比如 chrome.loadTimes()&br&3. DOM ready/load 事件&br&4. 白屏时间(first paint time)&br&5. 首屏时间(Above-the-fold time)&br&&br&4和5尚无公认的确定方法和对应api。特别是5,怎么定义首屏没有统一的标准。因此需要自行确定,并用一些相对hack的方式获取。前一段时间百度和腾讯都有人分享过他们的做法,可以参考,具体链接等回头找到了再补。&br&&br&如果只是要大致了解网站的性能,最简单的办法是使用Google Analytics,它包含了性能统计。如果要非常细致的数据(比如web performance api上的数据),可以自己写,也可用我写的这个库:&a href=&///?target=http%3A///hax/WebPerf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/hax/WebPerf&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& (有基本的兼容处理,但优化不够,所以我们自己只取样5%~10%的用户加载这个脚本。下个月我还会抽时间改进)。
1. Web performance APIs ,可以得到各种时间比如dns解析时间、连接时间、跳转时间、加载时间等指标,具体请自行查资料,不赘述。 2. 浏览器的私有API,比如 chrome.loadTimes() 3. DOM ready/load 事件 4. 白屏时间(first paint time) 5. 首屏时间(Abov…
谢邀,这算助攻吗;)&br&============================&br&&p&这个系列会向大家介绍FIBA和NBA各项技术统计(如篮板、助攻、抢断、失误等)的统计标准和典型案例。本文是第二篇,介绍助攻数据的统计。&/p&&p&本文首发于我的公众号:全篮球。如需回顾本系列之前的文章,可以通过公众号菜单检索。&/p&&br&&p&&strong&助攻统计的定义&/strong&&/p&&br&&p&在FIBA技术统计中,所谓助攻(Assist),是指一次直接导致队友得分的传球。只有队友接球后第一时间攻击篮筐并进球,这次传球才能称之为助攻。&/p&&br&&p&形成助攻的前提是得分和传球。只有让队友拿到分数的传球才能统计助攻。例如球员A1准确的长传给前场无人防守的A2,但是A2上篮不中,虽然他还有充分的时间自己拿下篮板并补篮得分,这个案例也不形成助攻。&/p&&br&&p&每一个进球只能记录一次对应的助攻。同样是A1妙传给前场无人防守的A2,但是A2选择手递手传球给跟进的A3轻松上篮得分,虽然很大程度上是A1创造了这次得分机会,但他的妙传也不是技术统计意义上的助攻。助攻只能记录给A2,即得分前的最后一次传球。&/p&&br&&p&传球的方式并不影响助攻的判定。例如我们在上一篇篮板统计中提到,A1在快攻中击板传球给A2,A2空中接力灌篮得分,应给A1记录一次助攻,A2一投一中。另外,掷球入界时直接传球得分也是一次助攻,NBA的统计手册特意指出了这一点,FIBA虽然没有明确,但是实际上也是可以的。&/p&&br&&p&当然,虽然传球的方式不限,但起码得是传球,例如A1和B1争抢篮板,A1将球随意打出篮下,正好落在队友A2手里,A2投篮命中,这时就不能记录A1一次助攻。又比如A1一个三不沾的投篮被A2抢到并补篮得分,因为这不是传球,应该记A1一次投篮不中,A2一次前场篮板和一次投篮命中——当然在野球场上,A1大可宣称自己是故意传球的!&/p&&br&&p&&strong&助攻统计的两个关键点&/strong&&/p&&br&&p&假如接到传球的队友&strong&第一时间开始了攻击篮筐的意图,并且一直到得分为止他始终保持着这一意图&/strong&&strong&,&/strong&那么即便中间他花了点时间去找回身体平衡,或者做了个小的技术动作,这并不影响一次助攻的统计。而如果一次传球给队友创造了一个很好的得分机会,但是队友停下来考虑了各种选择,之后才投篮得分,那么这次得分将被认为是得分者自己的贡献,不计算助攻。&/p&&br&&p&例如A1传球给A2,A2犹豫了一下想传给空切的A3,然而看到A3被人贴防,选择了自己投篮得分。这个案例不应统计助攻,因为A2没有立刻开始得分尝试。&/p&&p&又比如A1传给A2,A2运了一下球以找回身体平衡,然后投篮得分。这个例子中,只要A2始终保持了得分意图,就应该记A1一次助攻。&/p&&br&&p&传球给低位球员单打也可能形成助攻,前提是低位球员接球后第一时间攻击篮筐,例如直接转身投篮完成得分。但是内线低位单打通常会先持球用背部感知防守,然后再用步法攻击,因此靠给低位喂球刷助攻是比较困难的。&/p&&br&&p&投篮的距离、类型以及得分容易与否与助攻统计&strong&无关&/strong&。在终场前1秒钟A1甩锅给后场的A2,A2压哨超远投命中,A1也可以躺刷一次助攻。&/p&&br&&p&此外,进球前运球的次数也和助攻统计&strong&无关&/strong&,除非统计员觉得是进球球员的运球而非传球更有助于这次得分。例如A1发动快攻,传球给位于中圈的队友A2,A2前方无人防守,运球一条龙直接上篮得分。这是一次助攻。但如果A2还运球转身过掉了一个防守球员,那么就不能统计成助攻。&strong&统计员应该牢记一个原则:&/strong&&strong&得分者需要做的事情越多,传球者得到助攻的可能性就越少。&/strong&&/p&&br&&p&关于这点,FIBA在统计员手册中给出了两个案例帮助理解。&/p&&br&&p&案例一:A3传给A5,A5做假动作,转身,运了一次球后灌篮得分。&/p&&p&在绝大多数场合这不是一次助攻,因为A5自己为得分做出的贡献更多。&/p&&p&案例二:A3传给A5,A5运了一次球并做了一个头部(转向空位队友的)假动作,然后投篮得分。&/p&&p&记A3一次助攻,因为A5保持了进攻意图。&/p&&br&&p&注意这两个案例实质上反映了FIBA助攻统计的官方推荐尺度,统计员在比赛中技术统计的尺度应该尽量一致,不过在NBA,对于快攻和纵贯全场的长传,这个“连续动作”的标准是可以放宽的。&/p&&br&&p&助攻统计并非简单的是得分前最后一次传球或者是一次妙传,&strong&决定是否统计一次助攻的两个关键点是:得分者需要做的事情的多少,以及是否第一时间尝试得分。&/strong&&/p&&br&&p&NBA的助攻统计和FIBA在精神上是一致的,甚至严格来说,2015版的统计员手册在尺度上和NBA也相当接近。但是在实践中,如我们所感觉到的,NBA的助攻统计的确是会略微宽松一些。&/p&&br&&p&&strong&技术统计的主观因素&/strong&&/p&&br&&p&既然统计存在尺度问题,那么主观因素的影响就很难避免。助攻、封盖、失误、甚至抢断和篮板或多或少都会有人为的因素存在,对正常的统计差异应给予理解。&/p&&br&&p&即便是在先后复查数次技术统计,严谨程度吊炸天的NBA,各队主场记录员在统计这些主观数据(例如一系列攻击动作后的投篮算不算助攻、手指蹭到球算不算盖帽等)时对主队有意或者无意的照顾也是一个现实存在。雅虎就曾经有专栏文章指出隆多在助攻统计方面受照顾颇多,而虎扑FBA区的网友无敌猴子更统计过在NBA联盟主队的助攻数平均要比客队大约多7%(得分只多了3%)。在另一项封盖统计上,主队则比客队高出了约20%,虽然具体有多少是来自统计员方面的贡献并不好说,但20%已经是一个很显著的差距了。&/p&&br&&p&&strong&助攻统计的一些细节澄清&/strong&&/p&&br&&p&如果你在维基百科上查助攻的概念,会发现一句话:“ A pass that leads to a shooting foul and scoring by free throws does not count as an assist in the NBA, but does in FIBA play.”,也就是说FIBA会把导致投篮犯规并罚中至少一球的传球计算为助攻(NBA不计)。这点可能会颠覆包括我在内的很多人对助攻统计的认知,所以我特意去确认了这个问题。&/p&&br&&p&情况是这样的:在较早版本的FIBA技术统计员手册中的确有一个例子,说明了投篮犯规罚球得分也能统计助攻:&/p&&p&&em&8. Immediately following a pass from A2, A3 is fouled in the act of shooting. A3 misses the first three throw, and makes the second. &/em&&/p&&p&&em&Charge A2 with anassist, A3 with two FTA’s and one FTM.&/em&&/p&&br&&p&然而我们看到,在最新版的统计手册中,大概是因为这点太过非主流,或是为了和NBA接轨,FIBA已经偷偷的将它去掉了。所以我们大概不用再考虑这个问题了。&/p&&br&&p&另外还要澄清的一点是:虽然CBA联赛在原则上应该采用FIBA的统计标准,但是实践中有所简化,在CBA《技术统计工作规范》中,&strong&球员接到传球后做了攻击动作,包括不同方向的转身,都不统计助攻。&/strong&当然这只是CBA的技术统计规范,而非整个FIBA,请各位注意区别。&/p&&br&&p&&strong&高阶助攻统计数据&/strong&&/p&&br&&p&和助攻有关的高阶数据,最常用的是助攻失误比,即球员助攻数和失误数的比率,这个数据一般而言是评价组织后卫的能力和风格的,助攻失误比越高,表示风格越稳健,传球稳定性越强。&/p&&br&&p&然而,对于例如&a href=&///?target=http%3A///nba/players/lebronjames-650.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&詹姆斯&i class=&icon-external&&&/i&&/a&这样在组织的同时需要大量持球拿分的go-to guy,评价传球稳定性可以考虑采用82games的Assists/Badpass统计,即助攻数和传球失误数的比率,这样可以刨除持球失误带来的影响。&/p&&br&&p&82games还可以查到一个著名的高阶数据受助攻率,即球员进球来自于队友助攻的比率。这个数据从一个方面反映了球员自主进攻的能力和倾向,但此数据其实和位置强相关,中锋最高,控卫最低,且干扰因素较多,用来解读一个球员是否倾向于单干容易引起争议。&/p&&br&&p&最后谈一个basketball-reference高阶数据助攻率,或称助攻百分比,助攻率计算球员在场上时,他助攻队友的进球数与全队总进球数的比值。这个数据从某种程度上反映了球员带动全队的能力。&/p&&br&&p&&strong&一些助攻记录&/strong&&/p&&br&&p&NBA单场的助攻记录由我魔前任教练斯凯尔斯(Scott Skiles)保持。1990年他还是&a href=&///?target=http%3A///nba/teams/magic& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&魔术&i class=&icon-external&&&/i&&/a&球员,在12月30日对丹佛&a href=&///?target=http%3A///nba/teams/nuggets& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&掘金&i class=&icon-external&&&/i&&/a&的比赛中怒刷30次助攻。&/p&&p&NBA史上助攻记录由&a href=&///?target=http%3A///nba/tag/%25E6%2596%25AF%25E6%E5%E9%25A1%25BF& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯托克顿&i class=&icon-external&&&/i&&/a&保持,共计15806次。场均助攻记录则来自&a href=&///?target=http%3A///nba/tag/%25E9%25AD%%259C%25AF%25E5%25B8%%25BA%25A6%25E7%25BF%25B0%25E9%A& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&魔术师约翰逊&i class=&icon-external&&&/i&&/a&,生涯场均11.2次。&/p&&p&顺便谈下&a href=&///?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&奥运会&i class=&icon-external&&&/i&&/a&,中国球员在一届奥运会上助攻数最高的是李晓勇,1996年他在亚特兰大8场比赛拿到33次助攻,场均4.1次也是国家队在奥运会比赛中的记录。&/p&&br&&p&&i&[1] FIBA, BASKETBALL STATISTICS MANUAL [E]. FIBA ASSIST MAGAZINE 2005(15): 42-43&/i&&/p&&p&&i&[2] NBA, STATISTICIANS’ MANUAL [E]&/i&&/p&&p&&i&[3] 中国篮协, CBA职业联赛技术统计工作规范 [E]&/i&&/p&&p&&i&[4] Kelly Dwyer, Rajon Rondo leads theNBA in stolen assists [J/OL] &a href=&///?target=http%3A///nba/blog/ball_dont_lie/post/Rajon-Rondo-leads-the-NBA-in-stolen-assists%3B_ylt%3DAl6YzhbcXxwrr1Gdyv_zCX28vLYF%3Furn%3Dnba-.1.18& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&nba/blog/ball_dont_lie/post/Rajon-Rondo-leads-the-NBA-in-stolen-_ylt=Al6YzhbcXxwrr1Gdyv_zCX28vLYF?urn=nba-.1.18&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/i&&/p&&p&&i&[5] 无敌猴子, 主场优势 [EB/OL] &a href=&///?target=http%3A///1879883.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/1879883.ht&/span&&span class=&invisible&&ml&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/i&&/p&&p&&i&[6] &a href=&///?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& [DB/OL] &a href=&///?target=http%3A//www./& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&NBA & ABA Basketball Statistics & History&i class=&icon-external&&&/i&&/a&&/i&&/p&&p&&i&[7] &a href=&///?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& [DB/OL] &a href=&///?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&In depth coverage of the NBA &i class=&icon-external&&&/i&&/a&&/i&&/p&&p&&i&[8] FIBA, FIBA archive [DB/OL] &a href=&///?target=http%3A///pages/eng/fa/team/p/sid/2944/tid/262/_/1996_Olympic_Games_Tournament_for_Men/accumulated-statistics.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&China accumulated statistics&i class=&icon-external&&&/i&&/a&&/i&&/p&&p&&i&[9] Wikipedia [DB/OL] &a href=&///?target=https%3A//en.wikipedia.org/wiki/Assist_%28basketball%29%253C/span%253E%253C/strong%253E%253C/span%253E%253Cstrong%2520style%3D/%2522color%3A%2520rgb%B%2520line-cdth%px%3B%2520margin%3A%25200px%3B%2520padding%3A%25200px%3B/%3Cspan%2520style%3D/%2522margin%3A%25200px%3B%2520padding%3A%25200px%3B%2520font-size%3A%252014px%3B/%E& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&https://en.wikipedia.org/wiki/Assist_(basketball)&i class=&icon-external&&&/i&&/a&&/i&&/p&
谢邀,这算助攻吗;) ============================ 这个系列会向大家介绍FIBA和NBA各项技术统计(如篮板、助攻、抢断、失误等)的统计标准和典型案例。本文是第二篇,介绍助攻数据的统计。本文首发于我的公众号:全篮球。如需回顾本系列之前的文章,可以…
关于这个问题,我在人大经济论坛爱问频道做过一个专题,曾经整理了11位坛友的答案以及找论文方面的精典贴子做过汇总。下面是文章的内容,可以看看:&br&&b&1、识字耕夫坛友&/b&&br&--------&b&我们可以通过几个渠道获得中国的数据&/b&。查找《中国统计年鉴》等是一个选择,特别是在几年前,几乎是唯一的选择。 如果你需要一应俱全的最新宏观经济数据,一个宝贵的来源是中国国家统计局提供的《进度统计数据》,网址是&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%252Fwww.%252Ftjsj%252F& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www./tjsj/&i class=&icon-external&&&/i&&/a&。 国研网:&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%.cn%252FDRCNET.Channel.Web%252F& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&.cn/DRCNET.Channel.Web/&i class=&icon-external&&&/i&&/a& 。&b&如果你想要从数据收集之日起的较为完整的宏观经济数据,&/b&《新中国五十年统计资料汇编》和《新中国55年统计资料汇编》是一个不错的选择。遗憾的是,它们都没有提供电子版,但后者可以在中国资讯行下载。&b&如何找美国的数据?&/b&可能你已经留意到了,好多有关美国的图形,都是采用《总统经济报告》(2005)所附数据生成的。这些数据可以免费下载,网址是&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%252Fwww.access.gpo.gov%252Feop%252F& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&www.access.gpo.gov/eop/&i class=&icon-external&&&/i&&/a&。&b&如何找国外其它经济体的数据?&/b&OECD的网址是&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%252Fwww.oecd.org& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&www.oecd.org&i class=&icon-external&&&/i&&/a&,提供三种极为有用的数据。《OECD经济展望》(OECD Economic Outlook),每年出版两次,提供许多跨国宏观经济数据。这些数据一般都上溯到20世纪70年代,而且具有很好的一致性。&br&&br&&b&2、caoanroad4800坛友&/b&&br&--------&b&不搞数据,不直接钻到各种数据里,直接和数据打交道,能做出什么学问来?&/b&我们研究所里,今年开始入学的博士,都开始着重加强数据功夫的培养了。模型不模型的是一方面,计量不计量的是另一方面,&b&单就数据本身,要摸透几本最简单的统计年鉴,&/b&哪个数据在哪里有,最早可以上溯多少年,是否有重复出现的,哪个数据没有但是可以用一组类似数据做近似测算,简简单单的&b&数据基本功&/b&。模型做的好不好,一方面是文献阅读和积累,但多多少少要靠天分;而&b&数据不需要天分,扎扎实实一步一步摸出来,就是个笨功夫,但不可或缺。&/b&&br&&br&&b&3、zhoujj0724坛友&/b&&br&--------&b&在数据收集中的四大体会就是:及时作好记录、定期对数据进行整理,定期访问重要网站,充分利用“垃圾时间”&/b&。在数据来源方面,一手的资料来自调研、实验和观察。二手的资料主要有这么几类,公开出版物(统计年鉴等)、官方网站(公报、市场分析报告等)、学术论坛等等。&br&&br&&b&4、夸克之一版主&/b&&br&--------&b&一点不做数据也不是不可以,那你的理论水平和数学建模水平要非常高&/b&,比如做博弈论、贸易理论、宏观理论(非模拟部分),可以不用计量和数据。但问题在于,一般不想做数据的人,未必能搞得定理论建模。。。&br&&br&&b&5、ciang坛友&/b&&br&--------(关于农地制度的数据方面)这方面做的东西很多,很有趣。&b&CHNS、CHIPS和CFPS数据&/b&里面都有很详细的农地信息、农作物信息、村庄信息。&b&如果你要做更好的问题,去找到上海交大的史清华,他有全国做农地问题最好的固定观察点数据&/b&。但是,用前三个数据已经能做很好的问题了,现在国内做农村问题的人,都做得不算好。你把农地和整个中国的环境结合起来,能发现很多在学术上和政策上都非常有意义的问题。&br&&br&&b&6、章腾飞坛友&/b&&br&--------想找&b&报价公司提供有价证券的数据、信息&/b&。如有价证券一览表、快报 &a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%%252Fqc%252Fdefault.aspx& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&/qc/default.aspx&i class=&icon-external&&&/i&&/a& ;产业经济的相关数据,部分内容可试用 &a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%252Fwww.%252F& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www./&i class=&icon-external&&&/i&&/a& 。&br&&br&&b&7、hybbc坛友&/b&&br&--------我经常用到工商方面的数据,有一个发现就是,商务部的网站看看,有一个连接叫&b&“国别报告”的&/b&,可以查到中国和其他国家的贸易统计数据。&br&&br&&b&8、西风狂诗曲坛友&/b&(回复如何用学校论文库找数据的问题)&br&--------&b&想要精确些,就找高级检索,&/b&然后把所需文献的关键词尽量放进去检索,后面还有个相关度的查询也可以调整,&br&不过文献综述搜寻工作本身就是很辛苦的,建议你运用一些软件做整理,这样效率会更高些,再有就是平时多关注积累,&b&从文献的引用文献搜寻也是一个办法。&/b&&br&&br&&b&9、mpdjohn坛友&/b&&br&--------&b&我常用的有这些个:国泰安数据库,CCER数据库,万方数据库,CNKI,维普期刊,中经网统计数据库&/b&这些都可以。金融数据库,一般导师或大学购买其资源。学校图书馆都会购买一定数量的数据库,数据库简介会有收录学科范围等,看看哪些库适合你,如果你不太清楚,可找图书馆参考咨询部人员(网上有电话),他们会告诉你怎么使用相关的数据库。若图书馆没有的文献,还可通过文献传递解决。中国高校人文社会科学文献中心(CASHL)近几年一直在推动全国高校的文献传递工作,效果很好,可以跟图书馆联系。&br&&br&&b&10、FreeLee2坛友&/b&&br&--------除了找论文网站,&b&我们也可以直接搜索某个专题的论文。&/b&看过论文的都知道,一般的论文,都有一定的格式,除了标题、正文、附录,还需要有论文关键词,论文摘要等。其中,&b&“关键词”和“摘要”是论文的特征词汇&/b&。而论文主题,通常会出现在网页标题中。例:在Google上搜 “关键词 摘要 intitle:物流”。Google学术搜索:&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&&i class=&icon-external&&&/i&&/a& 百度国学搜索:&a href=&///?target=http%3A//bbs.pinggu.org/link.php%3Furl%3Dhttp%253A%252F%252Fguoxue.baidu& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://guoxue.baidu&i class=&icon-external&&&/i&&/a&。&br&&br&&b&11、lk2556坛友&/b&&br&--------&b&国外主要资源,有这么几个是最查被用到的,建议可以优先考虑的哈&/b&。(1)&b&SpringerLink&/b&:包含学科:化学、计算机科学、经济学、工程学、环境科学、地球科学、法律、生命科学、数学、医学、物理与天文学等11个学科,其中许多为核心期刊;(2)&b&IEEE/IEE&/b&:收录美国电气与电子工程师学会(IEEE)和英国电气工程师学会(IEE)自1988年以来出版的全部150多种期刊,5670余种会议录及1350余种标准的全文信息;(3)&b&Engineering Village&/b&:由美国Engineering Information Inc.出版的工程类电子数据库,其中Ei Compendex数据库是工程人员与相关研究者最佳、最权威的信息来源;(4)&b&ProQuest&/b&:收录了1861年以来全世界1,000多所著名大学理工科160万博、硕士学位论文的摘要及索引,学科覆盖了数学、物理、化学、农业、生物、商业、经济、工程和计算机科学等,是学术研究中十分重要的参考信息源;
关于这个问题,我在人大经济论坛爱问频道做过一个专题,曾经整理了11位坛友的答案以及找论文方面的精典贴子做过汇总。下面是文章的内容,可以看看: 1、识字耕夫坛友 --------我们可以通过几个渠道获得中国的数据。查找《中国统计年鉴》等是一个选择,特别…
&b&不请自来。&/b&&br&简单说:数据挖掘就是从海量数据中找到隐藏的规则,数据分析一般要分析的目标比较明确,数据统计则是单纯的使用样本来推断总体。&br&&br&&b&主要区别:&/b&&br&&ol&&li&“数据分析”的重点是观察数据,“数据挖掘”的重点是从数据中发现“知识规则”KDD(Knowledge Discover in Database),数据统计的重点是参数估计和假设检验。&br&&/li&&li&“数据分析、数据统计”得出的结论是人的智力活动结果,“数据挖掘”得出的结论是机器从学习集(或训练集、样本集)发现的知识规则。&/li&&li&“数据分析”需要人工建模,“数据挖掘”自动完成数学建模,“数据统计”则是把模糊估计变得准确而定量。可以通过机器学习自动建立输入与输出的函数关系,根据KDD得出的“规则”,给定一组输入参数,就可以得出一组输出量。&br&&/li&&/ol&&br&&b&举个简单的例子:&/b&&br&&ul&&li&有一些人总是不及时向电信运营商缴费,如何发现它们?&br&&/li&&/ul&&b&数据分析:&/b&通过对附近人口的生活习惯、业余爱好、教育背景、收入分布、家庭组成等进行全方面分析,发现很多人都习惯在收到欠费通知以后再缴费。结论就是提前发放短信提醒。&br&&br&&b&数据挖掘:&/b&通过编写机器学习聚类算法发现无法通过观察图表得出的深层次原因。发现家住在五环以外的人,由于居住环境偏远没有时间上营业厅缴费。结论就需要多设立一些营业厅或者自助缴费点。&br&&br&&b&数据统计:&/b&通过统计学推理方法组成样本的试验单元进行参数估计和假设检验,我们发现不及时缴钱人群里的贫困人口占82%。所以结论是收入低的人往往会缴费不及时。结论就需要降低资费。&br&&br&以上。如有需要再补充。
不请自来。 简单说:数据挖掘就是从海量数据中找到隐藏的规则,数据分析一般要分析的目标比较明确,数据统计则是单纯的使用样本来推断总体。 主要区别: “数据分析”的重点是观察数据,“数据挖掘”的重点是从数据中发现“知识规则”KDD(Knowledge Discov…
我没有看到过统计的数据,不过以十年的弹琴和几年的教学经验做一个粗略的估算,以下估算仅代表个人看法。&br&首先中国应该是世界上弹吉他人最多的国家,大概有两千万人弹过吉他,大部分是打酱油的,把吉他当作爱好一直有弹的大概有十分之一,两百万左右,弹的好的就又只有十分之一,二十万人左右,有一定专业素养的吉他手再十分之一,两万左右,演奏家水平的,或者是国内一流的再百分之一,两三百位吧。(以上数据全凭经验估算,毫无可靠数据支持)就算目前中国还不是弹吉他人口最多的,再过两年肯定是。你看每年的上海乐展,一大半的吉他厂商是来自广州惠州的吉他工业园区,还有一小部分来自潍坊,这些吉他厂每年为世界生产几百万把吉他。但是这并不是一个值得高兴的信息,那是因为这是基于中国庞大的人口基数。虽然有14亿人口,美国才3亿,日本才一亿,按照道理来说,中国弹吉他的人应该是美国和日本加起来的三、四倍,但事实肯定是没有的,保守估计应该就和美国弹吉他的人差不多,最多和美日两国的弹吉他的人总数差不多。当然吉他是人家美国的名族乐器,人家玩的比率自然要高一点,这点我认同。可日本呢?吉他也不是日本的名族乐器啊,为什么日本人整体玩的都比我们好,水平远在我们之上?就是因为教育啊,艺术教育,或者说音乐教育。像吉他,钢琴这种全面的,美好的和声乐器,其实早就已经是世界的文化财产了,可以说是世界乐器,只是它诞生于欧洲。如今世界,人类一家,世界大同。只要你的东西确实好,自然全人类都会拿来共享,比如西方的科技体系,确实是科学合理,提高生产力和生产效率,我们只能学习,不然还得落后,还得挨打。在比如西方的乐器和整个乐理系统,也确实是科学先进啊,我们也只能学习。都是学?为什么日本学的比我们好么?学的比我们久是一方面,最主要还是重视音乐教育,目前国内的教育,大城市稍微好一点,在我生长的二三线城市,几乎完全不重视艺术教育,像我们这一代长大的时候,音乐美术体育课被主课老师拿来讲习题的记忆应该不少吧?学习成绩决定一切。之前看过台湾的吉他大师陈彦宏讲过一个视频,说在亚洲只有日本的音乐学院有吉他专业。国内目前只有少数几个音乐学院有古典吉他和电吉他专业,之前听说四川音乐学院准备搞指弹专业,不知道后面怎么样了?其他就只剩下一些民间的艺术学校有了,比如北京迷笛,现代,上海jz school。在国内,我以前高中时候,整个氛围给人的感觉就是那些成绩不好的学生才去学音乐,美术,或者体育,做特长生考个本科好考一点,成绩好谁学艺术?成绩好的整个就瞧不起的艺术特长生的感觉。我真遗憾我从小就成绩很好,爸妈就让我好好读书,没有从小学艺术,当然他们也没有那个概念,高中的时候实在是太喜欢方大同,陶喆,太喜欢黑人音乐,借钱借吉他也要开始学。后来大学报了个土木工程专业,也是因为听家里人说这个专业好,赚钱。啥也不懂稀里糊涂的就报了,真的很羡慕国外的教育在高中毕业以后,会有一年的时间留给你周游世界,去社会实践,找到什么是自己真正想要的,再回去选你想学习的专业。大学以后练琴时间越来越长,整个大学就是在学校旁边琴行练了四年琴,中间慢慢确定了音乐才是我真正想要的人生,哪怕没有钱,并不富裕。因为从事音乐教育工作,我会看一些教育的知识,推荐每一位教育行业者看一下余泽彬老师的节目,小余老师说,他讲的想法真的非常有创意,对我国的教育的剖析也非常淋漓尽致,一针见血,让我受益匪浅。但我知道,这也是我们的现状和国情,中国这片土地从几十年前的贫困狼藉,到现在已经成功养活了世界五分之一的人口,而且让一部分人已经富裕到足矣改变世界了,我们国家已经做得很好了,而且必将会越来越好。&br&前面说到中国弹吉他的人比率肯定不如日本和美国,主要在人口基数上占有绝对优势,那质量呢?更差的远了。陈彦宏老师讲,他去美国参加指弹比赛的时候,借住在别人家,美国的家庭,家家户户都有一两把吉他,马丁28就放在家里的沙发上,人家根本不觉得那是多贵重的乐器,也确实,马丁28在美国也就2000刀左右,美国人均GDP在16年在60000刀左右,也就是平均每个美国人一年的生产价值都值30把左右,难怪他们稀松平常的对待了。在国内的话。一把马丁28要卖到一万五RMB,在一线城市里,收入可观的白领一个月的收入。在平均工资收入两三千的二三线城市,那就是半年不吃不喝的收入啊,买一把能不稀奇贵重么?能不像贡神仙似的贡着么。我有一朋友,河南人,当年买了把泰勒314,一万三,震惊了整个县城,都说那谁家某某某疯了,买了把一万多的吉他。。到普通的吉他爱好者,能有个几百块钱的合板琴就不错了,就像我当年学琴,学费也没有,琴还是找同学借的。那时候要有现在我仓库里最垃圾的一把入门合板琴,我肯定要感动流泪了。琴就差这么多,那弹琴的人呢?差的更多。大部分都是觉得弹琴很帅,觉得吉他是把妹的神器的,这样的绝大部分会放弃。因为他不是自己喜欢音乐喜欢吉他,而是觉得会吉他别人会喜欢他。还有就是看了综艺节目那些偶像歌手,三脚猫功夫弹了个吉他,头脑一热也想弹,作为一个音乐爱好者,你没有强烈的热爱和一定要弹好琴的决心,你一定会放弃,说好听点叫知难而退。这是大部分爱好者的境遇。那那些真心想弹好吉他的,想走专业路线的,想在吉他有所作为的人呢?比如我。前面说到了,很多音乐学院连吉他专业都没有,就少数几个学校有古典吉他和电吉他专业,上海音乐学院有爵士吉他专业。二三线城市呢,基本没有专业的吉他教学,只有琴行里大部分都是兼职玩吉他的二流子。只有在北上广这样的一线城市里,有私人民办的专业吉他学校了。二三线城市当然也有个别民办的学校,只是跟一线的比还不够厉害而已。每年的音乐节,也大部分都在北上广这些一线城市,日本呢,音乐学院都有吉他专业,不光古典,爵士也相当厉害了。美国呢,哪怕不是音乐人的家庭,每天晚上睡觉之前,爸爸妈妈都会拿出他们的吉他和谱本,爸爸弹,全家人一起唱,唱了半小时以后,小朋友在拿起吉他来随便在那弹弹弹,好了,累了,去睡觉了。这是陈彦宏老师在美国比赛时看到的场景。他们的那些音乐节已经举办了几十年的历史,随便在某个音乐节上的孩子,都抱着个吉他跑来跑去,遇到另一个小朋友,打招呼的方式就是,“hey,you !jam ?”“喂,你小子,敢不敢跟我即兴?”“来就来,who 怕who!”然后两个小孩子就在那抱着个跟自己差不多大的琴你一句我一句的对飚solo……陈彦宏老师说,他的学生去澳洲留学,给澳洲人看台湾的流行音乐,台湾的流行音乐不都是那种歌手站在空旷舞台的中间,镜头从头给到尾,那些乐手躲在边边上,某个舞台的角落,挤在一起。。。澳洲的小伙伴看了,大笑了三分钟停不下来,说这是你们的流行音乐?我们的流行音乐都是演奏的。。。是啊,这样的氛围才能出来像Tommy和John willimas这样的世界级大师啊!在国内吉他还没弹两下,大部分的观众就是问“你怎么还不唱?”,“这首歌前奏怎么这么长?”,“你连唱歌都不会,还弹什么吉他,拉二胡去吧!”……这种氛围就算有成为世界大师的天赋的孩子大部分也被抹杀了。&br&&br&没错,这就是现在的情况,但我仍然对我们祖国的未来充满乐观。是的,差距确实很大,但我也确实看到我们进步的速度惊人。台湾的指弹元年是87年,由于一本叫《摩登吉他奏法》的书籍的问世,到现在已经经历了四代传承。我们的指弹元年最多是06年,十年时间,现在已经涌现了很多十分有潜力的吉他演奏家,他们离世界级还有差距,他们也都无时无刻不在奋发图强的努力。现在在网路上看到一些孩子,才十几岁,已经弹的令人惊奇的水平了,真的非常感动。我衷心的祝福我的祖国在不远的未来,成为世界上经济,文化,艺术都引领世界潮流的世界强国。&br&我感觉以中国这种的自古以来海纳百川的博大情怀,待我们成为世界最强的同时,就是世界大同之时,那时地球上人类一家,共筑地球村。
我没有看到过统计的数据,不过以十年的弹琴和几年的教学经验做一个粗略的估算,以下估算仅代表个人看法。 首先中国应该是世界上弹吉他人最多的国家,大概有两千万人弹过吉他,大部分是打酱油的,把吉他当作爱好一直有弹的大概有十分之一,两百万左右,弹的…
不邀自来。讲到“规则”与“统计”,这里的故事就长了,先把一把这两个冤家的爱恨情仇。&br&
基于统计的自然语言处理是哲学中的经验主义,基于规则的自然语言处理是哲学中的理性主义。在哲学领域中经验主义与理性主义的斗争一直是此消彼长,这种矛盾与斗争也反映在具体科学上,如自然语言处理。&br&
早期的自然语言处理具有鲜明的经验主义色彩。如1913年马尔科夫提出马尔科夫随机过程与马尔科夫模型的基础就是“手工查频”,具体说就是统计了《欧根 奥涅金》长诗中元音与辅音出现频度;1948年香农把离散马尔科夫的概率模型应用于语言的自动机,同时采用手工方法统计英语字母的频率。&br&
然而这种经验主义到了乔姆斯基时出现了转变。&br&
1956年乔姆斯基借鉴香农的工作,把有限状态机作用刻画语法的工具,建立了自然语言的有限状态模型,具体来说就是用“代数”和“集合”将语言转化为符号序列,建立了一大堆有关语法的数学模型。这些工作非常伟大,为自然语言和形式语言找到了一种统一的数学描述理论,一个叫做“形式语言理论”的新领域诞生了。但乔老爷子干完这一票之后,挥一挥衣袖,说了一句&br&&blockquote&“有限状态模型不适合用来描述自然语言”。&/blockquote&
随后老爷子又补了一刀&br&&blockquote&“应当认识到‘句子的概率’这个概念,在任何已知术语的解释中,都是一个无用的概念”。&/blockquote&
于是在他几乎所有著作中都采用理性主义的方法,也就是题主说的“基于规则的方法”。乔老爷子功不可没,一辈子都在试图建立“普遍语法”,也就是用有限的、严格的规则来描述无限的语言现象,风靡一时的“转换生成语法”算是在此基础上的巅峰。&br&
这个时代,“经验主义”被全盘否定,“理性主义”算是完胜。&br&
然而在20世纪50年代末到60年代中期,经验主义东山再起了。一大帮子学者普遍认为只有详尽的历史语料才能带来靠谱的结论。(注:这帮子学者基本都是理科生,搞统计学、计算机、电子的占多数)&br&
于是一些比较著名的理论与算法就诞生了,如贝叶斯方法(Bayesian Method)、隐马尔可夫、最大熵、Viterbi算法、支持向量机之类。世界上第一个联机语料库也是在那个时候的Brown University诞生的。语料库对统计自然语言处理的作用,你懂的,于是统计自然语言处理的发展又蹭蹭的上去了。&br&
但是总的来说,这个时代依然是基于规则的理性主义的天下,经验主义虽然取得了不俗的成就,依然没有受到太大的重视。但是金子总会发光的。&br&
到了80年代时候,大家发现之前背全盘否定的有限状态机是有合理的地方的。(嗯是的,人家在反思科学,咱们在反思文X大革命)为何大家会突然间去反思已经被认为是垃圾的东西呢?当然是乔老爷子也糊涂了,他的一些东西(Verbal Behavior 言语行为理论)被大家比较激烈的反对了...(越说越像哪谁了,逃)所谓非敌即友,过去被乔老爷子不屑的东西大家研究了一下,觉得其实很多地方还是很有道理的,于是就继续研究了下去。&br&
90年代以来,基于统计的自然语言处理就开始大放异彩了。首先是在机器翻译领域取得了突破,因为引入了许多基于语料库的方法(哈钦斯,英国著名学者)。1990年在芬兰赫尔辛基举办的第13届国际计算语言学会议确定的主题是“处理大规模真实文本的理论、方法与工具”,大家的重心开始转向大规模真实文本了,传统的仅仅基于规则的自然语言处理显然力不从心了。学者们认为,大规模语料至少是对基于规则方法有效的补充。到了年,经验主义就开始空前繁荣了,如句法剖析、词类标注、参照消解、话语处理的算法几乎把“概率”与“数据”作为标准方法,成为了自然语言处理的主流。&br&
讲了这么多历史,其实是想让题主知道,理性主义在自然语言处理的发展史上是有重要地位的,也辉煌了几十年,历史事物常常是此消彼长的,至于谁好谁坏,不是固定的,取决于不同时代的不同历史任务。总的来说,基于规则的理性主义在这个时代提起比较少,用的比较少,主要是由于以下几个缺陷:&br&
(1)鲁棒性差,过于严格的规则导致对非本质错误的零容忍(这一点在最近的一些新的剖析技术上有所改善);&br&
(2)研究强度大,泛化能力差。一个研究要语言学家、语音学家和各种领域的专家配合,在当前大规模文本处理的时间、资源要求下太不划算。且机器学习的方法很难应用,难以普及;&br&
(3)实践性差。基于统计的经验主义方法可以根据数据集不断对参数进行优化,而基于规则的方法就不可以,这在当前数据量巨大的的情况下的影响是致命的,因为前者常常可以通过增大训练集来获得更好的效果,后者则死板许多,往往不尽人意。&br&
但理性主义还是有很多优点的,同样经验主义也有很多缺陷,算是各有所长各有所短。不过个人不赞成将“理性主义”一棒子打死的态度,就像当初乔老爷子不该将“经验主义”一棒子打死。也不赞成一些知友“理科击败了文科”这种说法。不同学科有不同学科的研究角度,只能说某些的角度在某个特定的历史时期对提高生产力“更有用”,所以重视的人更多。但“有用”不代表胜利,暂时的“无用”更不能说是科学层面上的“失败”。尤其是在当前中文自然语言处理发展还不甚成熟的时期,私以为基于统计的方法在很多方面并不完美,“理性主义”的作用空间还很大,需要更多的人去关注、助力。&br&
以上。&br&&br&参考文献:《统计自然语言处理》——宗成庆
不邀自来。讲到“规则”与“统计”,这里的故事就长了,先把一把这两个冤家的爱恨情仇。 基于统计的自然语言处理是哲学中的经验主义,基于规则的自然语言处理是哲学中的理性主义。在哲学领域中经验主义与理性主义的斗争一直是此消彼长,这种矛盾与斗争也反…
谢邀。&br&&br&又有人提出这个问题,依稀想起来刚来知乎的时候,我跟几个学统计学的人的辩论。&br&&br&直接告诉你,方差分析是特殊情形的回归分析,是回归分析的特例。方差分析就是解释变量全为分组的dummy的回归分析。&br&&br&不信?看Wikipedia:&br&&blockquote&ANOVA is considered to be &b&a special case of &/b&&a href=&///?target=http%3A//en.wikipedia.org/wiki/Linear_regression& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&linear regression&i class=&icon-external&&&/i&&/a& which in turn is a special case of the &a href=&///?target=http%3A//en.wikipedia.org/wiki/General_linear_model& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&general linear model&i class=&icon-external&&&/i&&/a&. All consider the observations to be the sum of a model (fit) and a residual (error) to be minimized.&/blockquote&还有这个:&a href=&///?target=http%3A///why-anova-and-linear-regression-are-the-same-analysis/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Why ANOVA and Linear Regression are the Same Analysis&i class=&icon-external&&&/i&&/a&,里面解释的很清楚&br&&br&随便找个数据在Stata里面做一下:&br&&img src=&/2bffc04abe76d13b6316e_b.jpg& data-rawwidth=&634& data-rawheight=&499& class=&origin_image zh-lightbox-thumb& width=&634& data-original=&/2bffc04abe76d13b6316e_r.jpg&&看到没?结果是一模一样的。至于回归分析的ANOVA表,实际上是把残差平方和、总平方和和模型平方和算出来,细心的你会发现模型的&img src=&///equation?tex=R%5E2%3D0.Cfrac%7B760.529%7D%7BD& alt=&R^2=0.2086=\frac{760.529}{}& eeimg=&1&&&br&&br&所以你的问题,就要分情况了。如果你的解释变量是有连续的,只能用回归分析。如果都是离散的,都行。不过如果变量很多,还是建议用回归分析吧,线性回归解决各种问题的工具也多。&br&=================&br&&a data-hash=&cb0deb07eac6da1f06397& href=&///people/cb0deb07eac6da1f06397& class=&member_mention& data-editable=&true& data-title=&@赵卿元& data-hovercard=&p$b$cb0deb07eac6da1f06397&&@赵卿元&/a&我没有否认ANOVA的作用。在这个问题里面,题主问的是两者之间的关系,我就回答两者之间的关系,是特例。在另外一个问题里面,建议你看一下问题编辑日志:&a href=&/question//log& class=&internal&&知乎 - 与世界分享你的知识、经验和见解&/a&&br&&img src=&/48eb5dc45a5cfc5b722e720aaf5d7b2d_b.jpg& data-rawwidth=&642& data-rawheight=&518& class=&origin_image zh-lightbox-thumb& width=&642& data-original=&/48eb5dc45a5cfc5b722e720aaf5d7b2d_r.jpg&&这是一开始的时候的问题,题主问的是“做线性回归的时候,回归结果中都会包含ANOVA的分析”,题主问的是做线性回归之后的那张ANOVA表(上图有),根本不是ANOVA分析本身好吗?那个表格本质上是在计算线性回归的R2啊!&br&我不知道 &a data-hash=&ce56bff2e& href=&///people/ce56bff2e& class=&member_mention& data-hovercard=&p$b$ce56bff2e&&@Jack Diamond&/a&吧那个问题的“计量经济学”话题移除是何居心。我那个回答本质上就是想说,那张表格是计算R2用的,但是计量经济学并不关心R2。好了,你把这个话题移除了,我就彻底成了胡搅蛮缠了。。。。&br&&img src=&/3cdfecf889da7df07238bbbb_b.jpg& data-rawwidth=&366& data-rawheight=&445& class=&content_image& width=&366&&
谢邀。 又有人提出这个问题,依稀想起来刚来知乎的时候,我跟几个学统计学的人的辩论。 直接告诉你,方差分析是特殊情形的回归分析,是回归分析的特例。方差分析就是解释变量全为分组的dummy的回归分析。 不信?看Wikipedia: ANOVA is considered to be a …
看过一个谍战纪录片。&br&从用电情况,发现你家的用电量大了很多,从而推测出你家有大功率电器,而从那个年代,差不多可以断定就是发报机。&br&&br&如果有每家每户的用电系数,可以大致知道房屋入住率,从而决定是否需要供暖,物业配置。&br&&br&甚至于对电网的规划也很重要,现在很多城市你已经看不到电线杆与电线了吧,因为它埋到地下了,知道用电量,我可以优化地下布线。&br&此外,入驻同一片的住户,某种程度上有一致性,那就是消费能力,如果某家的电量从0猛增,大约可以预测她在装修,装修结束和装修过程需要买哪些东西?精准营销是不是用得上了?&br&&br&所以,如果能够拿到大量的数据并且有牛逼的分析师,能做的事情很多的!&br&纯手打,有关注大数据的欢迎加我信微:dashuju234
看过一个谍战纪录片。 从用电情况,发现你家的用电量大了很多,从而推测出你家有大功率电器,而从那个年代,差不多可以断定就是发报机。 如果有每家每户的用电系数,可以大致知道房屋入住率,从而决定是否需要供暖,物业配置。 甚至于对电网的规划也很重要…
张文彤SPSS初中级教程链接:&a href=&///?target=http%3A///s/1skhnOmT& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/s/1skhnOm&/span&&span class=&invisible&&T&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&... 密码 :x4qr&br&张文彤SPSS高级教程链接:&a href=&///?target=http%3A///s/1o7t6k4M& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/s/1o7t6k4&/span&&span class=&invisible&&M&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&... 密码 :p93m&br&这是张文彤老师的初中高级视频,对于想学习的人非常有用,喜欢的人记得给我点赞,同时欢迎大家能够分享自己的学习资料,充实大家,谢谢
张文彤SPSS初中级教程链接:... 密码 :x4qr 张文彤SPSS高级教程链接:... 密码 :p93m 这是张文彤老师的初中高级视频,对于想学习的人非常有用,喜欢的人记得给我点赞,同时欢迎大家能够分享自…
谢邀。&br&&br&大宗供需无非两个方面,供给需求,以及最后由供给需求导出的结转库存。&br&&br&供给方面,可以分为本区域内自产和进口两方面。&br&&br&农产品的自产主要分两方面,面积和单产。&br&&br&对于农产品面积,我们会在每年春天去产区跑一遍,主要跑当地的农业局生产队统计局,按区县统计春播面积,按年度变化(YoY change)和基年面积估计当年面积。同时会建立农民/调查员数据库,在整个crop season中定期打电话了解是否有风灾/干旱/洪涝灾害等情况。少数面积特别集中的作物,我们会做遥感测量。&br&&br&对于单产,我们通过两种方法进行double check。其一,秋季自行测产,就是围一块地,数棉桃/玉米棒子,称铃重/粒重。其二,farmer survey,我们建立有历年农民汇报亩产的数据库,一个县大概有十几个点左右。同时,在整个作物生长过程中,我们有自己的天气模型,可以根据气象数据预测作物单产。&br&&br&工业品的话,我自己没有做过,但重点是产能和开工率。一般传说中研究员去蹲客户门口数一天出多少辆卡车,这都是早期工业品研究员干过的事儿...&br&&br&进口来说的话,主要是根据海关数据。预测的话,根据他国的海关出口发运基本可以预测1-2个月的到港数。长期的预测的话,就得根据business sense了,市场上谁买了啥一般我们这种大公司都心里有数,按船期算一下,再按照市场深度估计一下demand,看还有多少to buy。这一部分的估计是非常考验人对市场的判断和理解的。&br&&br&需求的话没啥说的,问客户呗。我们的样本池就是我们的客户池...每个月会有一次消费调查,判断客户消费量及消费预测。这个小公司和期货公司没法做,因为根本没人搭理你...&br&&br&库存我们物流同事每个季度会给仓库打一次电话,基本上能cover 80%的特定品类仓库,包括内地库和保税库,以和我们平衡表中的结转商业库存做double check。工厂库存也会由销售做类似的调查。
谢邀。 大宗供需无非两个方面,供给需求,以及最后由供给需求导出的结转库存。 供给方面,可以分为本区域内自产和进口两方面。 农产品的自产主要分两方面,面积和单产。 对于农产品面积,我们会在每年春天去产区跑一遍,主要跑当地的农业局生产队统计局,按…
&p&深夜来放点干货。。
在学术圈,纯“统计”方法完爆纯“规则”方法似乎已经是司空见惯的事情了,所以也难怪题主也不问是不是就先问了为什么。
然而在&b&业界&/b&,到底选用“统计”方法还是选用“规则”方法这事还不好轻易下结论。大家眼中的&b&业界&/b&应用可能都是谷歌必应一类的大搜索引擎,拥有海量数据且文本涉及各个领域;而我这里要谈的&b&业界&/b&说大不大,文本来源主要由公司的内部文件和一些订阅的行业信息构成,但说小也不小,因为他们是各类文本挖掘软件的主要购买者。他们的特点是文本主要&b&集中&/b&在某个特定领域,且涵盖大量&b&专有名词&/b&,若非业务人员,完全看不懂这些名词还有特定缩写。&/p&&p&首先,对于这类公司而言,使用统计方法需要大量labelled data,而公司又往往没有labelled data。如果指派业务人员来&b&打标签 (label data)&/b&,这个&b&时间成本实在太高&/b&。相较之下,利用“规则”的方法就省事多了,先用unsupervised方法把topic modelling搞出来,再让业务人员根据topic编制规则,一开始编得粗没关系,之后再细化。然后只需要sample一些数据打打标签搞个evaluation,瞬间节省了很多工作量有木有啊。你要是问我说准确率有没有用SVM跑出来的高,那恐怕是没有的。所以在公司已经有labelled data的情况,我多半也偏向直接用“统计”方法。&/p&&p&其次, 因为这类客户文本主要集中在某个特定领域,对于&b&Word Disambiguation的压力真心小很多&/b&。“规则”方法真心不擅长的就是Disambiguation类的问题,因为需要穷尽的可能太多了,很难一一写过来。而如果Disambiguation的压力减小了呢,使用“规则”方法产生的false positive错误的压力也会相应减少。&/p&&p&第三(比较没那么重要),即使公司真的请人来给数据打label,评分员的评分准则都可能会有很大差异。这倒是亲身经历,我见过很noisy的数据,后来发现与其让评分员们讨论打分,&b&还不如直接让他们讨论出一套合理的规则&/b&。&/p&&p&第四,最后一点表扬一下统计方法。在“返工”这个问题上,“统计”方法是有极大的优势的。如果你使用“规则”方法,当你的准确率召回率已经到达一个瓶颈了的时候,增加一条规则或改动一条规则所牵扯到的数据太多,每一条翻回去重看都是一种痛苦,每一次给一条规则打补丁都是一次返工,一种难以言说的痛。而相比之下“统计”方法就好多了,标记虽然痛苦,但也只用标记一次,剩下来的就是换算法+feature engineering呗。SVM效果不好还可以试Xgboost,就算是把风扇跑得呼呼转,服务器跑成狗,至少你也不用重新回头去读文本读语法了,况且还不用担心overfitting的问题。我每次用“统计”方法把几台电脑折磨地呼呼叫的时候,仿佛有一种&b&宁可我负天下人,不可天下人负我&/b&的快感。。&/p&&p&-------------------------------------------------------------------------
抱歉,在我的这个业界事情就是这么琐碎。相较之下,我也觉得有时间看我写的这些,各位读者不如好好去学习算法,今后好报销国家(喂,是报效好吗)。但是这些都是我亲身经历过的体会,如果你今后(不幸)也加入了某知名文本挖掘软件的公司,如果你以后加入了某个想做NLP但却一没钱二没资源的公司的时候,当你有一个项目在该使用“规则”还是“统计”方法犹豫不定的时候,&b&千万不要因为对学术的偏执就选择了统计方法&/b&。&/p&&p&作为一个统计背景的人,让我从心底里接受“规则”方法是花了点时间的。如今我的Title已然是计算语言学家了,也算是对我的爱的一种回报。接下来我所想的问题,就是&b&如何利用“统计”方法写出更加鲁棒的规则&/b&。比如两句话:
“The machine broke.”
&The machine loaned from a trusted source broke.&
我想提出broke的主语,或者换句话说,我想知道什么东西坏了。
如果按原始的“规则”方法,要针对每句句型写规则来把machine这个词提出来,真不知道要写到什么时候,况且还不知道准确率如何。
但是如果可以写基于依存关系的“规则”呢?&b&你只要写一条规则把broke的主语抓出来就够了&/b&,这样节省了许多许多的工作量。而依存关系怎么找呢?目前最好的方法是基本Deep Learning的统计方法(估且称之为统计吧)。这就是我所说的利用统计方法写出更加准确更加鲁棒的规则。&/p&&p&“统计”和“规则”相辅相承,关键看如何结合如何互补&/p&&p&------------------------------------------------&/p&&p&当时写下这份答案时是一年半前,最近这份答案被知乎的发现挖了出来,也让我有种穿越回去的感觉。这一年半的成长,我感觉自己是更自由了,基本上执着于自己原来的方法论,做而不是拘泥于某一类方法。尝试过用ML方法提高写规则的效率,也尝试过把prior knowledge加进ML的模型里。当然我的目的非常明确,就是怎样以最小成本来实现我需要的功能。以后我也会一如既往地在非监督/半监督以及迁移学习的路途上不断前进,找到属于最适合具体问题的最佳方法。&/p&
深夜来放点干货。。
在学术圈,纯“统计”方法完爆纯“规则”方法似乎已经是司空见惯的事情了,所以也难怪题主也不问是不是就先问了为什么。
然而在业界,到底选用“统计”方法还是选用“规则”方法这事还不好轻易下结论。大家眼中的业界应用可能都是谷歌必…
&p&这个报告非常有意思,我来说说我的看法。&/p&&img src=&/39f808e5f78ee16b449f6f72aaddde0e_b.png& data-rawwidth=&583& data-rawheight=&123& class=&origin_image zh-lightbox-thumb& width=&583& data-original=&/39f808e5f78ee16b449f6f72aaddde0e_r.png&&&br&&br&&p&首先,是报告的出品人,居然是联合出品,出品方有支付宝、知乎、IPE、墨迹天气、36Kr、高德地图、去啊、陌陌。4家阿里系(支付宝、高德、陌陌、去啊),1家天气应用,1个科技媒体,1个问答社区,1个地图应用,一个社交应用,还有一个NGO组织。&/p&&br&&img src=&/6b31d2290dfb7d12eeebf_b.png& data-rawwidth=&529& data-rawheight=&748& class=&origin_image zh-lightbox-thumb& width=&529& data-original=&/6b31d2290dfb7d12eeebf_r.png&&&br&&br&&p&上海排名最高,我不意外,但深圳的高房价下居然幸福感比杭州高,我有点搞不懂,当然,我猜测是因为调查结果的延时作用,如果现在做调查,可能排名会有微调。&/p&&img src=&/d9659fcdcb504b71a41c117b_b.png& data-rawwidth=&329& data-rawheight=&355& class=&content_image& width=&329&&&p&说空气质量是影响北京幸福的最大因素,我信,毕竟不管是不是在帝都,雾霾总是被调侃和担忧的对象。但是智慧生活为什么北京也这么差,我就不大了解。&/p&&br&&br&&img src=&/79aa393aa66e2e6f50dd1f_b.png& data-rawwidth=&621& data-rawheight=&302& class=&origin_image zh-lightbox-thumb& width=&621& data-original=&/79aa393aa66e2e6f50dd1f_r.png&&&br&交通嘛,北京都限行了,而且北京城那么大,确实差评是有道理的。&br&&br&&br&&img src=&/5cf3e58ced12d5fcc2dd781_b.png& data-rawwidth=&506& data-rawheight=&144& class=&origin_image zh-lightbox-thumb& width=&506& data-original=&/5cf3e58ced12d5fcc2dd781_r.png&&&img src=&/523bb20c08ef61afca51d56bfe61b806_b.png& data-rawwidth=&430& data-rawheight=&141& class=&origin_image zh-lightbox-thumb& width=&430& data-original=&/523bb20c08ef61afca51d56bfe61b806_r.png&&&img src=&/d6e7dd6a30b6d512fb60dfe43db893cd_b.png& data-rawwidth=&449& data-rawheight=&344& class=&origin_image zh-lightbox-thumb& width=&449& data-original=&/d6e7dd6a30b6d512fb60dfe43db893cd_r.png&&&p&空气质量的数据来源是墨迹天气和公益组织IPE,可信度较高,河北的空气质量差我理解,但郑州的空气质量居然这么差,这个有点不大好理解。&/p&&img src=&/554c3f2a69d889f34f6e6af_b.png& data-rawwidth=&654& data-rawheight=&331& class=&origin_image zh-lightbox-thumb& width=&654& data-original=&/554c3f2a69d889f34f6e6af_r.png&&&br&&p&成都的春季也是很感人的。深圳确实环境好,这个不得不服。南方沿海的空气质量好,这个我认为比较正常,所以这一页基本是正确的废话。&/p&&img src=&/606aa7be99caad623c57b1efa282af23_b.png& data-rawwidth=&516& data-rawheight=&154& class=&origin_image zh-lightbox-thumb& width=&516& data-original=&/606aa7be99caad623c57b1efa282af23_r.png&&&img src=&/ffdd155fafd13681e0aaee_b.png& data-rawwidth=&290& data-rawheight=&74& class=&content_image& width=&290&&&br&&p&交通用高德,可以理解,百度可能不想玩儿吧,杭州慢可以理解,杭州人民开车素质很高,愿意等行人,当然,拥堵显而易见,我真心体验过,好在这两年有了地铁,公共交通应该还可以。&/p&&img src=&/0eda187cc6f8acc127a2cf_b.png& data-rawwidth=&637& data-rawheight=&259& class=&origin_image zh-lightbox-thumb& width=&637& data-original=&/0eda187cc6f8acc127a2cf_r.png&&&br&&img src=&/1dba72cc2e72_b.png& data-rawwidth=&653& data-rawheight=&352& class=&origin_image zh-lightbox-thumb& width=&653& data-original=&/1dba72cc2e72_r.png&&&p&最拥堵的时间,在我的印象中,上海市周一上班、周五下班最堵,但是数据不那么看,所以这一点我有些疑惑。&br&&/p&&br&&img src=&/49ec46e28e2c1a69ba2e_b.png& data-rawwidth=&560& data-rawheight=&178& class=&origin_image zh-lightbox-thumb& width=&560& data-original=&/49ec46e28e2c1a69ba2e_r.png&&&img src=&/a6500fd20bacecadbe3485fe_b.png& data-rawwidth=&342& data-rawheight=&116& class=&content_image& width=&342&&&p&至于智慧生活,我想说的是支付宝对线下的渗透率至少在上海来说,相当的高,如果我今天出门没带钱包,但只要手机在身上,我觉得其实也没什么大碍,便利店付钱扫码、出租车可以刷支付宝,吃饭线上直接付,确实很便利,但北京市不是那么不方便,我比较没有发言权,出差的机会并不多。&/p&&p&这一点需要额外说一声的是,支付宝9.0着力打开的支付、金融场景,可能在后续会带来极大的影响,当然,在深圳、广州,相信微信支付的力量也和支付宝在杭州、上海一样强,只不过调查出品方没有微信支付,所以并没有再这里进行体现,仅仅说了这么一句:&/p&&br&&img src=&/e8fe47bd57d16c7bb156f1_b.png& data-rawwidth=&620& data-rawheight=&115& class=&origin_image zh-lightbox-thumb& width=&620& data-original=&/e8fe47bd57d16c7bb156f1_r.png&&&br&&br&&p&这一点,希望看报告的大家能够有一个认识。&/p&&br&&p&&b&支付工具的场景竞争,自身地域全面覆盖、周边地域强力覆盖,随着半径扩大,影响力会越来越低,而竞争也会越来越激烈&/b&,这是一个未来看点。&/p&&br&&img src=&/f2fa42de8edbe8fb_b.png& data-rawwidth=&533& data-rawheight=&149& class=&origin_image zh-lightbox-thumb& width=&533& data-original=&/f2fa42de8edbe8fb_r.png&&&img src=&/932a21ec8ed_b.png& data-rawwidth=&295& data-rawheight=&92& class=&content_image& width=&295&&&p&知乎居然搞了个问答指数,我只能笑了不是嘛~不过北上广用户数量排名居前非常好理解,而北京最爱问、答,也&b&体现了一个产品的地域覆盖能力&/b&。大V也是北京多嘛,不过武汉居然排第五,这个让我有点惊讶,我本来以为应该是杭州的。&/p&&br&&img src=&/2b20fb2d0c9f64fe9ce36f33d5d5b655_b.png& data-rawwidth=&628& data-rawheight=&590& class=&origin_image zh-lightbox-thumb& width=&628& data-original=&/2b20fb2d0c9f64fe9ce36f33d5d5b655_r.png&&&br&&p&而其他两页,既然是抽样,那么其实就不必在意那些细节了。&br&&/p&&img src=&/fec18ca5ed1_b.png& data-rawwidth=&539& data-rawheight=&153& class=&origin_image zh-lightbox-thumb& width=&539& data-original=&/fec18ca5ed1_r.png&&&img src=&/f0ad54be56810e05bdd2f_b.png& data-rawwidth=&320& data-rawheight=&112& class=&content_image& width=&320&&&br&&br&&p&很有趣的是陌陌跳出来做了社交指数,这件事也可以看出阿里系和腾讯系真的是憋着要死磕的节奏了,话说陌陌做社交指数真的够底气吗?我仅仅提出这个疑问。 &/p&&br&&img src=&/5f7b4a98961aafc47fa40b7ce9205d4e_b.png& data-rawwidth=&525& data-rawheight=&370& class=&origin_image zh-lightbox-thumb& width=&525& data-original=&/5f7b4a98961aafc47fa40b7ce9205d4e_r.png&&&p&好了好了,我们不要在乎这些细节,陌陌的数据也能看出一些东西来的。譬如用户大本营是在北京。这下大家都理解为什么创业公司大多数在北京的另一个原因了吧?我看到的是因为互联网从业者众多,所以新产品较容易获取关注和体验用户。当然,还有一种可能,去北京出差的多,对陌陌的需求可能比较高,嗯!&/p&&br&&img src=&/36b166e1dbbe_b.png& data-rawwidth=&657& data-rawheight=&602& class=&origin_image zh-lightbox-thumb& width=&657& data-original=&/36b166e1dbbe_r.png&&&br&&p&另外,看到人均举报量的统计,我觉得好有趣,我山东同学不少,确实他们很直爽,有时候说话容易遭人不满,但是我很好奇为啥没有东北城市,因为我认识的东北朋友也不少,他们比起山东朋友的直爽毫不逊色,当然,他们的性格更开朗,说话更有趣,说到这里我又看了一眼,嗯,应该是因为本来东北的用户就比较少的原因吧,另外我在care一件事:&b&地域真能作为标签吗?&/b&其实我们很难了解用户是随手填写的还是认真的真实信息,毕竟微信和知乎都有好多人写着自己在安哥拉之类的地方,这个是否真的可信?&/p&&br&&img src=&/9ca048d78e63afd6e2bfc2ef099eed14_b.png& data-rawwidth=&536& data-rawheight=&156& class=&origin_image zh-lightbox-thumb& width=&536& data-original=&/9ca048d78e63afd6e2bfc2ef099eed14_r.png&&&img src=&/20aeae1a38953b03bce85fe2d6b578e8_b.png& data-rawwidth=&312& data-rawheight=&94& class=&content_image& width=&312&&&p&去啊发展很快,已经可以出报告了,牛牛的。&/p&&br&&img src=&/27f60aab08cd7b782d63_b.png& data-rawwidth=&699& data-rawheight=&433& class=&origin_image zh-lightbox-thumb& width=&699& data-original=&/27f60aab08cd7b782d63_r.png&&&img src=&/6c8c15305aa26baee9b24d6c8d7cc268_b.png& data-rawwidth=&659& data-rawheight=&200& class=&origin_image zh-lightbox-thumb& width=&659& data-original=&/6c8c15305aa26baee9b24d6c8d7cc268_r.png&&&p&昆明人最爱玩这件事情我不大懂……上海、杭州、北京最爱周边游我也不大懂,当然也可能是因为海外游目前去啊还没有做得很好,所以这方面数据不足,可以理解。希望下次报告可以看到海外出境游的数据。&/p&&br&&img src=&/5969ebfafa363_b.png& data-rawwidth=&519& data-rawheight=&138& class=&origin_image zh-lightbox-thumb& width=&519& data-original=&/5969ebfafa363_r.png&&&img src=&/1c36d567aa5_b.png& data-rawwidth=&316& data-rawheight=&142& class=&content_image& width=&316&&&br&&p&36Kr果不其然的是代表创业指数。&br&&/p&&p&这个指数比较客观,北京确实是个热衷创业——尤其互联网创业的城市。去过一次3W咖啡,印象太深刻,也让我越发害怕北京的氛围,太热了,有时候我会说,北京的氛围简直是妖孽,Whatever,喜欢就好。&/p&&br&&img src=&/7c0bcf91f48_b.png& data-rawwidth=&630& data-rawheight=&416& class=&origin_image zh-lightbox-thumb& width=&630& data-original=&/7c0bcf91f48_r.png&&&br&&img src=&/bcb827fbfcaf42_b.png& data-rawwidth=&675& data-rawheight=&392& class=&origin_image zh-lightbox-thumb& width=&675& data-original=&/bcb827fbfcaf42_r.png&&&br&&img src=&/79bcc2a89b_b.png& data-rawwidth=&622& data-rawheight=&221& class=&origin_image zh-lightbox-thumb& width=&622& data-original=&/79bcc2a89b_r.png&&&br&&p&这里的数据有个很有趣的地方,北京的投资机构更爱投高大上的玩意儿,情怀也愿意投,而上海更多着眼于荷包,深圳做硬件那是有先天优势,而杭州的爱投生活服务,却是让我万万没想到。也因此,未上市的10亿美金俱乐部北京最多,真的是种瓜得瓜的结果。&/p&&br&&p&-------------------------------------------------割------------------------------------------------&/p&&p&好了,数据聊完了,聊点别的。&/p&&br&&p&首先,这是一个基于大数据的报告,感谢马云,投资了这么多的异业,使得我们有机会看到这样一个有趣的报告。&/p&&br&&p&然后,不知道大家有没有注意到一些细节,譬如,智慧城市的数据是来自于支付宝的。我之前写过的那篇文章里,其实有些话没好意思说,现在可以说说:&/p&&br&&blockquote&&b&&u&支付宝并没有要做社交,但支付宝希望可以用金融场景绑定社交。&br&&/u&&/b&&/blockquote&&br&&p&从这个报告里你可以窥见一些些这意思。&/p&&br&&img src=&/25daa0fc659c8a93fa6264_b.png& data-rawwidth=&585& data-rawheight=&264& class=&origin_image zh-lightbox-thumb& width=&585& data-original=&/25daa0fc659c8a93fa6264_r.png&&&p&一页华东,说的是杭州的交通事故快速处理流程以及温州的扫菜就能买。事故处理不说了,买菜,扫了就买,你会和菜贩子发生交易,而如果你有特殊需求,譬如,对某些野生鱼有要求,你就可以加菜贩子的支付宝,让他有货通知你,这是反向的绑定社交。当然,如果你没买过菜,你可能就对这个动作比较陌生了。&/p&&br&&img src=&/55f195bebd2e83c_b.png& data-rawwidth=&673& data-rawheight=&606& class=&origin_image zh-lightbox-thumb& width=&673& data-original=&/55f195bebd2e83c_r.png&&&p&另一页说的是一个手机如何搞定生活的方方面面。我们看到的是一个非常具象的&b&「人与物的联结」&/b&,而这个联结是通过支付宝来完成的。&/p&&br&&p&我曾经听过百度运营规划高级经理万钧老师的演讲,他把互联网的类型分为三种: &/p&&br&&blockquote&&b&第一种,人与信息的联结。&/b&其代表是搜索引擎,将信息与人进行了联结,方便人们快速的找到希望了解的信息。&/blockquote&&p&在这个报告里,墨迹天气、高德、IPE、知乎、36Kr是人与信息的联结。&/p&&blockquote&&b&第二种,人与人的联结。&/b&其代表是社交工具,将人与人的关系从线下延伸到了线上。&/blockquote&&p&在这个报告里,陌陌是人与人的联结。&/p&&blockquote&&b&第三种,人与物的联结。&/b&其代表是电子商务,将你需求的东西和你快速的完成了关系构建。&/blockquote&&p&在这个报告里,支付宝、去啊是人与物的联结。&/p&&br&&p&这三种类型,是时间先后的顺序,但并不表示一个类型会被另一个类型所消灭,他们会各自发展各自的高级形态。譬如我刚说的知乎这种其实就是搜索引擎发展后的高级形态。&/p&&br&&p&但是,你会发现,其实这三种形态之间是可以容纳彼此的,只是程度的不同。&/p&&br&&p&好吧,其实我也不知道我想说什么了,只是想到哪儿就说到哪儿了,打住,不然不知道要写多少了,思维发散真痛苦。&/p&
这个报告非常有意思,我来说说我的看法。 首先,是报告的出品人,居然是联合出品,出品方有支付宝、知乎、IPE、墨迹天气、36Kr、高德地图、去啊、陌陌。4家阿里系(支付宝、高德、陌陌、去啊),1家天气应用,1个科技媒体,1个问答社区,1个地图应用,一个…
1.delta method,求asymptotic distribution的神器&img data-rawwidth=&640& data-rawheight=&1136& src=&/c35e46c61d50ba56f9a3a5_b.jpg& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/c35e46c61d50ba56f9a3a5_r.jpg&&&br&2.&b&Lehmann–Scheffé theorem&/b&&br&&b&用过就知道。&/b&&br&&img data-rawwidth=&640& data-rawheight=&1136& src=&/0fb1aca6dc1_b.jpg& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/0fb1aca6dc1_r.jpg&&&br&3.&br&Rao-Blackwell theorem&br&证明就两行……&br&&img data-rawwidth=&640& data-rawheight=&1136& src=&/7fefeacf5f9c3edff29f5_b.jpg& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/7fefeacf5f9c3edff29f5_r.jpg&&&br&4.N-P lemma&br&&img data-rawwidth=&640& data-rawheight=&1136& src=&/bfbf7a68e_b.jpg& class=&origin_image zh-lightbox-thumb& width=

我要回帖

更多关于 经济统计数据 的文章

 

随机推荐