怎样开始阅读scikit learn源代码-learn的源码？是否值得读

面相 | 海贼王 | 牙齿矫正 | 徐州市 | 虚拟专用服务器 | Windows 7 | 疤痕修复 | 方言 | 幼儿教育 | 英文歌曲 | 武术 | 餐饮 | 口臭 | 冬奥会 | 化疗 | 汽车音响 | 休学 | 片尾 | 骨折 | 电子技术研发 | 胃炎 | 姓氏 | 过敏性鼻炎 | 房贷 | 身高 | 加湿器 | 雅马哈 | 金平区 | 马鞍山市 | 取名 | 美杜莎 | 韩国 | 饮食 | 怀集县 | 牙套 | 古琴 | 语言学习 | 坦克 | 体检 | 冠心病 | 书籍 | 寺庙 | 美国电影 | 驾驶经验 | 寓言 | 学术 | 坐月子 | 日语语法 | 山东艺术学院 | 类风湿 | 手相 | 乳腺癌 | 运动损伤 | 自卑 | 房山 | 辩论赛 | 机械键盘 | 大学专业选择 | 塑料制品 | 护发 | 眼袋 | 肺癌 | 血型 | 玄幻小说 | 华为路由器 | 温州市 | 留学香港 | 大学生就业 | 大学生创业 | 城市规划 | 美术生 | 一体机 | 率土之滨 | r（编程语言） | 发音 | 记忆力 | 散光 | 互联网公司 | 西班牙语 | 口腔溃疡 | 汉语 | 观后感 | 留学生 | 参考文献 | 印度 | 中耳炎 | 澳门特别行政区 | 近视手术 | 尧山 | 荨麻疹 | 花卉 | 特许加盟 | 烹饪学校 | 设计院 | 岳阳县 | 婴儿喂养 | 痛风 | 营销策划 | 狐臭 | 失眠 | 眼科学 | 药品 | 欧美 | 弱视 | 童年 | 丙肝 | 合生元 | 男生 | 材料 | 中央戏剧学院 | 葡萄酒 | 网络推广 | 胃痛 | 酒文化 | 脱发 | 情绪管理 | 花样姐姐 | 示波器 | 胶原蛋白 | 痤疮 | 自驾游 | 孩子 | 马克思主义哲学 | 大学就读体验 | 美国留学 | 本科毕业论文 | 白内障 | 精神分裂症 | 在线教育 | 无线耳机 | 发动机 | win8 | 桥梁 | 非洲 | 婚恋网站 | 驾驶技术 | 敏感皮肤 | 学车 | 武昌区 | 整形 | 红酒 | 语言学 | Android手机 | 拉丁舞 | 猪肉 | 大学军训 | 高效学习 | 手绘 | 法国 | 刑事案件 | 胃病 | 牙科医院 | 宁夏回族自治区 | 邳州市 | 国家 | 口红 | 尿毒症 | 时间管理 | 事业单位考试 | 迅雷（软件） | 中国科学技术大学 | 康佳 | 西装 | 蓝河 | 肺气肿 | 地黄 | 外貌 | 高中化学 | 励志故事 | 小吃 | 关节炎 | 驻马店市 | 鲁迅美术学院 | 交警 | 发电 | 皮肤保养 | 文玩 | 轮胎 | 山东工艺美术学院 | 钢笔 | 食道癌 | 校服 | 酵素 | 日本漫画 | 非典 | 服装行业 | 数控车床 | 毕业论文 | 蓝莓 | 七田真 | 配方奶粉 | 头痛 | 枸杞 | 孕妇装 | 儿童 | 婴儿车 | 西医 | 本田（honda） | 研究生导师 | 美白 |

你的位置：网站首页 >> 频道首页 >>学习 >>怎样开始阅读scikit learn源代码-learn的源码？是否值得读

怎样开始阅读scikit learn源代码-learn的源码？是否值得读

来源：蜘蛛抓取(WebSpider) 时间：2017-07-27 04:09 标签： python scikit learn

you have been blockedscikit-learn学习笔记_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
scikit-learn学习笔记
&&机器学习python库scikit-learn学习笔记
阅读已结束，下载文档到电脑
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，方便使用
还剩47页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢思诚科技告诉你，为什么程序员要阅读源码？值得收藏！
思诚科技告诉你，为什么程序员要阅读源码？值得收藏！
思诚开发者沙龙
程序员每天都和代码打交道。经过数年的基础教育和职业培训，大部分程序员都会「写」代码，或者至少会抄代码和改代码。但是，会读代码的并不在多数，会读代码又真正读懂一些大项目的源码的，少之又少。这种怪状，真要追究起来，怪不得程序员这个群体本身它是两个原因造成的：1）我们接触的大部分的教育都在强调怎么写代码，并没有教大家如何读代码。2）大多数工作场景都是一个萝卜一个坑，我们只需要了解一个系统的局部便能开展工作，读不相干的代码，似乎没用。其实，写代码和写作二者之间有很多相通之处，但从培养写代码和写作的过程来看，二者又有很多不同。写作能力是建立在大量基础阅读的基础上的，是除了学习语法和文法知识外，从小学开始，经年累月，通过阅读各种不同层次的名家的作品，再加上各种各样的写作训练，累积出来的；而写代码的能力，在了解和掌握了语法/文法之后(学习和抄写 example 代码也算语法/文法学习的一部分)，跳过了大量阅读名家作品的过程，直接 biu 地一下就自动养成了：学会基础的语法和试验了若干 example 后，我们就火箭般蹿到了自己写代码打怪赞经验的阶段。这样略过大量阅读代码的阶段有三个害处：1）写代码的基础是不牢靠的，打怪升级的过程也是最慢的。道理很简单：前辈们踩过的坑，总结的经验教训，你都不得不亲自用最慢的法子一点点试着踩一遍。2）很容易养成 stackoverflow driven 的写代码习惯 —— 遇到不知如何写的代码，从网上找现成的答案，找个高票的复制粘贴改吧改吧，凑活着完成功能再说。写代码的过程中遇到问题，开启调试模式，要么设置无数断点一步步跟踪，要么到处打印信息试图为满是窟窿的代码打上补丁，导致整个写代码的过程是一部调代码的血泪史。3）你周围最强的那个工程师的开发水平的上限就是你的上限。我们再回到读书进行类比。从小学到高中，就语文而言，12年时光，单课本我们要读十二册，数百篇文章。如果每篇文章平均一千字，那么我们读了数十万文字。这些文字，我们都是精读过甚至全文背诵过。每篇文章我们需要总结中心思想，段落大意，归纳出论点论证论据或者时间任务地点起因经过结果，会分析长句难句，会学习起承转结，并反复训练基础的遣词造句能力，并最终模仿那些文章写出自己的文章。在这个过程中，我们学会了赋、比、兴，我们掌握了三段论，我们知道了如何用更优雅地方式表达自己的思想。更重要的是，这些阅读训练让我们在我们在脱离学校的基础教育后，可以自己独立完成一本书的阅读。我们知道如何粗读，细读甚至类比阅读一本书，我们能把书中的精髓浓缩成思维导图，也大段大段摘录书中精彩的句子，段落或者篇章。这十几年的时光，算上各种课外阅读，世界名著，古典文学，金庸古龙，修正玄幻，一个大学毕业的二十几岁的青年人，阅读量应该不下几百万字。而稍稍涉猎广些的读者，上千万字的阅读累积是常有的事。有了这些累积，你才能在迎面走来一位妙龄女子，想到的是肌肤胜雪，明眸善睐，桃腮带笑，齿如含贝，气若幽兰，美艳不可方物，一笑倾城，再笑倾国，沉鱼落雁，闭月羞花这些词句，而非不知如何表达，只能吞吞口水，在肚子里闷上一句：「我擦，美女啊」。这是读书的第一大功用：累积素材(information)。你是否写文章时，经过一番搜肠刮肚，也不知该如何描述某事某物？同样的，写代码时，有没有毫无头绪，不知从何写起的时候?或者有了些的思路，双手却在键盘上迟滞，不知所措?这些现象，大多是缺乏累积所致。读书的第二大功用：是开拓思路。有时候，一段文字，甚至一个句子，在你意料之外扑面而来，让你有种醍醐灌顶的感觉。比如『围城』里，赵辛楣和方鸿渐鸿初次见面，钱老描述赵的傲慢无礼，是这么写的：「傲兀地把他从头到脚看一下，好像鸿渐是本一览而尽的大字幼稚园读本」。初读围城的时候，很容易将这样的句子轻易放了过去，几年前再读时，才发觉它的精妙：竟能如此简单地以物喻人，就把整个场景复原到如同发生在眼前一样活灵活现。所以很多时候，精妙的不是比喻本身，而是对生活的细微观察。累积素材是基础，被启发出来的思路将这些素材串成线，这就形成了知识(knowledge)。书读得越多，越勤于思考的人，知识也就越丰富。而知识的融会贯通，最终形成读书的第三大功用：通过了解，吸收别人的思想，去芜存菁，最终形成自己的思想，或者说智慧(wisdom)。information -& knowledge -& wisdom 是个长期的累积，并非一朝一夕之功。下面，是来自一位码农的真实分享：阅读名家的优秀的代码最终的归宿是形成你自己写代码的思路。去年撰写的一个基于 node restify 的 API framework(见：再谈 API 的撰写 - 总览系列)，虽然有很多不完善的地方，但内核还是相当稳定，一年多来只是些许小修小补。撰写它的过程，是我对之前所读各种项目的一个融会贯通：为了确定我是否该基于 restify，我通读了它的代码(没多少)，融合进了 hapi 和 loopback 的一些思路，提供了一套类似于 rails 的 CLI，再加上早年在 parser 上的一点经验，把 framework 逻辑上分出了：compile time(严格讲 nodejs 没有 compile time，但 configuration 的处理，route / middleware / model / task 对应的内部数据结构的生成，算进了 compile time 中)，load time 和 run time，用前两个阶段的「低效」换取后一个阶段的高效(其实也类比了我的老本行，路由器/防火墙上的 control plane / data plane，first path / fast path 的设计)。如果没有之前各种源码阅读的累积，我很难做出这样的设计。同样的，阅读 elixir unicode 实现的过程在两年前激发我做了一个使用同样思路的汉字的 slugify，或者汉字转拼音(解决多音字问题)的暴力方法(see github: chinese_translation)，这一思路在今年年初进一步发扬光大成了我们现在在 Tubi TV 使用的 policy engine 和 content engine，为每日不计其数的内容请求保驾护航。我们使用了 code as cache 的方法，把数据库里的内容的不必在运行时做的 transformation 都在 compile time 完成，然后在 run time 结合记叙文三要素，得到最终的结果。以前我们系统中我们最慢的 API，采用新的 engine，如今快了至少数十倍 —— 尤其是在低并发下就惨不忍睹的 95 percentile response time(高并发都无法完成测试)，如今在高并发，没有任何 failure 的情况下，99 percentile response time 都能控制在 500ms 左右。所以说，阅读优秀的、有启发性的源代码，多重要！南昌思诚科技为企业输送优秀人才，同时也为企业提供信息咨询、技术支持、产品研发、技术培训、人才服务等信息化行业整体解决方案。
本文仅代表作者观点，不代表百度立场。系作者授权百家号发表，未经许可不得转载。
思诚开发者沙龙
百家号最近更新：
简介: 为技术爱好者，提供交流与分享的平台。
作者最新文章怎样开始阅读scikit-learn的源码？是否值得读？ - 知乎157被浏览10488分享邀请回答342 条评论分享收藏感谢收起

怎样开始阅读scikit learn源代码-learn的源码？是否值得读

我要回帖

更多关于 python scikit learn 的文章

随机推荐