你似乎来到了没有知识存在的荒原...
来源链接是否正确?用户、话题或问题是否存在?&img src=&/50/v2-139c3bc600a0f_b.jpg& data-rawwidth=&723& data-rawheight=&486& class=&origin_image zh-lightbox-thumb& width=&723& data-original=&/50/v2-139c3bc600a0f_r.jpg&&&blockquote&&p&利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。&br&&/p&&/blockquote&&h2&rCharts包&/h2&&p&说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接在R中生成基于D3的Web界面。&br&&/p&&p&rCharts包的安装:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&require(devtools)
install_github('rCharts', 'ramnathv')
&/code&&/pre&&/div&&p&rCharts函数就像lattice函数一样,通过formula、data指定数据源和绘图方式,并通过type指定图表类型。&/p&&p&下面通过例子来了解下其工作原理。我们以鸢尾花数据集为例,首先通过name函数对列名进行重新赋值(去掉单词间的点),然后利用rPlot函数绘制&strong&散点图&/strong&(type=”point”),并利用颜色进行分组(color=”Species”)。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(rCharts)
names(iris) = gsub(&\\.&, &&, names(iris))
p1 &- rPlot(SepalLength ~ SepalWidth | Species, data = iris, color = 'Species', type = 'point')
&/code&&/pre&&/div&&img src=&/v2-fe6f3e12f059beeae612d3eb631b07f0_b.png& data-rawwidth=&700& data-rawheight=&327& class=&origin_image zh-lightbox-thumb& width=&700& data-original=&/v2-fe6f3e12f059beeae612d3eb631b07f0_r.png&&&br&&p&rCharts支持多个javascript图表库,每个都有自己的长处。每一个图表库有多个定制选项,其中大部分rCharts都支持。&/p&&p&NVD3 是一个旨在建立可复用的图表和组件的 d3.js 项目——它提供了同样强大的功能,但更容易使用。它可以让我们处理复杂的数据集来创建更高级的可视化。在rCharts包中提供了nPlot函数来实现。&/p&&p&下面以眼睛和头发颜色的数据(HairEyeColor)为例说明nPlot绘图的基本原理。我们按照眼睛的颜色进行分组(group=”eye”),对头发颜色人数绘制&strong&柱状图&/strong&,并将类型设置为柱状图组合方式(type=”multiBarChart”),这样可以实现分组和叠加效果。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(rCharts)
hair_eye_male &- subset(as.data.frame(HairEyeColor), Sex == &Male&)
hair_eye_male[,1] &- paste0(&Hair&,hair_eye_male[,1])
hair_eye_male[,2] &- paste0(&Eye&,hair_eye_male[,2])
n1 &- nPlot(Freq ~ Hair, group = &Eye&, data = hair_eye_male,
type = &multiBarChart&)
&/code&&/pre&&/div&&img src=&/v2-82ce5721ba1afa442cd1ce4eb2ababd2_b.png& data-rawwidth=&708& data-rawheight=&351& class=&origin_image zh-lightbox-thumb& width=&708& data-original=&/v2-82ce5721ba1afa442cd1ce4eb2ababd2_r.png&&&br&&p&可以通过图形右上角选择需要查看或隐藏的类别(默认是全部类别显示的),也能通过左上角选择柱子是按照分组还是叠加的方式进行摆放(默认是分组方式)。如果选择Stacked,就会绘制&strong&叠加柱状图&/strong&。&br&&/p&&img src=&/v2-7676d5eee17fbf702edec9f1022ace09_b.png& data-rawwidth=&722& data-rawheight=&354& class=&origin_image zh-lightbox-thumb& width=&722& data-original=&/v2-7676d5eee17fbf702edec9f1022ace09_r.png&&&br&&br&&p&Highcharts是一个制作图表的纯Javascript类库,支持大部分的图表类型:直线图,曲线图、区域图、区域曲线图、柱状图、饼状图、散布图等。在rCharts包中提供了hPlot函数来实现。&br&&/p&&p&以MASS包中的学生调查数据集survery为例,说明hPlot绘图的基本原理。我们绘制学生身高和每分钟脉搏跳动次数的气泡图,以年龄变量作为调整气泡大小的变量。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(rCharts)
a &- hPlot(Pulse ~ Height, data = MASS::survey, type = &bubble&,
title = &Zoom demo&, subtitle = &bubble chart&,
size = &Age&, group = &Exer&)
a$colors('rgba(223, 83, 83, .5)', 'rgba(119, 152, 191, .5)',
'rgba(60, 179, 113, .5)')
a$chart(zoomType = &xy&)
a$exporting(enabled = T)
&/code&&/pre&&/div&&img src=&/v2-fa626f0d80b22fb789f1628_b.png& data-rawwidth=&715& data-rawheight=&359& class=&origin_image zh-lightbox-thumb& width=&715& data-original=&/v2-fa626f0d80b22fb789f1628_r.png&&&br&&p&rCharts包可以画出更多漂亮的交互图, &a href=&/?target=http%3A//ramnathv.github.io/rCharts/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&rCharts&i class=&icon-external&&&/i&&/a&和&a href=&/?target=https%3A///ramnathv/rCharts/tree/master/demo& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ramnathv/rCharts&i class=&icon-external&&&/i&&/a&有更多的例子可供大家学习。&/p&&h2&recharts包&/h2&&p&学习完rCharts包,可能有读者会问,我们有没有国人开发的包实现相似的效果呢?这边给大家推荐一个同样功能强大的recharts包。&br&&/p&&p&本包来源于百度开发的国内顶尖水平的开源d3-js可视项目Echarts(Github Repo)。Yang Zhou和Taiyun Wei基于该工具开发了recharts包,经Yihui Xie修改后,可通过htmlwidgets传递js参数,大大简化了开发难度。但此包开发仍未完成。为了赶紧上手用,基于该包做了一个函数echartR(下载至本地,以后通过source命令加载),用于制作基础Echart交互图。需要R版本&=3.2.0.&/p&&p&安装方式如下:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(devtools)
install_github('yihui/recharts')
&/code&&/pre&&/div&&p&安装完后,需要在&a href=&/?target=https%3A///madlogos/recharts/blob/master/R/echartR.R& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/madlogos/rec&/span&&span class=&invisible&&harts/blob/master/R/echartR.R&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&将echartR.R脚本下载到本地。&/p&&p&假如想对鸢尾花数据集绘制&strong&散点图&/strong&,可以执行如下代码:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&source(&~echartR.R&)
names(iris) = gsub(&\\.&, &&, names(iris))
echartR(data=iris,x=~SepalLength,y=~PetalWidth,series = ~Species,
type = 'scatter')
&/code&&/pre&&/div&&img src=&/v2-1ec206eb88155dfe82b00fd_b.png& data-rawwidth=&672& data-rawheight=&431& class=&origin_image zh-lightbox-thumb& width=&672& data-original=&/v2-1ec206eb88155dfe82b00fd_r.png&&&br&&p&绘制&strong&柱状图&/strong&:&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&hair_eye_male &- subset(as.data.frame(HairEyeColor), Sex == &Male&)
hair_eye_male[,1] &- paste0(&Hair&,hair_eye_male[,1])
hair_eye_male[,2] &- paste0(&Eye&,hair_eye_male[,2])
echartR(data = hair_eye_male, x = Hair, y = ~Freq,
series = ~Eye,
type = 'bar', palette='fivethirtyeight',
xlab = 'Hair', ylab = 'Freq')
&/code&&/pre&&/div&&img src=&/v2-ad25a79aad826f6507937_b.png& data-rawwidth=&688& data-rawheight=&452& class=&origin_image zh-lightbox-thumb& width=&688& data-original=&/v2-ad25a79aad826f6507937_r.png&&&br&&p&&strong&玫瑰图&/strong&:&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&dtcars &- mtcars
dtcars$car &- row.names(dtcars)
dtcars$transmission &- as.factor(dtcars$am)
levels(dtcars$transmission) &- c(&Automatic&,&Manual&)
dtcars$cylinder &- as.factor(dtcars$cyl)
dtcars$carburetor &-as.factor(dtcars$carb)
echartR(dtcars, x = ~cylinder,
y = ~car, type='rose',
palette='colorblind', title='Number of Cylinders',
subtitle = '(source: mtcars)')
&/code&&/pre&&/div&&img src=&/v2-7b7feb6a15f3ee96d2a0_b.png& data-rawwidth=&739& data-rawheight=&489& class=&origin_image zh-lightbox-thumb& width=&739& data-original=&/v2-7b7feb6a15f3ee96d2a0_r.png&&&br&&p&&strong&雷达图&/strong&:&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&player &- data.frame(name=c(rep(&Philipp Lahm&,8),rep(&Dani Alves&,8)),
para=rep(c(&Passing%&,&Key passing&,&Comp crosses&,
&Crossing%&,&Successful dribbles&,
&Dispossessed&,&Dribbled past&,&Fouls&),2),
value=c(89.67, 1.51, 0.97, 24.32, 0.83, 0.86, 1.15, 0.47,
86.62, 2.11, 0.99, 20.78, 1.58, 1.64, 0.9, 1.71))
echartR(player, x= ~para, y= ~value, series= ~name, type='radarfill',
symbolList='none', palette=c('firebrick1','dodgerblue'),
title='Lahm vs Alves', subtitle= '(by @mixedknuts)')
&/code&&/pre&&/div&&img src=&/v2-12ef5bec55b705cc1c66_b.png& data-rawwidth=&699& data-rawheight=&483& class=&origin_image zh-lightbox-thumb& width=&699& data-original=&/v2-12ef5bec55b705cc1c66_r.png&&&br&&h2&plotly包&/h2&&p&接下来要给大家介绍的是另一个功能强大的plotly包。它是一个基于浏览器的交互式图表库,它建立在开源的JavaScript图表库plotly.js之上。&br&&/p&&p&有两种安装方式:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&install.packages(&plotly&)
&/code&&/pre&&/div&&p&或者&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&devtools::install_github(&ropensci/plotly&)
&/code&&/pre&&/div&&p&plotly包利用函数plot_ly函数绘制交互图。&/p&&p&如果相对鸢尾花数据集绘制&strong&散点图&/strong&,需要将mode参数设置为”markers”。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(plotly)
p &- plot_ly(iris, x = Petal.Length, y = Petal.Width,
color = Species, colors = &Set1&, mode = &markers&)
&/code&&/pre&&/div&&img src=&/v2-1ebfa3c5cc02acb58ea5f_b.png& data-rawwidth=&720& data-rawheight=&464& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-1ebfa3c5cc02acb58ea5f_r.png&&&br&&p&如果想绘制交互&strong&箱线图&/strong&,需要将type参数设置为box。&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(plotly)
plot_ly(midwest, x = percollege, color = state, type = &box&)
&/code&&/pre&&/div&&img src=&/v2-d03aebb1c56c58b9c08ff270dc22f395_b.png& data-rawwidth=&699& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&699& data-original=&/v2-d03aebb1c56c58b9c08ff270dc22f395_r.png&&&br&&p&如果你已熟悉ggplot2的绘图系统,也可以针对ggplot2绘制的对象p,利用ggplotly函数实现交互效果。例如我们想对ggplot绘制的&strong&密度图&/strong&实现交互效果,执行以下代码即可:&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(plotly)
p &- ggplot(data=lattice::singer,aes(x=height,fill=voice.part))+
geom_density()+
facet_grid(voice.part~.)
(gg &- ggplotly(p))
&/code&&/pre&&/div&&img src=&/v2-3abd2c38bdafda63012c2_b.png& data-rawwidth=&686& data-rawheight=&502& class=&origin_image zh-lightbox-thumb& width=&686& data-original=&/v2-3abd2c38bdafda63012c2_r.png&&&br&&p&&strong&其他&/strong&&/p&&p&此外还有很多好玩有用的交互包。例如专门用来画交互&strong&时序图&/strong&的&strong&dygraphs包&/strong&,可通过install.packages(“dygraphs”)安装。&br&&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(dygraphs)
lungDeaths &- cbind(mdeaths, fdeaths)
dygraph(lungDeaths) %&%
dySeries(&mdeaths&, label = &Male&) %&%
dySeries(&fdeaths&, label = &Female&) %&%
dyOptions(stackedGraph = TRUE) %&%
dyRangeSelector(height = 20)
&/code&&/pre&&/div&&img src=&/v2-3518adf1f8bb99015a8bfedd53650cf9_b.png& data-rawwidth=&743& data-rawheight=&398& class=&origin_image zh-lightbox-thumb& width=&743& data-original=&/v2-3518adf1f8bb99015a8bfedd53650cf9_r.png&&&br&&p&&strong&DT包&/strong&实现R数据对象可以在HTML页面中实现过滤、分页、排序以及其他许多功能。通过install.packages(“DT”)安装。&br&&/p&&p&以鸢尾花数据集iris为例,执行以下代码:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(DT)
datatable(iris)
&/code&&/pre&&/div&&p&networkD3包可实现D3 JavaScript的网络图,通过install.packages(“networkD3”)安装。&/p&&p&下面是绘制一个力导向的&strong&网络图&/strong&的例子。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&# 加载数据
data(MisLinks)
data(MisNodes)
forceNetwork(Links = MisLinks, Nodes = MisNodes,
Source = &source&, Target = &target&,
Value = &value&, NodeID = &name&,
Group = &group&, opacity = 0.8)
&/code&&/pre&&/div&&img src=&/v2-e7f93fa7ad15bc0a166a839c_b.png& data-rawwidth=&610& data-rawheight=&427& class=&origin_image zh-lightbox-thumb& width=&610& data-original=&/v2-e7f93fa7ad15bc0a166a839c_r.png&&&br&&p&我们可以通过&strong&d3treeR包&/strong&绘制交互&strong&treemap图&/strong&,利用&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&devtools::install_github(&timelyportfolio/d3treeR&)
&/code&&/pre&&/div&&p&完成d3treeR包安装。&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&library(treemap)
library(d3treeR)
data(&GNI2014&)
index=c(&continent&, &iso3&),
vSize=&population&,
vColor=&GNI&,
type=&value&
d3tree( tm,rootname = &World& )
&/code&&/pre&&/div&&img src=&/v2-96cdccce2bca2570aed5c_b.png& data-rawwidth=&726& data-rawheight=&387& class=&origin_image zh-lightbox-thumb& width=&726& data-original=&/v2-96cdccce2bca2570aed5c_r.png&&&br&&p&本文主要是介绍了几个R常用的交互包。在R的环境中,动态交互图形的优势在于能和knitr、shiny等框架整合在一起,能迅速建立一套可视化原型系统。&/p&&p&作者:谢佳标
数据分析与挖掘R语言十三式,打造R全栈专家
&a href=&/?target=https%3A///classroom/1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&数据分析与挖掘R语言十三式,打造R全栈专家 &i class=&icon-external&&&/i&&/a&&/p&&p&大家也可以加小编微信:tswenqu,进R语言中文社区 交流群。&/p&
利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。 rCharts包说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接在R中生成基于D3的Web界面。 rCharts包的安装:require(devtools)
install_github('rCharts'…
&b&6.8日更新对BA职业生涯发展路径的探索的第二部分:&/b&&br&&ul&&li& Consulting&/li&&/ul&SAS(软件和相关分析咨询服务提供商)&br&title: Senior associate analytical consultant&br&responsibiltiies: 负责咨询服务当中的统计分析部分内容(数据准备,数据清洗,数据挖掘,预测和最优化分析);和其他的咨询顾问合作,为企业寻找合适的解决方案(quite a lot different topics, plz refer to the official website of SAS) ;参与企业内部的统计方法培训&br&&br&Elder Research(tech consulting company seting foot both in public sector and private sector)&br&title: Data scientist&br&responsibilities: 和客户交流,理解客户需求并制定技术规划; 通过进行建立和使用predictive models(预测模型)来进行数据挖掘; 能够熟练应用建立各种分析模型完善提供给客户的解决方案&br&key words: communications&br&&br&Deloitte&br&title: consultant, advanced analytics & &br&roles: 在咨询团队中提供技术援助,处理SAS, SQL模型;利用客户数据建立相关预测分析模型,并进行可视化处理并能够良好的呈现研究结果;&br&&br&总结:consulting 分为大数据tech consulting 和传统的management consulting 两种类型,不过即使在两种不同类型的企业之中,BA毕业生所承担的工作也是类似的,在软件和技术咨询公司,BA更接近业务的前端,承担着帮助客户更加熟悉更好地运用自己的软件产品,甚至是衍生的咨询服务工作;而在更接近传统的管理咨询的领域,BA则能够起到团队当中技术和数据分析员的角色,为咨询项目提供更多的材料支持。&br&&br&&br&&ul&&li&IT &/li&&/ul&Amazon( from retail companies Nordstorm)&br&title: data scientist&br&roles: 利用内部和外部数据来面向不同类型的客户制定有效的营销策略; 建立机器学习算法,推荐系统;评价不同营销活动的效率&br&&br& Linkedin &br&title: data scientist&br&roles: 为新产品和功能建立评价机制并监督他们的表现; A/Btest,测试新的产品功能并对业务方向作出指导;利用客户数据发现有价值的信息; 能够对自己的工作结果进行可视化,与相关的团队进行合理沟通,推进产品优化&br&&br&&br&总结:在IT公司的数据科学家可以说工作是非常多样化的,这主要取决于IT公司所在市场的类型。比如PAYPAL的数据科学家可能就类似于银行当中的risk analyst的角色, 而amazon的数据科学家则更多的会用到marketing 和retail方面的数据处理,所以如果不能一开始就进入到这些公司之中,制定好职业发展路径,在其他公司积累几年经验之后也会更有机会一些。
&br&&br&&p&&b&5.20日开始更新对BA职业生涯发展路径的探索,持续更新中:&/b&&/p&&p&
在探索职业路径的过程中,主要通过收集一些比较成熟的analytics的项目的资料,在linkedin当中检索各个行业校友的档案和日常工作情况,目的是探索BA在各个行业发展的可能性和日常的主要工作,从而对自己以后的学习和职业生涯的选择起到指导作用。&/p&&br&&p&
首先更新一些银行的主要工作内容:&/p&&br&M&T bank &br&title: quantitative risk analyst/modeler
&br&responsibilities: 针对银行信用产品建模计量违约风险,违约损失和风险敞口; 每月进行压力测试,保证适当的核心资本充足率; 保证M&T能够在多变的宏观经济中稳定运行,提供预测模型和回测报告; 通过风险计量建立和修正内部管控标准; 制定积分卡的使用标准; &br&&br&Bank of America&br&title: Quantitative
VP Quantitative finance - Commercial portfolio S
Assistant VP, Quantitative Finance Analyst&br&responsibilities: 信用卡建模,风险评分系统; 通过建模来侦查信用卡使用过程中的资金不足问题; 通过SAS编程来进行模型诊断&br&
压力测试和损失预测,产品组合分析和战略推荐 ; 通过SAS和SQL编程进行数据库管理; 和建模分析师和技术专家团队沟通,并和业务经理交流模型特性和建议; 在excel中建模并分析各个业务风险,和各个业务负责人沟通&br&Linkedin 职位描述(QF analyst):建模或者修正已经存在地模型; 进行损失预测和建立资本模型; 为内部监督制定清晰,有连续性的技术文件&br&&br&总结:&br&&br&
从收集的资料来看,项目当中进入银行的毕业生主要承担的是risk management 和 credit card analysis 的工作,会大量用到SAS和SQL等统计软件。随后的职业发展路径是走risk和银行内控的方向。&br&&br&&br&&p&&b&分割线--原始答案&/b&&/p&&p&------------------------------------------------------------------------------------------------------------------------------------------&/p&&p&随着“大数据”概念的持续火热,这两年business analytics 和data science成为了新的申请热门。由于data science大多对于申请者的数理背景要求比较高,开在商学院的business analytics成为了人数众多的商学院毕业生的新的关注方向。似乎对于整天摆弄excel和ppt的商学院同学来说,突然有机会成为一个数据科学家,掌握很多统计软件的是一个看起来很美的选择。&/p&&p&而单单2015年新开BA项目的学校我所知道的就有MIT,UCSD,Wake Forest,Case等等,这也显示出有越来越多的学校看到了BA的市场需求,因此也很有理由相信未来会有更多商学院设置BA项目。&/p&&p&那么business
analytics到底学什么呢,我想简单的分享一下我自己了解的一些信息和体会。&/p&&ul&&li&学什么&br&&/li&&/ul&&p&以开BA项目时间稍长的UT-Austin和UMN为例,我们来看一看他们的课程设置:&/p&&p&-UT-Austin&/p&&img src=&/f35a3cb7ed5c8b417a6b88ed_b.png& data-rawwidth=&361& data-rawheight=&633& class=&content_image& width=&361&&&br&&p&-UMN&/p&&p&&img src=&/a91bd9e5eba5a91a309313_b.png& data-rawwidth=&631& data-rawheight=&494& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/a91bd9e5eba5a91a309313_r.png&&&br&从两个学校的课程来看可以简单的总结一下BA的项目特点:&/p&&p&以programming 和statistics 为基础,广泛接触数据分析的全过程( data
visualization)并学习如何在不同的商业背景( predictive analytics)下应用数据分析的能力。&/p&&p&相对于传统的商科master,比如management, finance和marketing来说,BA会涉及到更多的统计模型和数据处理的课程,因此课程难度对于商科背景的同学来说也应该会更高。但是好处是掌握很多基础的统计和数据库应用软件之后,将会更有利于找到entry-level的工作,毕竟开始职业生涯的第一步是要有一份工作&/p&&ul&&li&工作方向&br&&/li&&/ul&&p&-UT-Austin&/p&&img src=&/aa8dbb04f_b.png& data-rawwidth=&494& data-rawheight=&639& class=&origin_image zh-lightbox-thumb& width=&494& data-original=&/aa8dbb04f_r.png&&&br&&p&-UMN&/p&&p&&img src=&/b254a5f06a6a241c9aeed210_b.png& data-rawwidth=&819& data-rawheight=&493& class=&origin_image zh-lightbox-thumb& width=&819& data-original=&/b254a5f06a6a241c9aeed210_r.png&&&br&从两个学校的就业报告来看,就业的情况都相当的可喜地接近了100%。而且根据我常年在论坛潜水的情况来看,即使在其他的学校当中,BA的就业率也都是相当可观的。另外,两个学校的年薪中位数都超过了80000刀,也是属于不低的薪金待遇。&/p&&p&从就业方向来看, risk analyst都是有可能的,这也说明了各行各业对于data analyst都是需求的。不过需要提醒大家一点的就是,作为国际生的出路可能就会受到一定的限制,比如management consulting等对于沟通能力要求比较高的行业对于国际生来说就相对要困难。对于国际生而言,更容易的职业方向应该是data scientist和data analyst。&/p&&p&暂时先写这么多,因为目前还没有真正的参与到项目之中,所以也只能是凭自己申请当中的一些了解来抛砖引玉,希望以后能够有更多体会来分享。&/p&
6.8日更新对BA职业生涯发展路径的探索的第二部分: ConsultingSAS(软件和相关分析咨询服务提供商) title: Senior associate analytical consultant responsibiltiies: 负责咨询服务当中的统计分析部分内容(数据准备,数据清洗,数据挖掘,预测和最优化分…
谢邀。终于得空来更新一下&br&&br&从商业分析说起吧。关注过不少知乎上类似的问题和回答,发现个较严重的问题:大多数人对商业分析这个行业的认知并不准确。具体说来&b&商业分析有两种&/b&:&br&&br&1. Business analysis. 应属于&b&传统商科&/b&,主要是任务是对公司整个运营的流程、业务的开展等方面的分析。比如发现新的商业需求、提出/改善某些商业问题的解决方案。它可能包括公司组织上的变更,业务流程的改善,策略性的规划,政策的制定和提高。这个领域需要一定的数据分析,一方面因为公司发展前期一般主要靠业务的扩展,会涉及一些销售业绩等类似的数据分析。另一方面,大数据时代嘛,很多公司都觉得好像应该顺应潮流掺和一把。但总的来说还是business analysis为主。即定性为主导,数据分析(一般较简单)为辅助。这也是大多数答主所提到的。要在这个领域成长为专业人才,一般会选择MBA,MBA课程一般也会包含一定的相关课程,但很简单。&br&&br&2. Business analytics. 这才是真正的&b&新兴学科&/b&。翻译上都叫商业分析,但内容却差很多,所以特意用英文区分开来。这个行业的&b&核心就是数据分析,&/b&而且是高深的技术、模型和算法。通过对数据的深度分析、挖掘来研究公司以往的业绩,对行业市场潜在的商业信息的搜索等。目的是获取那些通过定性分析和简单的定量分析根本无法获得的insights。这个领域逐渐得到了学术界、业界和政府的高度重视:学术界,从纽约大学13年开始开设business analytics的硕士专业以来,全球各大高校纷纷增设相关专业,并且学费直逼MBA,在金钱至上的资本主义国家,高学费往往是高收入和良好职业发展的风向标。业界,更不用说了,BAT都在开设这一类的部门,阿里巴巴去年跟今年就从名校挖了一些这个领域的教授,百度更是把斯坦福大牛Andrew Ng请了来。政府,就我知道的,新加坡和澳洲政府直接拨款赞助开设business analytics部门的公司。&br&&br&说完基本概念,回到题主问题。仔细读过问题描述后,我相信题主感兴趣的应该是business analytics吧(不是的话,就请忽略以下吧)。那再深入一点讲一下&b&相关的技能&/b&。题主是统计本科生,很好!哈哈!我是统计博士,现在在纽约一家投资管理公司做类似的工作,同事不乏一些计算机、自动控制、信号处理等数据分析相关的领域的博士。总体来说business analytics无疑是个交叉学科,包括数学(统计)、计算机和商学(经济学、市场营销,博弈论等等)。&b&统计类&/b&的方法占据了数据分析学科的首要地位(主要是回归模型)。可以说如果把统计方法全部拿走,数据科学基本就支离破碎不成体系了。然后是&b&计算机&/b&(包括机器学习、模式识别、图像处理等一类的领域),基于一些应用层面的需求,计算机领域提出了一些新颖的思路和模型。值得一提的是,这些东西又吸引了统计学家的关注,他们把同样的问题又用统计学方法做了出来。再结合一些传统的回归模型,统计学出现了新的分支:统计学习。最后是&b&商学类&/b&,现阶段来说比重最小,不过其中一些思路也是值得借鉴的,比如博弈论。一些专门的business analytics硕士会结合商业应用来讲统计和计算机方法。&br&&br&&b&实际的商业分析案例&/b&(当然是business analytics)。简单说几个吧:1.&b&生存模型&/b&,生物统计最常用的模型,研究疾病的愈合、死亡时间之类的问题,可以用以测试某些药品、治疗手段是否有效。应用到商业中,比如公司对特定人群投放广告,他们通过不同的渠道点击观看,那么需要多久的时间他们才会决定购买?我们定义:消费者不购买=‘活着’,一旦消费即为‘死亡’。接下来的任务就是研究哪个渠道的广告/哪种组合的广告最为有效。2.&b&聚类问题&/b&,公司投放过大量广告,做过促销。然后大量消费者前来购买,到底哪些真的看过上述宣传呢?如果这个都不知道如何分析哪个渠道或者哪些渠道的组合最有效?聚类分析就是解决这一类问题的。3.&b&贝叶斯方法&/b&,不知你可了解过贝叶斯分析?是统计/机器学习领域很火的方向。主要应用是在建模时候可以把人为的观点融合进模型中去。使得定性和定量分析的结果结合起来。这一点很是受在business analysis领域做数据分析的人的欢迎。除此外还有很多,就不一一说了。&br&&br&最后说到你的近况。本科背景还是弱了点,想要接触上述类型的工作,你需要更进一步。并且想吃的开最好也不要限制在统计学领域,毕竟读一个偏应用的学科,学会从应用角度考虑问题对于职业发展更有好处。升学的话可以考虑data analytics/business analytics的硕士专业。不过,如果觉得学费太高的话,其实统计硕士也是个不错的选择。自学的话,coursera上也有很多不错的课程。至于R/Python/SAS嘛,能会一个就够了。数据分析级别的编程,会一个,别的看个把礼拜就能上手。&br&&br&最后的最后,分享一个链接:&a href=&///?target=http%3A////graduate-programs-in-big-data-and-data-science/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Graduate Programs in Big Data Analytics and Data Science&i class=&icon-external&&&/i&&/a&。里面列举了全世界各地高校开设的数据分析类的研究生专业、各种收费的/不收费的在线课程。&br&&br&与题主共勉!
谢邀。终于得空来更新一下 从商业分析说起吧。关注过不少知乎上类似的问题和回答,发现个较严重的问题:大多数人对商业分析这个行业的认知并不准确。具体说来商业分析有两种: 1. Business analysis. 应属于传统商科,主要是任务是对公司整个运营的流程、业…
已有帐号?
无法登录?
社交帐号登录
589 人关注
181 条内容
16929 人关注
783 条内容
407 人关注
1639 条内容
5172 人关注
193 条内容
2525 人关注
566 条内容