小米手机为何微信未经允许不可引用收集用户资料,会有哪些风险

推荐系统(7)
原文链接:https://mp./s/95Zklj8ovheQV3Gnc-2h-Q
“这里以性别预测为例,一方面,小米有大量的帐号/手环/支付/VIP数据,这些数据都有用户的性别,可以作为训练样本。另一方面,小米有大量的用户行为数据,包含APP/浏览器/购物等数据,利用这些数据作为特征,可以训练性别模型。”
App2Vec, Action2Vec。。。用户2Vec, 景点2Vec,。。。
Action2Vec的提出很不错,转化成一个序列预测问题了
用在旅游上,也可以结合时间季节等上下文和用户原有的属性和画像,用之前在App上的历史记录行为序列,来预测下面的行为或者想去的景点和路线
扩展:结合知识图谱,具有更强的先验知识来做;
【导读】2017年
11月4日,大数据系统与应用研讨会在中科院计算所举行。会议邀请了中科院计算所程学旗老师和其他来自联想、京东、美团点评、小米等一线互联网公司大数据领域的专家,通过主题演讲,分享并深度探讨了大数据技术在业界一线的最佳实践和创新应用。
小米大数据总监司马云瑞为大会带来了题为《小米用户画像的演进及应用》的分享报告,循序渐进地分享了小米用户画像系统的建设和应用。小米公司经过7年的发展,积累了海量的日志和用户行为数据。基于全生态、多维度的数据资产,构建了丰富的用户画像体系,在业务运营、广告、互联网金融、新零售等各个领域发挥了重要作用。此次报告内容由小米数据产品小糖,小米攻城狮小秋整理出品。&此外,请查看本文末尾,可下载最新小米用户画像
什么是用户画像?——
简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
用户画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。
如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。
以下是司马云瑞精彩的报告实录。
小米用户画像的演进及应用
小米大数据团队在公司内部主要承担三项职能:
一是数据平台,基于公司海量数据构建数据仓库,提供OLAP(Online Analytical Processing),BI(Business Intelligence)等平台能力,支持业务部门数据需求;
二是数据建设,其中最重要的是用户画像的建设,帮助多维度的描绘用户,实现精细化运营;
三是数据驱动业务增长,也即数据应用,通过数据发现业务痛点,解决行业难题,颠覆行业模式。
司马云瑞主要分享了用户画像,及其如何应用,驱动业务增长,产生价值。
数据建设,其中最重要的是用户画像的建设
首先是小米的数据来源。
小米不仅是一家为人熟知的手机公司,小米还拥有丰富的智能硬件产品,小米电视、小米路由及众多生态链产品。除了在硬件上的广布局,小米还具备成熟的互联网业务,如云服务、互娱、小米金融、商业广告等。同时小米自带电商属性,有小米商城、全网电商、小米之家等线上线下渠道。
因此,小米有着琳琅满目的产品矩阵,小米的用户数据来自全生态,具备多样性。
小米生态链有丰富的产品线,如空气净化器,净水器,小米手环等,还有大热的“小爱同学”,一款改变中国智能音箱格局的产品。
该页右边展示了2016年4月小米内部云的数据统计情况,如每天新增850亿条的数据记录,2.3万个计算作业,当时数据规模为10PB等,&左侧由于隐私问题暂时保密,但可预见照片、视频需要的存储量是巨大的。
可以看到,小米日活过千万的APP就有21个,浏览器的日均搜索量超过1亿次,小米电视、语音助手等每日语音输出高达300万次,拥有这些丰富的全生态用户数据,小米在自然语言处理、语音模型等方面具有天然优势,这些数据的优势,也是小米AI的优势。
用户画像1.0——基于统计的用户标签
据司马云瑞介绍,小米大数据已经对接、服务了64个公司内部的业务组,主要通过两种方式:
1、建设公司基础、重要的数据点,构建数据工场,收拢数据,并在此基础上构建用户画像。小米的用户画像包含人口属性、兴趣标签、时空大数据等,业务可以直接使用;
2、构建数据应用团队,与业务方一起用数据解决业务难题,例如帮助新零售解决智能选址、供应链优化的问题,帮金融解决风控、反欺诈、征信问题,帮公司内部各个业务解决运营问题等。
小米大数据团队的使命是:“融汇全景数据,赋能核心业务”,从数据的收集,处理,画像的构建,到帮助业务提高,都是在践行这一口号。这样避免了数据孤岛,也实现了业务数据的互联互通。
这是小米用户画像的雏形,包含基础用户属性,如年龄性别、学历职业、地域语言、账号真实性、米粉指数以及兴趣属性等等。利用多维度数据的优势来描绘用户的属性,比如通过用户在多看阅读的历史记录,可以判断用户的阅读兴趣。
据介绍,用户画像1.0主要基于两项基本的技术:预测和统计规则。
某些事实属性小米有Label,于是直接采用机器学习的方法,结合用户的行为数据预测,例如性别年龄。
此外,大部分属性标签则基于统计规则生成,例如用户喜欢打游戏,或者经常飞行出差,小米大数据团队会通过一些规则统计用户的行为,并为这些用户打上竞技游戏、商务差旅等标签。
这里是用户性别属性的生成流程,是有监督学习。
这里以性别预测为例,一方面,小米有大量的帐号/手环/支付/VIP数据,这些数据都有用户的性别,可以作为训练样本。另一方面,小米有大量的用户行为数据,包含APP/浏览器/购物等数据,利用这些数据作为特征,可以训练性别模型。
针对不同的需求,例如追求准确率或者召回率,团队生成了不同的数据版本。模型本身也经过了多轮迭代,从最初的逻辑回归,到XGBoost,到现在的DNN.还以性别预测为例,随着数据积累的越来越多,预测效果也越来越好。而且随着数据的增多,一些DNN模型也得以利用,这也使得预测效果越来越好。
用户画像还可以直接为业务运营提供分析能力。
这里是梁振伦的粉丝群体与大盘用户相比,差异化使用的APP云图。
小米从诞生之日起就一直在跟黄牛斗智斗勇,我们基于用户的行为数据,帮助小米网预判用户是否可信,最终大幅降低黄牛比例。
小米大数据还帮助金融团队建立风险模型,预判信贷用户的违约风险,当前小米信贷业务的逾期率显著低于业界风险水平。
具体做法是从用户的历史行为数据和关系数据中,挖掘用户标签,用户社交属性,作为特征加入到模型中去。
用户画像2.0——基于行为的事实标签
服务业务的过程中,数据团队逐渐发现,画像1.0并不能解决所有的问题。
通用的兴趣标签不能满足精细化运营的需要,业务需要更精准的定制画像。
用户画像2.0旨在通过四种方法解决标签不够精细、定制化的问题:
支持直接基于用户行为数据,复杂组合逻辑的人群提取,方便业务同学自助灵活创建运营客群;
支持基于路径分析和序列挖掘的画像分析,帮助业务深入洞察用户;
定义统一的数据格式,支持业务资助扩充和接入自建的更精细的画像;
升级基于算法的智能人群拓展能力,集成业务画像数据生成特征,满足个性化的人群拓展需求。
基于事实行为产生的标签效果显著,帮助部分业务实现了230%到431%的ROI提升。
基于用户的行为数据,数据团队结合业务的实际需求,构建了百万标签库、路径分析、意图预测等能力。
路径分析使用频繁序列挖掘/基于统计的监督序列挖掘等技术对用户做分类;意图预测基于用户的历史行为和当前的环境信息,预测用户下一个可能的行为。
画像2.0还支持智能扩展人群,实现了标签定向(冷启动)到反馈定向(收集用户反馈数据迭代优化模型)的闭环,在部分业务实现了200%~300%的CTR提升。
用户画像2.1——用户画像与业务深度结合的外延探索
司马云瑞还介绍了用户画像与业务深度结合的外延探索。
小米在新零售的布局做了很多工作,从小米网的运营效率,到线下的小米之家,画像从数据应用上提供了许多支持,新零售之于大数据,司马云瑞认为可以总结成两句话:“线上线下数据融合,追求极致效率”,不管是风控,运营,还是供应链效率,都是新零售追求的目标。
除了线上的数据,小米还有许多线下数据,例如出库,销售,POI点等,这些数据的汇聚提供了一个很大的想象空间,例如滞销分析、竞品动态、区域画像。
举个例子,通过这个平台,用户可以了解到北京空气净化器卖得比较好,甚至更细致的,某个村子的小米用户画像特点。
基于用户的行为,小米大数据还在探索一款手机虚拟助手,基于场景或者规则预知用户的下一个行为,从而为用户提供非常贴心的服务。例如用户可以设置到家的时候,如果空气比较差,就打开空气净化器。
使用的是业内前沿的APP2VEC来做的,这样做有几个好处,特征维度从50万降到了200维,同时从实验结果看,APP2VEC可以替代大量的人工特征工程成本。
作为行为预测的一个案例,我们首先做了app打开预测,即预测用户下一个将要打开的app。
首先基于所有用户打开app的序列数据,在云端训练一个模型预测下一个打开的app,将模型下发到手机客户端,客户端基于云端的模型和自己的app使用序列finetune用户自己的模型,这样可以更好的预测用户下一个将要打开哪个app。
此外,用户的行为序列可以预测用户接下来要打开的5个应用,基于这个优化手机使用体验,以及实现更多场景的行为预测。
结合小米大量的行为数据和app2vec的技术,我们正在尝试把所有的action都转换成向量的形式,再借助LSTM-Attention技术,同时融合场景信息(如当前正在餐馆就餐)和个人标签(如用户兴趣)来预测用户下一个行为。
最后,司马云瑞老师组里面招聘人手,机会难得,感兴趣的人可以联系^^
特别提示-此次报告slide下载:
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),
后台回复“UP”或者“用户画像”
就可以获取司马云瑞此次报告pdf下载链接~~
欢迎转发到你的微信群和朋友圈,分享专业AI知识!
请登录专知,获取更多用户画像知识资料,请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录,顶端搜索“用户画像”
主题,查看获得对应主题专知荟萃全集知识等资料!如下图所示~
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:15600次
排名:千里之外
转载:48篇
(1)(11)(3)(6)(5)(2)(2)(1)(1)(1)(13)(3)(5)(1)
(window.slotbydup = window.slotbydup || []).push({
id: '4740887',
container: s,
size: '250,250',
display: 'inlay-fix'在线时间2 小时
版本V6.2.1.0.KXDCNBK
积分 24, 距离下一级还需 26 积分
积分 24, 距离下一级还需 26 积分
机型小米手机3/4 WCDMA版
MIUI版本V6.2.1.0.KXDCNBK
如题,昨天新到的2S,今天在设置输入法的时候,选择“百度输入法小米版”,然后系统提示说“会记录信用卡用户名,密码等信息”。。。
蛋疼了,这会不会被搜集到小米公司的服务器,然后被员工盗用??
这输入法到底安全吗??能用吗!!!
分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
经验2816 米
在线时间299 小时
版本7.10.12
机型小米MIX2
签到次数75
MIUI版本7.10.12
这个怎么说呢,就好比电信那些公司都说不会出卖客户资料,但不排除公司内部人员会私自干这些勾当啊,对不对?
经验7378 米
在线时间271 小时
版本6.8.18
积分 9225, 距离下一级还需 10775 积分
积分 9225, 距离下一级还需 10775 积分
机型小米手机2/2S
签到次数40
MIUI版本6.8.18
通过手机发布
经验392 米
在线时间30 小时
版本4.10.24
积分 495, 距离下一级还需 5 积分
积分 495, 距离下一级还需 5 积分
机型未知设备
MIUI版本4.10.24
哪个输入法都会记录你输入过的东西,看你信哪个了
经验13163 米
在线时间385 小时
版本7.11.17
404 not found
机型小米手机5
签到次数117
MIUI版本7.11.17
通过手机发布
不用,那你用什么,用自带的么,打字好费劲的说,我用的百度的输入法
经验6732 米
在线时间363 小时
夏天了!来杯可乐吧!
机型红米Note3 全网通
签到次数48
MIUI版本7.9.6
这个是例行安全提示而已。就好像你安装非市场软件要打开 未知源,会有个警告。打开usb调试,也会有警告。一个道理。你都用小米手机了,整个系统都是小米的,想到去还不是轻而易举?你用三星手机也同理。
经验174282 米
威望2142 米
在线时间0 小时
版本7.11.23
机型小米Note 3
签到次数207
MIUI版本7.11.23
有美国在,你还怕这?
各位开发组以及其他官方人员你好,如果我的回复有错误,在你不忙的时候请麻烦回复我纠正下,谢谢
做下广告,
经验771 米
在线时间4 小时
版本7.7.20
积分 677, 距离下一级还需 1323 积分
积分 677, 距离下一级还需 1323 积分
机型小米手机5S
签到次数86
MIUI版本7.7.20
我本来是系统自带搜狗输入法小米版的,后来三清了一下数据,居然输入法变成谷歌的了,谷歌的用的真不习惯
经验116 米
在线时间8 小时
版本V8.5.2.0.LAICNED
积分 160, 距离下一级还需 40 积分
积分 160, 距离下一级还需 40 积分
机型红米手机3
MIUI版本V8.5.2.0.LAICNED
通过手机发布
我也觉得有一定问题的,为什么要收个信用卡号和密码,你收集手机号码还可以但偏偏要收集信用卡号及密码啊真的要三思而定喽
已关注微信
关注腾讯微博
已关注腾讯微博
关注新浪微博
已关注新浪微博
已关注极客秀微信
MIUI七夕鹊桥勋章
MIUI 9纪念勋章
小米7周年勋章
2017米粉节晒单赢专属勋章
“澎湃S1 ”芯片纪念勋章
参与活动回帖可得
参与红米Note 4X活动
MIUI 300周
MIUI 300周更新纪念勋章
MIUI 3000万
MIUI 3000万发烧友纪念勋章
MIUI 2000万
MIUI 2000万发烧友纪念勋章
1000万用户纪念勋章
MIUI1000万用户纪念勋章
MIUI 7纪念勋章
MIUI五周年
MIUI五周年纪念勋章
MIUI六周年
MIUI六周年纪念勋章
发烧友俱乐部
发烧友俱乐部
感恩节勋章
参与回帖活动
万圣节勋章
参加回帖活动
米兔月饼勋章
参加回帖活动
MIUI七周年
小米众筹2周年
参加回帖活动
新版论坛APP
更新新版APP
2017年小金鸡勋章
回复2016年度评选活动贴
APP 1000万
MIUI论坛APP注册用户突破1000万纪念勋章
小火箭勋章
神舟11号 话题活动
内测督查勋章
内测督查员专属勋章
小米商城购买纪念勋章
论坛APP购买小米商品获得
解答组专属勋章
解答组专属勋章
小米平板2 Win10 荣誉内测
小米平板2 Win10 荣誉内测
Copyright (C) 2017 MIUI
京ICP备号 | 京公网安备34号 | 京ICP证110507号阅读正文 :
台湾媒体曝光:小米手机收集用户信息
驱动中国8月12日消息,据台湾媒体报道称,小米手机内置的&网络短信&服务,会自动回传用户资料至北京,并可能导致电话号码被窃取;小米前(10)日承认有瑕疵并道歉,同时紧急推出系统更新,提供用户关闭该项功能。
台湾媒体报道称,小米一年半前进入台湾市场,此次发生资料安全疑虑,在台湾40万户都恐受波及。
小米内置的免费&网路短信&,是小米手机用户才能使用的功能,发送与接收信息方都必须使用小米手机,双方都开启网络短信功能且都处于网络连线顺畅时,才能使用,其功能与LINE、Whats App等类似。
若想通过小米手机使用LINE等非小米手机内置的短信功能,就不会有资料外泄可能。
据安全公司F-Secure证实,小米自动将用户资料回传北京总公司的服务器,就算没安装小米云服务,也会回传用户的电话号码、IMEI码(国际称动装置识别码)和SIM卡号码,甚至包括之后新增的联络人资料;若登入小米云服务,连IMSI(国际移动用户识别码)都会曝露。
小米公司坦承上述指控,表示手机内置的免费&网络短信&功能,会在未经用户同意下,将资料传回北京服务器,并且回传用户电话号码没有加密,会被有心人士轻易利用监控工具、窃取用户的电话号码。
小米公司声音
小米表示,小米的&网路短信&是MIUI(小米专属的操作系统,提供各种包括云服务等网络功能)的系统功能之一。
小米手机在开机后,会通过小米服务器和IP通讯协定,自动启动网络短信服务,这项网络短信会使用手机的识别码(包括手机号码、IMSI及IMEI)对应后提供两设备间的资料传输,其原理和其他即时通讯应用软体类似。
科技网站《iThome》上周揭露小米机偷传资料到北京服务器,小米第一时间坚决否认,表示所有资料搜集都已事先征得使用者同意;随后网络上的批评如排山倒海而至,小米10日才紧急在FACEBOOK公开道歉,坦言其"网络短信&服务未经使用者同意就&自动启动&,回传用户手机号码到北京。
为了应对此次危机,小米发布OTA(云端)升级包以关闭&网络短信&自动启动功能,升级后,所有新用户或将手机恢复出厂设置的旧用户,该项服务将自动关闭。
不过,大量使用小米2S的网友表示,升级之后内置的浏览器不见了,同时还有部分用户反映,这次更新影响到聊天软体LINE的部分功能。
评论:小米这种做法首先是不道德,未经用户许可,将用户信息回传至小米服务器,就说小米公司不会泄露用户信息,但是这种做法让笔者不敢恭维,一直以为小米喊声为用户着想,&为发烧而生&,觉得是一家有节操的企业,但这件事情的发生,让我彻底改变了对他们的看法,小米之前的那种形象瞬间从脑海消失。
责任编辑:itcom
厂商投稿 产品评测/网站合作/010-84383 友情链接:029- 京公网安备55号
Copyright@
驱动中国 All Rights Reserved小米公司承认在台湾擅自搜集用户信息
  手机之家资讯中心8月11日消息:在台湾媒体多次曝光小米公司产品私自回传用户信息之后,小米终于不再否认,在Facebook上发布了道歉声明,并称发布升级包。
  小米方面表示,已于8月10日发布OTA升级包,关闭“网路简讯”自动启动功能,升级后,所有新用户或将手机恢复出厂设定的旧用户,如希望开启“网路简讯”可经由“设置& 小米云服务& 免费网路简讯”,或至简讯应用中启动该服务。
  小米声明如下:
  小米是一家行动互联网公司,致力于提供高品质的手机和优质的互联网服务,同时非常重视保护用户隐私。小米提供的所有互联网服务均符合小米公司隐私条款:未经用户允许,不会主动上传涉及用户隐私的个人资讯和资料。
  基于近日台湾的媒体报导,部分用户对“网路简讯”自动启动后的个人隐私资料传送的担忧,小米公司非常重视,已组织工程师连夜加班,并于今天(8月10日)发布OTA升级包,关闭“网路简讯”自动启动功能,升级后,所有新用户或将手机恢复出厂设定的旧有用户,如希望开启“网路简讯”可经由“设置& 小米云服务& 免费网路简讯”,或至简讯应用中启动该服务。
  小米公司对给用户造成困扰表示诚挚歉意,也感谢广大媒体、用户第一时间给我们反馈问题和修正机会,给小米更快进步空间,为用户持续提供更优质更安全的互联网服务。
  小米公司
扫一扫,分享到微信朋友圈
责任编辑:NN098
本文相关推荐
表情包你可能见多了,但是见过八项规定表情包吗?八项规定兑现党的庄严承诺,回应群众期盼,赢得党心民心。...
今天,以发展数字经济促进开放共享——携手共建网络空间命运共同体为主题的第四届世界互联网大会在浙江乌镇...
何镜堂院士登上广州国际金融中心(西塔)99层讲述广州财富建筑之美。在《财富》全球论坛到来之际,广州以...
在广州白云机场,不少旅客对刚上岗的虚拟安检引导员饶有兴趣。广州日报讯(全媒体记者李妍通讯员机场宣摄影...
 频道邮箱:news#(#改为@)小米手机研发风险及应对策略_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
小米手机研发风险及应对策略
&&关于新产品研发风险及应对
作者:张春胜
阅读已结束,下载文档到电脑
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢

我要回帖

更多关于 未经允许放入自提柜 的文章

 

随机推荐