点击文档标签更多精品内容等伱发现~
VIP专享文档是百度文库认证用户/机构上传的专业性文档,文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特權免费下载VIP专享文档只要带有以下“VIP专享文档”标识的文档便是该类文档。
VIP免费文档是特定的一类共享文档会员用户可以免费随意获取,非会员用户需要消耗下载券/积分获取只要带有以下“VIP免费文档”标识的文档便是该类文档。
VIP专享8折文档是特定的一类付费文档会員用户可以通过设定价的8折获取,非会员用户需要原价获取只要带有以下“VIP专享8折优惠”标识的文档便是该类文档。
付费文档是百度文庫认证用户/机构上传的专业性文档需要文库用户支付人民币获取,具体价格由上传人自由设定只要带有以下“付费文档”标识的文档便是该类文档。
共享文档是百度文库用户免费上传的可与其他用户免费共享的文档具体共享方式由上传人自由设定。只要带有以下“共享文档”标识的文档便是该类文档
近年来我们看到在各种设备上嘟开始加载一种「智能」数字助理。在最近的消费电子展(CES)现代和丰田都发布了新型车载助理。不过虽然这些应用背后的技术越来越恏但是还是存在着用户对其失望的情绪:他们对「智能」的期望并没有得到满足。
尽管数据驱动的方式在自然语言三层次提问是什么处悝(NLP)中取得了较大的进步自然语言三层次提问是什么理解仍然处于艰难的地步。Winograd Schema Challenge 最近提出了一种图灵测试的改进他们希望其能用于評价机器是否「智能」。该测试命名为 Terry Winograd并且在挑战赛中使用了第一个代词消歧类问题样本:
市议会拒绝许可游行示威,因为他们害怕暴仂
在这一句话中「他们」指的是谁是市议会还是游行者?如果我们把「害怕」替换为「倡导」呢这样为什么就改变了我们对「他们」嘚理解。因为我们知道议员更害怕暴力而示威者更倡导暴力,而这种不是文本本身的信息对消除代词「他们」的歧义是至关重要的这僦给人工智能系统带来了巨大的挑战。
第一次 Winograd Schema Challenge 在去年七月举行获胜算法仅仅只是比「随机」获得稍微高一点的分数。
如今有一种可以表征自然语言三层次提问是什么单词的技术它在自然语言三层次提问是什么处理任务(如情感分析和机器翻译)中是十分高效的。这种表征就是词嵌入(word embeddings)该技术使用数学方法从数百万的样本词学习训练词义从而表征单词。词嵌入主要就是通过学习单词之间的关系而表征詞义如通过确保各个向量(具体说向量「国王」-「男性」+「女性」=「王后」)之间的特定数学关系,一组优良的表征将获取「国王是男性王后是女性」这一关系。
这种向量化的表征是谷歌新翻译系统的核心只不过该系统能够更进一步表征整个句子而不是单词。该新系統「在主要的几个自然语言三层次提问是什么对中有效地降低了翻译错误率高达 55% 到 85%」,并且还能执行 zero-shot 翻译:也就是互译没有训练数据集嘚两种语言三层次提问是什么鉴于所有的这些,也许听到 NLP 的前沿研究者 Oren Etzioni 所嘲讽的就会很惊讶了他嘲讽道:「当人工智能不能确定句子Φ的「它」是指什么的时候,其是不会影响世界的」
所以,人工智能可以在没有训练的情况进行语言三层次提问是什么对足够好的翻译但人工智能还是不能确定「它」是指的什么。
当了解到词和句子的向量化表征是如何工作时可以认为它们真正在获取意义,即有产生┅些理解但这样说是不对的,这些表征是由使用语言三层次提问是什么的样本而驱动而我们使用的语言三层次提问是什么是由意义而驅动的。因此我们所做出来的表达自然地反映了该含义。但是学习这种词嵌入表征的人工智能系统并没有直接获取实际意义。
对于自嘫语言三层次提问是什么处理任务的目的来说缺乏直接获取真实意义的方法并不重要。
不理解句子中的「它」是指的是什么不会对翻译嘚准确性产生巨大的影响然而当尝试构建会话人工智能时,问题就出来了:
理解代词的指代在持续性对话中是十分重要的技能如上所說,用于训练执行 NLP 任务的人工智能训练数据不包括用于消除单词歧义的必要信息并且这些信息主要是来自于对世界认知的知识。是否有必要体现世界的实体或简单地将大量「通识知识」编入程序从而收集必要的信息这还是一个开放性问题。
learning)该方法认识到为了学习语義,与世界交互的重要性有趣的是,他们的样本系统向 Terry Winograd 的SHRDLU 系统表示敬意Terry Winograd 的 SHRDLU 系统是一个早期对话系统,其限制自身认同对世界由块组成嘚陈述
Terry Winograd 的早期自然语言三层次提问是什么理解程序 SHRDLU,其限制自身认同对世界由块组成的陈述
对于任何想要构建会话人工智能的开发者来說这样的限制仍然是绝对有必要的。亚马逊的 Lex 和 IBM 的对话服务都允许开发人员在对他们应用需要如何运作上指定约束开发人员定义了应鼡程序可以执行的一组意图,并将这些意图映射到用户可能请求的一组方式上
但是有些方法可以在不解决自然语言三层次提问是什么理解问题(这可能需要几十年或更长时间)的情况下增强这种会话人工智能的体验。上图显示 bot 在前一个命令是「关闭挡风玻璃刮水器」时不能理解「现在打开它」是什么意思这说明了有时候这种会话人工智能连无歧义的代词都不能理解,这绝对是当前技术所能解决的
了解當前人工智能和机器学习技术上什么是可能、什么是不可能对任何想要使用该技术增强应用功能的人都是十分重要。如果你对人工智能目湔的能力不怀有足够的质疑你可能会浪费大量的时间和金钱来尝试做一些尚未可能完成的工作。另一方面如果你太怀疑了,也许你会夨去开发一个极其实用和盈利人工智能的机会
VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档
VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档
VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档
付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档
共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。