什么是定序,举例说明快速排序有几种定序的方法

当前位置: >>
汉字定序
1、什么是汉字定序
  定序是指确定现代汉语用字的排列顺序,做到字有定序。首先需要确定汉字的排序方式,然后才能确定每个字的次序。传统汉字的排序法主要有义序法、形序法、音序法三种。形序法又有笔画法、部首法、号码法等三种。号码法中还有四角号码、三角号码、高低笔号等多种。此外,还有兼用不同方法进行汉字排序的,例如:先部首后笔画、先笔画后部首等等,方法众多,不一而足。
2各种排序法的优缺点
1)义序法的优缺点
  优点:可以从意义的角度成系统地查阅单字。
  缺点:
  ①意义的类聚关系没有一定的标准;
  ②同义类内部的顺序排列没有客观的依据;
  ③不适合字数较多的工具书。
2)笔画法的优缺点
  优点:只要会数笔画数,熟悉笔画笔形的先后次序,掌握了部首就可以进行汉字的检索。
  缺点:
  ①笔画数相同的字排序时存在二义性;
  ②有些字或者部件的笔顺不一致,影响正确排序。例如:
     母:中间是“横、点、点”还是“点、横、点”;
     竖心:是“竖、点、点”还是“点、竖、点”;
     万:是“横、撇、折”还是“横、折、撇”;
     女:是“横、折、撇”还是“折、撇、横”;
     车:末笔究竟是“数”还是“横”;等等,在普通使用者中间存在分歧。
  ③笔画数和笔顺都相同的字的排序存在二义性。例如:
    巾、山;
    开、井;
    天、夫;
    末、未;
    工、土、士;
    人、入、V、八;
    九、几、乃、匕;
    已、己、巳、弓;
    丸、凡、夕、么、及、久、勺
3)部首法的优缺点
  优点:
  ①部首法历史悠久、使用广泛;
  ②基本适应汉字的结构特点,多数汉字与部首具有意义上的联系;
  ③基本符合人们从形查字习惯和要求,便于查检不会读音的生字。
  缺点:
  ①部首的位置不固定,有些字难以确定部首;
  ②同笔画的部首字及同部首内的字,排列次序存在二义性。
4)号码法的优缺点
  优点:
  ①可以直接根据笔形编码查字,避免了数笔画的繁琐。
  ②汉字代码采用阿拉伯数字,汉字排列成自然数列,查找起来自然方便。
  缺点:
  ①规则比较复杂,初学者不易掌握;
  ②重码字较多,需要增加区别码
5)音序法的优缺点
  优点:
  ①排检速度快,准确率高;
  ②不受简、繁字体的影响;
  ③符合国际上大都按音序检索的习惯。
  缺点:
  ①读不出或读不准音的字、词可以排序,但是难以查找;
  ②同音字的顺序存在分歧。例如:
   《新华字典》shi4音节中下列32个字的顺序看不出具体的排列规则。
   士、仕、氏、舐、示、世、市、柿、式、试、拭、轼、弑、似、势、事、
   侍、峙、恃、饰、视、是、适、室、莳、逝、誓、释、谥、嗜、筮、噬、
  既不是部首法(单立人的字分开排列),又不是笔画法(笔画多少的字交叉排列),也不是频度法(使用频率高低不等的字混合排列)。好像是采用“声符”归类法,因为声符相同的字排列在一起。但是,不同声符之间的顺序如何排列的呢?因此,很令人费解。
  ③不适合用来编排收字较多的字典、词典。
  即使区分声调,现代汉语的带调音节约为1300个。《汉语大字典》56000个汉字,平均每个音节的同音同调字约为43个。如果考虑到各个音节汉字分布的不均匀性,个别音节的同音字会超过100甚至更多。这些同音字由于排列无明确规则,因此查找起来很费时间。
***[JimiSoft: Unregistered Software ONLY Convert Part Of File! Read Help To Know How To Register.]***
因此只有加强汉字笔顺、笔形等自身属性的研究,规范 汉字的书写顺序,使汉字真正做到定形定序,才能为电脑提供尽可能多的汉字信息,才能提 高汉字信息处理的效能,扩大...定量、定形、定音、定序 37.7000、《印刷通用汉字字形表》 38.《普通话异读词审音表》 39.音序法、形序法(部首法、笔画法、笔顺法)、 号码法 40.使用标准...15. 定序就是确定汉字的书写笔画顺序标准。 ――错误。汉字定序是指确定现代汉语用字的排列顺序,做到字有定序。首先需 要确定汉字的排序方式,然后才能确定每个字...具体形状叫笔形 部件,汉字的节本结构单位,介于笔画和整字之间 四定,现代汉语书面语用字做到“字有定量,字有定形,字有定音,字有定序” 定量,规定现代汉字的...现代汉字形序法是按照字形排列字的顺序,主要可分为 。 ①标记法 ②号码法 ③...( ) 12 ○ ○布署已定( ) 13 14 ○羽扇伦巾( ) ○真知卓见( ) 15 ...离间、冠心病、好逸恶劳 单、仇、洞、番、背,打茄发 胜利,胜任;生养,供养 ;文采 ,文饰 (四)定序: 定序就是确定现代汉字的排列顺序,实现汉字字有定序。...汉字笔顺执行统一的标准,是汉字规范化、标准化的需要[3]。汉字 笔顺既牵涉到定形问题,也影响到定序问题。汉字笔顺如果没有一个统 一的标准,无论是字典的检字...15、横竖撇点折 16、核心 笔画 整字 17、四个 四个 18、定形 定音 定量 定序 19、规定现代汉字的使用总量 3500 个 7000 个 常用字 一般用字 20、音序 ...汉字标准化,要求对汉字进行( )。 A.定量B.定形C.定音D.定义E.定序正确答案及相关解析
正确答案 A,B,C,E
解析 暂无解析 ...六、规范汉字的标准化 汉字规范标准化是指对现代汉语用字进行全面、系统、科学的整理,做到字有定 量、字有定形、字有定音、字有定序(简称“四定”),使现代...
All rights reserved Powered by
www.tceic.com
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。定序变量是指变量的取值除了类别、属性之外,没有区别对吗
全部答案(共1个回答)
特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。但是...
定序变量 变量的一种,区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有与的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。但是,各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定序变量在各个案上所取的变量值只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。
统计学依据数据的计量尺度将数据划分为三类:定距型数据(Scale)、定序型数据(Ordinal)、定类型数据(Nominal)。
定距型数据通常是指诸如身高、体...
指针是程序设计语言的一个重要概念。指针在C程序中有以下多方面的作用:  (1)利用指针能间接引用它所指的对象。  (2)利用各种类型的指针形式参数,能使函数增加...
【中位数】(Median)统计学名词,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数,用Me表示。当变...
对于两 组以上的均数比较, 必须使用方差分析的方法, 当然方差分析方法亦适用于两组均数的比较。
import java.util.D
import java.text.SimpleDateF
public class NowString...
答: 星火教育对孩子的帮助还是很大的,可以去咨询咨询
答: 学习要学好,有三个重要因素:一是兴趣,二是技巧,三是毅力。
先培养孩子对数学的兴趣,比如在孩子解出难题的时候给予表扬,告诉孩子你真聪明、可以把数学学好等,树立孩...
答: 友情帮顶,祝楼主早日找到自己想要的答案.
祝你身体健康,笑口常开!!!
答: 求证类型 求解类型
大家还关注
Copyright &
Corporation, All Rights Reserved
确定举报此问题
举报原因(必选):
广告或垃圾信息
激进时政或意识形态话题
不雅词句或人身攻击
侵犯他人隐私
其它违法和不良信息
报告,这不是个问题
报告原因(必选):
这不是个问题
这个问题分类似乎错了
这个不是我熟悉的地区包教包会:定序回归实战 | 说人话的统计学 · 协和八
我的图书馆
包教包会:定序回归实战 | 说人话的统计学 · 协和八
?说人话的统计学?在上一集《》里面,我们一起了解了最有「人味儿」的回归形式「定序回归」。大家还记得为什么定序回归会有这样的名号吗?定序回归的因变量是定序变量,也就是有顺序的类别变量。其由于常常用于测量人的主观判断或感受,比如满意程度,疼痛程度等,所以是最有「人味儿」的模型。今天这集,我们通过一个具体的例子看看定序回归是如何解决实际问题的,下面让我们请出说人话系列的长期客串演员蓝精灵们!蓝精灵村子新开了一家火锅店,原来格格巫在自动售货机上挣了一笔之后,又有了开餐馆的想法了,他把村子外面流行的火锅引入蓝精灵村子,没想到生意很火爆,蓝精灵们经常要排很长的队才能吃上格格巫家的火锅。看着自家餐馆门口长长的队伍,队伍里蓝精灵吃货们既饥渴又不耐烦的眼神,格格巫心里又欣喜,又担忧。他寻思这队伍太长了会不会影响了顾客们对就餐经历的评价,于是琢磨着想研究一下排队等待时间和客户满意度之间的关系。他在用餐结束之后发出满意度问卷,同时记录下每桌客人的等待时间和每桌客人的人数。数据搜集完毕之后,格格巫便请蓝精灵村的统计小天才聪聪来帮忙分析数据。聪聪先从整体上分析了一下要解决的问题,他要研究的因变量是客户满意度,属于定序变量(非常满意>满意>一般>不满意>非常不满意),正好可以用上最近新学的定序回归模型。至于模型的自变量,除了排队的时间之外,还应该考虑客人是一个人还是和别人一块儿来吃火锅的。毕竟,如果是一个人的话,也许对等待的忍耐程度会更低一些。有了大致的思路之后,聪聪就把数据整理了一下。由于聪聪关心的是一个因变量、两个自变量,因此数据集大概是下面这样的(仅列出头四个数据点):表 1 本集定序模型用到的数据集举例接下来,我们用定序回归模型来分析一下,等待时间和单人就餐这两个因素是如何影响就餐满意度的。依照上一集《》讲解过的模型形式,我们可以得到下面的模型:要记住,上面的 Py≤非常不满意、Py≤不满意&指的是累积概率,即因变量顾客满意度低于或等于某个特定级别(如「不满意」)的概率。我们把等待时间(连续变量)作为因变量&x1,把单人就餐(二分类变量,1 代表是,0 代表不是)作为&x2,利用统计软件进行定序回归模型拟合,就可以拟合出模型中的参数(各回归系数和截距)的极大似然估计值。这里,我们使用的是免费开源软件 R 里面的 ordinal 程序包中的 clm 函数进行拟合,它输出的结果如下(其他统计软件的输出形式也是大同小异的):图 1 R clm 函数输出的定序回归模型拟合结果。红框部分为我们对最关心的回归系数估计,结果的翻译对应表 2。蓝框部分对应的是截距的估计结果,大部分时候截距的结果对结论并不是很重要。表 2 回归系数拟合结果小结,我们在论文或者报告中汇报模型结果的时候需要给出表中的值,结果展示的形式可以参考投稿杂志的要求,但是一般都要包括估计值、标准误差以及 p 值 。从上面的结果可以看出,等待时间和是否是单人就餐这两个因素都对满意度有显著影响。我们还观察到回归系数都是负的,说明等待时间越长或者是单人就餐都会显著地减低吃火锅的满意度。一般统计软件除了输出自变量回归系数的信息之外,还会显示截距也就是&β非常不满意&等的估计值,在定序回归里面,截距有时也被称为阈值(threshold)或分界点(cut point)。除了定性地知道自变量是否对因变量有显著影响及其方向,我们还想定量地知道等待时间和单人就餐这两个因素会是如何影响吃火锅的满意度的。要想更好地理解回归系数的含义,我们还得回到模型本身:观察上面式子的左边,我们可以看到定序回归实际上是在预测因变量累积概率的分对数。通过模型拟合得到了回归模型的回归系数(β1,β2)和截距(β非常不满意,β不满意等)之后,我们可以运用下面的关系计算出&Py≤非常不满意、Py≤不满意&等累积概率的预测值:以上的形式其实与之前讲到的二分类以及多分类逻辑回归是一致的,只不过等式左边的概率不再是 y 属于某一类的概率,而是 y 小于等于某一个等级的概率,也就是 y 的累积概率。由于因变量和两个自变量之间的关系是非线性的,无法简单地用「等待时间增加 x 分钟,满意度的累积概率会减小 y,这种我们熟悉的线性方式来描述因变量和自变量之间的关系。对于这样的非线性关系,正是因为它比较复杂,数学上最精确的表述也并不一定能让人很容易理解。这时,用数据可视化的方式不仅可以帮助自己更好地理解模型,还能直观有效地将数据建模的结论传达给读者。我们下面就先聊一下用图来展示定序回归结果的几个要点。在将数据可视化时,咱们首先需要考虑的是 x 轴和 y 轴该是什么。由于我们的目的是展示拟合的模型,y&轴一般就是模型的预测值,在定序回归里就是满意度的累计概率,共有五个:Py≤非常不满意、Py≤不满意、Py≤一般、Py≤满意、Py≤非常满意也就是说到时候作出的图会有五条曲线,分别对应上面的五个累积概率。顺道一提的是,非常满意是可能出现的最高等级,所以因变量小于等于非常满意的概率为总是 1,即&Py≤非常满意=1。说完了 y 轴,再来看看 x 轴。统计模型的目的是定量地解释自变量与因变量之间的关系,既然 y 轴对应的是因变量,那 x 轴自然就得是自变量了。在这一集讨论的例子里面,有两个自变量,选哪一个作为 x 轴呢?一般会选择连续变量形式的自变量,也就是例子里的等待时间作为 x 轴。这时,剩下来的那个类别变量的自变量该怎么办呢?通常的做法是针对每一个类别作一个图,在这个例子里面,我们针对非单人就餐(左图)以及单人就餐(右图)的情况分别做图。这样得到的图形如下:图 2 用数据可视化的方法展示满意度和等待时间以及是否单人就餐之间的关系。y 轴是累计概率,x 轴代表等待时间(分钟)。左图是非单人就餐,右图是单人就餐。首先,我们从上图可以清晰地看到当等待时间增加的时候,满意度小于等于特定值的概率是增加的,也就是说满意度整体是下降的。另外,由于定序回归模型中的特定假设,上图里面有两个有趣的平移关系。首先,如果我们将每个图里的绿色曲线向右平移适当的量,便能与其它曲线完全重合。这其实是因为曲线的「形状」只和等待时间的回归系数&β1&的取值有关,而在我们的模型里面,不同满意度的累积概率所对应的回归系数&β1&的取值相同,才导致所有的累计概率曲线「形状」相同。上面提到的这个有意思的平移关系,其实是我们讨论的定序回归模型的一个重要假设,所以这里再啰嗦两句。同一自变量在所有累计概率中的回归系数取值相等,这说明自变量改变一定的值时,「非常满意」的累积概率和「不满意」的累积概率的分对数改变的值是相同的, 这称之为比例优势(Proportional odds)假设,对应的模型也可以称之为「比例优势模型」。第二个有趣的平移关系是,如果将左图也就是非独自就餐的预测值整体都向左平移&<img data-ratio='1.253' data-s='300,640' data-type='png' data-w='83' _width='22px' src='http://image109.360doc.com/DownloadImg/0/_3,就能完全与右图重合。对为什么感到好奇的小朋友可以看下面的推导:这第二个平移关系用人话说就是:从就餐满意程度而言,单人吃火锅等十分钟就餐,和多个人吃火锅等三十分钟就餐,效果是一样的。 而且,在等待相同时间的情况下,单人就餐的满意度整体是小于多个人吃火锅的满意度——看来蓝精灵们也喜欢人多一块吃火锅!需要注意的是,在这一集的例子里面,我们并没有假设两个自变量之间有交互效应,如果加上交互效应的话,第二层平移关系就不存在了,而第一层的平移关系会保留。最后,如果我们不仅想知道累积概率,还想知道y取特定满意程度的概率是如何随着自变量的变化而变化的,我们只要将图二稍做变换即可。由累计概率的定义,我们知道:根据这一关系,我们很快便能将 y 取特定满意程度的概率与自变量的关系绘制出来,如下图:图 3 用数据可视化的方法展示满意度和等待时间以及是否单人就餐之间的关系。y 轴是 y 取特定满意程度的概率,x 轴代表等待时间(分钟)。左图是非单人就餐,右图是单人就餐。从上图里面可以清晰地看出,当等待时间增加式,非常满意的概率在逐渐减低,而不满意的概率在逐渐增高。除了用作图的方法,之前在《》学到的除四法则也能帮助我们迅速地估计自变量对因变量的影响。除 4 法则是说,在对自变量变化最敏感的区域,自变量每增加一个单位,累计概率变化值约等于回归系数除以 4。在上面的例子里面,等待时间的回归系数是 -0.09,等待时间每增加 10 分钟,P满意度≤a&增加了 0.09×10/4=0.225,这里的 a 可以是任何一个满意程度。也就是说等待时间增加 10 分钟时,对于特定的满意程度,最多有 22.5% 的顾客的满意程度会从高于某个满意程度变成低于这个满意程度。读到这里,大家是否已经掌握了定序回归的理论和实践呢?希望大家在以后的实际应用中,遇到衡量人的主观判断的定序数据时,可不要忘了祭出我们的杀手锏——定序回归模型啊!作者:田菊编辑:鹅不食草编辑:小二仙草*&点击下方标题,或回复关键词「说人话的统计学」可随时查阅本系列任意文章!干货第 1 章 &高屋建瓴看统计第 2 章& 算术平均数与正态分布第 3 章& t 检验:两组平均数的比较第 4 章 &方差分析(ANOVA):多组平均数的比较第 5 章 &线性回归:统计建模初步第 6 章 &广义线性模型:统计建模进阶(未完,更新中)!自检番外篇作者简介
TA的最新馆藏
喜欢该文的人也喜欢您的位置: &
巧用组合和分步求解“定序排列问题”
优质期刊推荐

我要回帖

更多关于 子程序编程举例说明 的文章

 

随机推荐