离散数学推理理论证明 推理

人工视觉中的离散推断和学习 Discrete Inference and Learning in Artificial Vision
知识量:7.6
教师参与:6.8
趣味性:6.8
课程设计:6.8
难度:一般
开始时间:
持续时间:8.0周/每周2.0-3.0小时
你可能感兴趣
我们将呈现在现代人工视觉模型中最先进的能量最小化算法:获得给定视觉输入的最佳诠释的有效方法。我们还将讲解如何用流行的最大边界框架估算模型参数。课程概述人工视觉应用程序,如自然影像中的物体探测和医学采集的自动分段,基于对提供给计算机的视觉信息做出诠释的各种模型。模型提供的折中办法融合了相应的观察结果和先前技术领域的知识。这门课程介绍的是在实践中使用此类模型时所出现的两种计算问题。推理(能量最小化)在给定视觉观察结果(例如,影像或核磁共振成像(MRI)扫描)的前提下,我们感兴趣的是根据模型估量出最有可能性的解释(即影像中所有物体的位置,或者核磁共振扫描的区段)。由于问题不能以最佳的方式解决,我们将描述给出了用于实践的相当准确解决方案的艺术近似算法。在简要探讨算法的理论属性的同时,介绍重点将为算法的应用。学习(参数估算)在给定一系列由输入和所需输出构成的训练样本的前提下(例如,影像和物体的位置,或者核磁共振成像扫描及其区段),我们想要估算一个适合手头任务的模型。我们将展示学习模型中的问题如何能够归结为经验风险最小化问题。此外,我们将介绍用于解决相应最大化问题的有效算法。课程大纲第一讲:使用离散图形模型介绍人工视觉:这一讲按照计算视觉在不同应用领域的潜在用途简要介绍了其学科交叉性。接下来,介绍的是人工视觉离散建模的概念,从理论观点讲起,同时展示了用于低层视觉、中层视觉和高层视觉的此类方法之效用的简短示例。这些示例涉及盲图像反褶积、基于知识的图像分割、光流、图形匹配、2D至3D视角不变检测和建模以及文法驱动基于图像的重建。第二讲:重新参数化和动态规划:在这一讲中,我们将简要介绍无向图模型。我们还将为推理中的问题(特别是能量最小化)给出正式定义。我们会介绍重新参数化的概念,这是课程中探讨的所有推理算法的构成要素。我们会讲解一个称为动态规划且包含若干重新参数化的简单推理算法。我们会展示如何将动态规划用于执行链上的精确推理。第三讲:最大流和最小割:在这一讲中,我们将介绍有关无向图形中的弧线的函数概念。我们重点介绍的是称为流函数的一个特殊函数。与此函数相关的是计算有向图的最大流过程中的组合优化问题。我们还将介绍在有向图中分割的概念,并证明最小损耗分割等同于最大流。我们会介绍用于解决最大流或相应最小割问题的一个简单算法。第四讲:基于最小割的推理:在这一讲中,我们将展示带两个标签的无向图模型的推理问题如何能归结为一个最小割问题。我们会描述能使用最小割问题来实现最佳的最小化程度的能量函数。我们会介绍使用图像分割和纹理合成问题的范例,这些问题能够使用两个标签表示。我们将思考多标签问题,并基于最小割算法设计用于推理的近似算法。我们会展示使用立体重建和图像去噪问题的范例。第五讲:置信传播:在这一讲中,我们将呈现信息传递和置信传播网络的基本概念。此概念最初将使用链演示,然后延伸至树形式,最终为任意图。同时将呈现此类优化框架的强度和限制。通过使用范例演示此系列优化算法的效用,图形完成和纹理合成问题将用作展示此类优化算法用处的范例。第六讲:线性规划与二元性:在这一讲中,我们将使用线性规划松弛中的概念来解决离散推理问题。尤其,我们将介绍图形优化问题如何能够表示为线性规划问题,以及如何能够利用二元性定理来开发有效的优化方法。光流问题及其在医学影像分析中的可变形等级变量将视作演示此类优化算法效用的范例。第七讲:对偶分解和高阶图:在这一讲中,我们将介绍用于优化低阶与高阶图模型的对偶分解框架。首先,我们会使用一个简单的虚构示例来演示此种方法的内容,然后我们将转而介绍最常见的优化问题案例。我们会在高阶优化的背景下思考三个不同的范例,并在医学成像的背景下思考影像间线性映射、密集变形图匹配以及姿势不变物体分割法的发展等问题。第八讲:参数学习:在这一讲中,我们将介绍两个框架,其用于估算使用处于完全监管下的培训用数据的图模型中的参数。第一个框架在调整参数的同时最大化了培训用数据的可能性。第二个框架在调整参数的同时最小化了由用户定义的损失函数测定的经验风险。我们将简要介绍解决相关优化问题所需的算法。我们会展示在标准机器学习数据集中获得的结果。先修知识建议学生选修一门有关算法的基本计算机科学课程,这将有助于理解这些问题及其解决方案的复杂性。参考资料除了讲座之外,我们将提供一些与这门课程所涵盖的主题相关的文件。那些想要了解推论和学习的艺术方法的其他详情的学生可能会对下列编纂的图书卷册感兴趣。Andrew Blake、Pushmeet Kohli和Carsten Rother(编辑)合著的。美国麻省理工大学出版社,2011年。 我们强烈建议学生阅读更多的以下文件。(注意:所有文件可以通过谷歌搜索工具在开放获取资源中找到):Chaohui Wang、Nikos Komodakis和Nikos Paragios合著的。其中Computer Vision and Image Understanding位于第117卷(第11版):第1610页至第1627页(2013年)。Yuri Boykov和Vladimir Kolmogorov合著的,位于IEEE Transactions on Pattern Analysis and Machine Intelligence第26卷(第9版):第1124页至第1137页(2004年)。Yuri Boykov和Olga Veksler,位于中,由Nikos Paragios、Yunmei Chen和Olivier Faugeras编辑。施普林格出版社,2006年。Yuri Boykov、Olga Veksler和Ramin Zabih合著的,位于IEEE Transactions on Pattern Analysis and Machine Inteligence第23卷(第11版):第1222页至第1239页(2001年)。Vladimir Kolmogorov所著的,位于IEEE Transactions on Pattern Analysis and Machine Intelligence第28卷(第10版):第1568页至第1583页(2006年)。Vladimir Kolmogorov和Ramin Zabih合著的,位于IEEE Transactions on Pattern Analysis and Machine Inteligence第26卷(第2版):第147页至第159页(2004年)。Nikos Komodakis、Georgios Tziritas和Nikos Paragios合著的年)。Nikos Komodakis、Nikos Paragios和Georgios Tziritas合著的。位于IEEE Transactions on Pattern Analysis Machine Intelligence第33卷(第3版):第531页至第552页(2011年)。Ben Taskar、Carlos Guestrin和Daphne Koller合著的,位于Proceedings of Advances in Neural Information Processing Systems:(2003年)。Ioannis Tsochantaridis、Thorsten Joachims、Thomas Hofmann和Yasmine Altun合著的,位于Journal of Machine Learning Research第六版:第1453页至第1484页(2005年)。Tomas Werner,位于IEEE Transactions on Pattern Analysis and Machine Intelligence第32卷(第8版):第1474页至第1488页(2010年)。 授课形式每周将有一次时长约1小时的讲座。此讲座将划分为若干时长约为10分钟的迷你视频。每周,我们还会向学生提供一个基于该周讲座主题内容的问题集。常见问题解答完成这门课程,我将获得完成声明吗?是的。凡是顺利完成这门课程的学生将获得由授课教师签署的完成声明。我需要为这门课程准备什么?对于这门课程,你只需要保持网络连接可用,以及充裕的时间来观看视频、理解学习资料、与同学讨论学习内容并参加测验。
课程有难度。大致相当于国内研究生专题课。主要是graphcut以及马尔科夫随机场在图像处理中的模型和应用。适用范围相对较...

我要回帖

更多关于 离散数学逻辑推理 的文章

 

随机推荐