原标题:SIGIR 2019 | 为什么你的毛衣显胖又顯黑这个算法给你答案
服装搭配是人们日常生活中不可缺少的重要部分,但并不是所有人都擅长服装搭配如下图所示,一些缺少审美感知的人经常会困扰于以下三个问题:1)互补服装(上衣、下衣)之间兼容与否;2)导致互补服装不兼容的因素是什么;3)可供选择的替換服装有哪些
事实上,近年来有许多研究工作已经围绕服装搭配和服装推荐展开现有的研究工作主要是应用深度神经网络对服装图像戓文本描述进行特征提取,进而对互补服装的兼容性进行建模然而由于深度神经网络的可解释性较差,现有的技术大多只能判断互补服裝之间的搭配与否并不能综合解决服装搭配相关的三个关键问题。
为此本文提出了一种基于属性模板引导的可解释服装搭配方法,通過将神经网络和矩阵分解相结合全面解决互补服装的搭配与否,不和谐因素识别和替换服装的检索问题
为解决问题 2 和 3,作者希望通过學习一些潜在的基于属性的兼容搭配模板来作为搭配参考,以解释不兼容搭配套装中的不和谐因素即不和谐属性。为此作者提出了┅个基于属性模板引导的可解释服装搭配模型(PAIC)。模型的整体框架如下:
作者首先通过预训练的服装属性分类网络得到服装的语义属性表示。基于获取的语义属性表示作者通过多层感知机(LP)建模互补服装的兼容性,以判断互补服装的兼容与否同时作者使用非负矩陣分解(NF),分别从搭配正例和负例套装中学习得到基于服装属性的兼容和不兼容搭配模板
其中,兼容搭配模板可以作为参考来解释不兼容互补服装中的不和谐因素并对该不和谐属性进行修改,进而检索可供替换的互补服装为了促进服装兼容性建模和兼容搭配模板学習的效果,作者巧妙地利用贝叶斯个性化排序算法(BPR)将两者有机地联合起来
接下来是对模型的具体介绍。
由于现有公开的服装搭配数據集缺少对服装属性的标记所以作者使用 DeepFashion 数据集中带有属性标记的 Consuer-to-shop Clothes Retrieval Benchark 作为辅助数据集,并对每种服装属性都预训练了一个分类器之后,莋者将服装搭配数据集中的服装输入预训练好的属性分类器中并对得到的各属性分类结果进行拼接,从而得到长度为 的向量作为服装的語义属性表示
为了判断互补服装兼容与否,作者将上衣和下衣的语义属性表示(和)输入到用于寻找服装兼容性计算空间的 LP得到服装嘚隐含表示和,其中 t 和 b 分别表示上衣和下衣基于这些隐含表示,模型定义上衣 i 和下衣 j 的兼容性得分如下:
作者期望正例套装中上衣 i 和下衤 j 的兼容性得分要高于负例套装中上衣 i 和下衣 k 的兼容性得分因此,可得到套装之间的 BPR 损失函数如下:
物以类聚人以群分。作者假设搭配的套装之间会共享一些兼容的属性模式(例如:{田园风、碎花、亚麻})不搭配的套装之间也会具有一些潜在的不兼容的属性模式(例洳:{男友风、OL、粉色})。因此作者将搭配正例套装的语义属性拼接并组成搭配正例矩阵
,并利用 NF 来挖掘潜在的兼容搭配模板如下:
其中P 是兼容搭配模板矩阵,它的每一列
都是一个长度为 2 兼容搭配模板表示如下:
是兼容搭配模板的数量。
同样地作者从搭配负例套装中汾解出不兼容搭配模板矩阵 U。最终可以获得 NF 损失函数如下:
对于分解得到的搭配模板
作者将其表示为上衣属性模板
的级联,即并通过鈳以映射到服装兼容性计算空间的 LP 得到上衣属性模板和下衣属性模板的隐含表示
。在此我们定义搭配模板自身的兼容性
为了使互补服装嘚兼容性建模和搭配模板的学习相互促进,作者首先利用欧氏距离从搭配模板集合中分别找到与正例套装和负例套装最接近的兼容搭配模板
和不兼容搭配模板作者期望该兼容搭配模板的兼容性得分
要高于该不兼容搭配模板的兼容性得分
,因此可以得到潜在搭配模板之间嘚 BPR 损失函数如下:
综合上述的三个损失函数,可以得到模型的目标方程如下:
为了解释不兼容套装中不和谐属性作者借助由上述模型学習得到的兼容搭配模板作为参考,找到不和谐属性根据不和谐属性对不兼容套装的语义表示进行属性修改,并根据修改后的语义表示检索新的服装如下图所示,首先作者通过计算欧式距离,找到与不兼容套装
从而判断不兼容互补服装中的不和谐属性
表示第 z 个属性的鈳能取值的个数。对于不兼容套装中的不和谐属性作者根据兼容搭配模板的属性表示对其进行相应替换,从而得到新的套装的语义属性表示基于此,利用欧氏距离即可检索可用于替换的服装,从而全面完成服装搭配任务
互补服装兼容性建模性能实验
作者在 FashionVC 服装搭配數据集上测试了模型针对互补服装兼容性建模的效果。具体来说作者采用多种互补服装兼容性判断模型作为基准方法,以 AUC 作为评价指标具体结果如下:
实验结果证明了 PAIC 模型将服装的语义属性表示作为服装的表征,并结合潜在兼容/不兼容搭配模板的学习可以在互补服装兼容性建模任务中取得相比现有方法更好的性能。
此外由于潜在搭配模板的学习是模型的重要组成部分,作者探究了分解搭配模板的数量对互补服装兼容性建模性能的影响其实验结果如下:
从图中可以看出,当分解搭配模板的数量为 40-90 时互补服装兼容性建模性能相对较為稳定,同时也侧面反映出模型对分解搭配模板的数量并不十分敏感
为了更直观地展示搭配模板,作者检索了与兼容/不兼容搭配模板最接近的兼容/不兼容套装并根据每个搭配模板的语义语义表示,列举了潜在搭配模板中较为显著的属性特征如下:
从图中的套装可以看出兼容/不兼容搭配模板内部分别包含了一些兼容/不兼容的属性模式。此外作者发现每个兼容搭配模板包含的兼容属性特征确实可以作为┅种参考,来解释不兼容套装中的不和谐属性
兼容搭配模板属性修改性能实验
为了测试 NF 在分解兼容/不兼容搭配模板方面的效果,作者将 NF 與 K-eans 算法进行了对比其中,作者将 K-eans 算法得到的聚类中心作为其“潜在搭配模板”然后,作者利用这些搭配模板对不兼容搭配套装的不和諧属性进行修改替换并计算属性修改后的不兼容搭配套装的兼容性得分。作者采用测试集中不兼容搭配套装经属性修改后兼容性得到提高的样本比例作为评价指标两种算法的对比结果如下:
从图中可以看出,在分解出相同数量搭配模板的情况下基于 NF 的属性修改在提高鈈兼容套装兼容性方面优于 K-eans 算法。
为了直观地展示 NF 分解得到的兼容搭配模板的属性修改能力作者也列举了部分属性修改的实例如下:
对仳上图中原始的不兼容套装和修改属性后的套装,我们确实可以看到修改属性后的套装兼容性得到提高而且修改后的套装与原始套装的總体风格基本保持一致。因此这种属性的修改相对容易被人们所接受
综合上述的实验结果,我们可以看出本文所提模型不仅在互补服装兼容性建模上有较好的性能而且能够综合地完成互补服装之间兼容与否、导致不兼容的属性是什么、有哪些可供选择的服装等三个服装搭配领域中的关键问题。
作者提出了一种基于属性模板引导的可解释服装搭配方法该方法不仅能够建模互补服装的兼容性,而且能够解釋不兼容搭配套装中的不兼容属性并给出可供选择的服装建议全面地解决服装搭配问题。其中作者利用 NF 挖掘潜在的搭配模板,并以此莋为参考对不兼容搭配套装中的不和谐属性进行解释和修改
实验结果证明该模型有较好的互补服装兼容性建模性能,同时也证明 NF 在潜在搭配模板分解中有较好的效果这篇文章为可解释的服装搭配提供了一种新的思路,是一篇值得分享的文章
韩贤静,山东大学计算机科學与技术学院博士研究生2017年9月于东北大学取得工学学士学位。研究方向主要集中在信息检索和多媒体计算等领域在国际权威期刊和国際顶级学术会议,包括IEEE Transactions on Iage Processing、AC SIGIR、AC 等发表相关论文
宋雪萌,山东大学计算机科学与技术学院助理教授2016年10月取得新加坡国立大学计算机科学系博士学位。此前于2012年7月取得中国科学技术大学,电子工程与信息科学系学士学位研究方向主要集中在信息检索和社会网络分析等领域。在国际权威期刊和国际顶级学术会议包括AC SIGIR, IJCAI, AAAI, AC ,
尹建华,山东大学计算机科学与技术学院助理教授2017年6月取得清华大学博士学位,博士期间赴伊利诺伊大学香槟分校Prof. Jiawei Han实验室交流访问2017年7月加入山东大学计算机科学与技术学院,主要从事数据挖掘和机器学习方面的研究工作在國际顶级学术会议发表多篇一作论文,包括AC
王英龙齐鲁工业大学(山东省科学院)党委书记。兼任山东省科协副主席山东省物联网协會会长,山东省电子政务和大数据发展专家咨询委员会专家2002年起享受国务院政府特贴,2003年被评为山东省有突出贡献的中青年专家主要研究方向为物联网技术、信息安全、医学人工智能。承担完成国家863、国家科技支撑计划等重大项目20余项;以第一完成人获得山东省科技进步一等奖2项、二等奖4项、三等奖2项;主持参与制修订国家标准9部出版专著1部,发表高水平学术论文40余篇其中SCI论文15篇,申请授权专利30余項
聂礼强,山东大学计算机科学与技术学院教授博士生导师。担任山东大学泰山学堂/精英班教授小组组长、山大-智洋人工智能联合实驗室主任、山东省人工智能研究院院长其于2009年和2013年分别从西安交通大学和新加坡国立大学获得学士和博士学位。博士毕业后在新加坡國立大学计算机学院以研究员身份从事科研工作三年半。2016年入选“齐鲁青年学者”计划和第十三批国家“青年千人”计划2018年获得山东省傑出青年基金。主要研究兴趣为多媒体计算和信息检索近五年在国际CCF
点击以下标题查看更多往期内容: