65dddd.com 扩散模子也能解决酬酢信息保举,港大数据智能实验室提议RecDiff
发布日期:2024-07-31 15:15 点击次数:142RecDiff团队投稿65dddd.com
量子位 | 公众号 QbitAI
用扩散模子搞酬酢信息保举,奈何解决数据噪声发愤?现存的一些自监督学习次序遵循如故有限。
针对此,港大数据智能实验室提议了新时势RecDiff。
RecDiff是一种全新的基于扩散模子的保举框架,大致更好地捕捉用户的潜在偏好和趣味,从而生成个性化、贴合用户需求的保举执行。
具体而言,该框架经受隐空间扩散机制,有用祛除用户示意中的噪声,不论是压缩如故密集的镶嵌空间。
RecDiff通过多步扩散和噪声排除历程,展现出在不同噪声水平下均能准确识别和去除噪声的才气。
此外,扩散模块针对下贱保举任务进行了优化,以最大化其对保举历程的增强遵循。
通过平时的实验评估,RecDiff在提高保举准确性、老师遵循以及去噪遵循方面均推崇出色。
参议次序基于图协同过滤的编码器受到简化图神经收罗(GNN)奏效应用的启发,图那对在酬酢去噪框架中经受了轻量级图卷积收罗(GCN)看成图编码器。
图关系去噪模子隐空间的酬酢扩散吸收扩散模子在各个限度奏效生成无噪声数据的精髓,参议团队的RecDiff框架集成了一种鼎新的扩散机制,用以产生净化后的酬酢关扫数据。
靠近酬酢图数据固有的疏淡性挑战,参议团队想象了一种计谋:
在潜在空间而非径直在图数据空间中,通过正向与反向的扩散次序,结束酬酢信息的高效和精确扩散。
如上图所示,该隐空间酬酢扩散历程可通过以下公式进行精粹抒发:
正向和反向扩散扩散耗费函数测度历程展望和优化愚弄隐空间酬酢扩散模块,参议者将去噪后的酬酢关系与编码后的交互范式皆集起来,以获取展望的最终镶嵌。
具体次序如下:
模子复杂性分析本节全面分析了参议者的 RecDiff 与社会扩散模块在时候和空间上的复杂性。
时候复杂性。
空间复杂性。
实验模子举座性能比较团队比较了团队的模子与基线模子的举座保举性能。
top-20和不同top-N的考证收尾列于下表:
团队的RecDiff永久优于最先进的基线,展示了超卓的保举准确性。
T 历练证据了团队的收尾在所罕有据集和评估缱绻上的统计真义。
在不同的top-N开导中,RecDiff的性能上风保握一致。团队的基于扩散的酬酢关系去噪模块不错去除无关信息和作假信息,从而使RecDiff有用地挖掘有价值的酬酢关系以增强保举遵循。
一些酬酢保举次序如(DGRec、DiffNet 和 GraphRec)的推崇比与酬酢信息无关的次序NGCF差。这标明,由于作假或不相干的要素,酬酢关系会对用户-商品关系建模产生负面影响。
团队的RecDiff框架通过对酬酢信息去噪来解决这个问题,其性能永久优于基线模子 GDMSR。它能有用过滤酬酢关系中的杂音,识别专门念念和有影响力的酬酢关系,准确编码用户偏好,从而结束精确保举。
包含自监督学习(SSL)的基准次序在保举性能上一直优于其他次序。MHCN、KCGN和SMIN等次序愚弄了局部-全局互信息最大化技能的变体,而 DSL 则经受了展望对皆自监督任务的次序。
这突显了赞成监督信号在解决酬酢保举中的数据颓势发愤(如噪声和疏淡性)方面的积极影响。
比拟之下,团队的模子引入了一种基于扩散模子的多次序去噪次序,在不同的噪声水平下生成更多的监督信号。这种宏大的去噪才气带来了特出基线的超卓保举性能。
消融实验团队将通过一项消融参议来商量RecDiff框架中不同子模块的影响。团队评估了通过删除或替换基本模块而获取的几个变体的性能。
-D:删除举座扩散模块,只保留酬酢和用户-商品关系学习GNN。移除扩散模块(-D)会导致性能权臣下落,这突显了团队的潜在特征级扩散模子所提供的去噪功能的有用性。-S:不愚弄酬酢信息,总共依靠用户-物品交互图来进行保举。将此变体与RecDiff进行比较,突显了在用户偏勤学习中纳入用户酬酢配景信息所带来的权臣改造。然则,在含有嘈杂酬酢信息的epinions数据聚积,-S 变体可能会优于-D变体。-DAE:用去噪自动编码器取代RecDiff的基于扩散的去噪模块。这个基于 DAE 的去噪模块经过老师,不错重建赶快屏蔽的用户表征。与普通去噪技能比拟,DAE变体的次优性能展示了团队想象的扩散模块的超卓去噪才气。通过分享神经收罗迟缓学习从t到t-1的每个去噪过渡次序,RecDiff不错有用地模拟复杂的示意分歧,sex8从而增强潜在特征的降噪才气。超参数的影响噪声对模子的影响老师遵循参议与基线模子(MHCN、SMIN 和 KCGN)比拟,团队在 Ciao 和 Yelp 数据集上优化 RecDiff 的遵循。
RecDiff在老师和测试中都推崇出了较着的遵循上风。关于每个老师历时,团队都评估并纪录了测试集的性能,以分析改造情况。
RecDiff的老师遵循:团队的 RecDiff 在老师遵循方面永久优于基线,这收获于有用的去噪扩散加快优化。基线模子的局限性:SMIN 知道出过拟合遵循,可能是太过依赖元旅途图,为止了其泛化的才气。MHCN 结束了较高的最终性能,但由于其复杂的超图结构,拘谨速率较慢。比拟之下,团队的 RecDiff 则收获于紧凑的神经架构,不需要手工制作先验,因此能愚弄赞成信号进行更快的优化。对 RecDiff 框架抗噪才气的进一步探索团队评估了 RecDiff 在数据噪声情况下的鲁棒性,次序是在用户-用户图中引入赶快作假边来替代不同比例的确实酬酢联接。
然后使用被破损的图对模子进行再行老师,并在确实测试集上进行评估。
具体来说,团队分析了用噪声信号替换 0%、20% 和 50% 的酬酢关系的遵循。
比较 RecDiff 与 MHCN 和 DiffNet 的性能,上图(a)和(b)中的收尾知道了原始评估收尾,而(c)则诠释了 NDCG 的相对性能变化。
亚洲日韩基于这些收尾,团队不错得出以下论断:
RecDiff 的鲁棒性上风:团队的模子在性能下落较小的情况下优于基线模子,展示了其在酬酢保举中超卓的去噪才气。比拟于 SSL 的去噪遵循:MHCN 模子在去噪方面推崇出色,但与团队的 RecDiff 模子比拟仍有不及。这凸起标明,通用的自监督学习任务可能无法有用兴隆酬酢保举的特定去噪条款。Ciao 数据集的噪声比更高:与其他数据集比拟,Ciao 数据集的性能下落幅度更大,这标明噪声比更高。案例分析团队商量RecDiff在特定用户/商品案例中的去噪遵循。
图中展示了四个子图案例,凸起了去噪的必要性。
基线次序KCGN和MHCN无法识别无理的酬酢联接,导致这些无理酬酢邻居的同样性得分很高。
比拟之下,RecDiff能有用识别这些噪声实例,权臣裁汰同样性得分,并为作假联接的用户生成不同的镶嵌。
这些发现诠释注解了 RecDiff 在不同噪声情况下的出色消噪才气。
图中还先容了另外两种情况,即用户对分享的交互商品在类别上与用户交互的其他商品存在权臣各异。
这些孑然的交互很可能存在噪声的商品,从而使相干的酬酢连气儿也变得有噪声。
RecDiff 再次奏效地识别并列除了这些杂音,为作假的酬酢邻居分拨了较低的同样性分数并生成了更特有的镶嵌。
这些案例进一步体现了 RecDiff 次序的出色去噪遵循。
结语时势团队提议了一种名为RecDiff的新式扩散模子,旨在通过排除用户之间杂音酬酢连气儿来增强社会化保举系统。
RecDiff经受多步噪声传播和排除的老师样式,在遮掩空间中出手,愚弄编码的用户表征,结束了高效和通俗的想象。
通过在不同扩散次序下对模子进行老师,RecDiff 展现出了出色的噪声处理才气,大致有用应付多样类型的噪声影响。
参议图那对在确实天下数据集上评估了模子的性能,收尾知道比拟现存次序,RecDiff在保举准确率方面取得了权臣升迁。
将来,RecDiff团队有计划将RecDiff拓展到更多保举场景中,并皆集多模态信息,进一步探索该模子的后劲和应用价值。
论文:http://github.com/HKUDS/RecDiff
源代码:https://github.com/HKUDS/RecDiff港大数据智能实验室:https://sites.google.com/view/chaoh— 完 —
量子位 QbitAI · 头条号签约65dddd.com