1.4 主要贡献
本书从数据、模型和经济学意义三个方面对个性化推荐的可解释性进行系统性的研究,主要贡献分为三点,总结如下。
第一,数据的可解释性,提出基于双边块对角矩阵的局部化矩阵分解框架,并将其应用于矩阵分解的并行化。用户-物品评分矩阵是个性化推荐算法,尤其是基于矩阵分解的个性化推荐算法的数据基础和主要输入。传统的矩阵分解算法将原始矩阵看作一个整体进行分解和预测,缺乏对矩阵内在结构的理解。本书提出矩阵的双边块对角结构,并在理论上证明该结构与二部图上社区发现算法的数学等价性,从而解释矩阵内在的社区结构和社区关系。在社区结构的基础上,进一步提出了局部化的矩阵分解框架,并理论证明了它与传统矩阵分解算法的兼容性,从而为常用的矩阵分解算法提供了一个统一的并行化框架,在提高预测精度的同时大幅提高计算效率。该部分内容将在第3章进行介绍。
第二,模型的可解释性,提出基于短语级情感分析的显式变量分解模型,及其基于时间序列分析的动态化建模。基于矩阵分解的隐变量模型由于其较好的评分预测效果和可扩展性,逐渐成为了个性化推荐的基础算法,并在实际系统中得到广泛的应用。然而由于变量在本质上的未知性,隐变量模型难以对推荐算法和推荐结果给出直观可理解的解释,进而降低了推荐系统对用户的可信度。本书利用短语级情感分析技术从大规模的用户评论中抽取产品属性词及用户在不同属性上表达的情感,进而引入显式变量,并提出基于显式变量分解模型的个性化推荐算法,一方面使得模型的优化过程具备了直观意义,另一方面给出在模型层面可解释的推荐结果和个性化的推荐理由。由于用户在不同属性上的偏好具有时间周期性,利用时间序列分析对用户偏好进行动态建模和预测,从而实现动态时间意义上的可解释性推荐。基于浏览器的大规模真实用户实验显示,本书的方法在点击率、购买率、一致性等多个线上指标上效果显著。该部分内容将在第4章进行介绍。
第三,推荐的经济学解释,提出基于互联网系统总福利最大化的个性化推荐框架,并给出典型应用场景中的具体实现。随着人类传统线下活动的不断线上化,常见的互联网应用均可以形式化为“生产者-服务-消费者”模型,例如在电子商务网站中,网络商家(生产者)提供在线商品(服务),而网络用户(消费者)则在众多的商品中进行选择和购买。基于传统经济学的基本定义,本书首先给出了互联网环境下效用、成本和福利的基本概念与统一形式,并进一步给出了互联网应用中总社会福利的通用计算方法。在此基础上,以互联网服务分配为基本问题,提出基于网络福利最大化的个性化推荐框架。随后本书在典型的网络应用(例如电子商务、P2P借贷、在线众包平台)中对该框架进行具体化,并进行个性化的网络服务推荐与评测。实验结果表明,该方法可以在为用户提供高质量服务推荐的同时提升社会总福利,即在提升用户体验的同时又增强了社会效益。该部分内容将在第5章进行介绍。
(1) 阿里巴巴,中国最大的电子商务企业平台,http://www.alibaba.com。
(2) 京东商城,中国最大的自主经营式电子商务平台,http://www.jd.com。
(3) 亚马逊网络商城,美国著名电子商务网站,在世界主要国家提供服务,http://www.amazon.com。
(4) 新浪微博,中国主要的微博客社交网络平台,http://www.weibo.com。
(5) Facebook,全球最大的社交网络平台,http://www.facebook.com。
(6) 滴滴,中国最大的互联网在线打车服务平台,http://www.xiaojukeji.com。
(7) Uber,美国在线打车服务公司,在世界许多国家提供服务,http://www.uber.com。
(8) 宜信,中国最早开始网络贷款服务的公司,http://www.creditease.cn。
(9) Prosper,美国在线P2P借贷服务平台,http://www.prosper.com。
(10) Zillow,美国主要的在线房地产买卖业务平台,http://www.zillow.com。
(11) Airbnb,全球主要的P2P租房服务平台,http://www.airbnb.com。
(12) 猪八戒网,中国最大的在线自由职业平台,http://www.zbj.com。
(13) MTurk,亚马逊旗下自由职业平台,http://www.mturk.com。
(14) 订单贡献率10%,京东个性化推荐系统持续优化的奥秘,CSDN资讯。
(15) Aggregate knowledge raises $5M from Kleiner,on a roll,VentureBeat.
(16) Yelp,全球最大的用户评论网站,http://www.yelp.com。