推荐序二
最近的十年中,我一直在eBay从事数据相关的项目,领导了包括零售科学和搜索科学在内的研发团队。如今eBay在全球已有1亿多注册用户,每天都有数以百万的家具、收藏品、电脑、车辆在eBay上被刊登、贩售、卖出,每年的营业额高达数千亿美元。
但是我们非常清楚,对于eBay而言,更为珍贵的财富是网站上每时每刻都会产生的海量数据。通过对这些数据的分析,我们可以指导卖家进行更好的搜索引擎优化、制定更好的价格、控制合理的库存;还可以帮助买家找到更合适自己的商品和更优质的服务。当然,大数据的分析还能帮助eBay有效地防范作弊和欺诈,保证整个平台和渠道的健康发展。
正是意识到数据的关键性,eBay非常重视挖掘和利用它们的潜在价值。本书作者曾经在eBay的研究院和搜索科学部门工作,专门从事机器学习的研究和应用。他协助eBay构建了数项核心算法及其相关产品,包括基于机器学习的搜索排序、高质量用户评价的发现和摘要、相似和相关商品推荐栏位等。在此过程中,他和各个技术同仁、产品经理、业务部门紧密合作,而这本著作就融入了作者在这些实战项目中所积累的丰富经验。所以,本书最大的闪光点在于,它的内容不仅仅局限于技术本身,而是考虑到了在不同的应用场景下,这些技术应该怎样合理运用。例如,对于基于学习的搜索排序,通常要考虑哪些因素以及怎样的学习模型?对于智能推荐的栏位而言,相似和相关商品又有怎样的区别?分别都应该使用怎样的推荐模型?
除了与业务应用紧密结合,此书还具有覆盖面广和通俗易懂的特点。全书涉及的主题包括大数据的获取、存取、处理、检索、挖掘和评估中的多数主流技术。同时,作者从自己独特的视角出发,对深奥的技术进行了深入浅出的阐述,大幅降低了大数据知识理解的难度。因此,本书也非常适合大数据产品设计者、产品经理或者架构师进行阅读。我相信,对于希望利用大数据解决业务痛点的读者而言,此书是不可或缺的良师益友。
eBay全球高级总监 逄伟
2016年3月