- 选题背景和意义:
随着社会的发展和人们生活水平的提高,人们观看视频的方式也由传统的电视、电影转换到电脑端的视频软件、手机端的APP等,视频内容也变得更加多样化、冗杂化。对于网络平台而言,信息过载问题,即如何在众多繁杂的视频资源中找到用户想看的视频变得尤为重要。早期,国内外许多知名网站如雅虎、新浪都采用分类目录的方法解决信息过载问题,但随着资源数量急剧增多,用户越来越最求个性化,简便化的消费体验,信息过载问题还是无法被有效解决。然后出现了搜索引擎技术,用户主动输入关键词,搜索想要的内容,但仍需用户对搜索结果进行筛选,依旧未解决用户的痛点。于是,个性化推荐系统便应运而生,它能智能地识别匹配用户特征,预测用户的喜好,推荐给用户感兴趣的内容,有效地解决信息过载问题。
哔哩哔哩作为中国最大的新型弹幕视频网站,2017年中国在线视频用户数逼近 5.8 亿人,手机移动在线视频 APP 用户数也超过 5 亿人,其视频内容已从二次元拓展到电影、电视剧、自制视频、短视频等多个方面,用户群体也呈现出多样化、宽泛化的发展趋势。性能优良的个性化视频推荐系统能够帮助哔哩哔哩整合各类视频资源,动态的追踪用户偏好,智能推荐视频内容,提高用户体验和留存率。
- 课题关键问题及难点:
1、 不同于其他主流视频网站,哔哩哔哩的视频有转发数、投币数、弹幕数等内容属性,这便需要在推荐系统召回、排序的过程中,设立新的召回策略,重新分配权重。
2、 哔哩哔哩的视频类型冗杂,时长差别大,小到几秒,达到几个小时的视频都有,会出现数据稀缺性、冷启动问题,传统的视频推荐算法无法满足哔哩哔哩特殊的商业模式,这需要引入神经网络算法,深度挖掘用户信息特征、视频信息特征和用户与视频之间的交互关系特征,提高推荐质量。
3、 随着哔哩哔哩的快速发展,用户数量不仅在急剧增加,用户的偏好也在动态变化,推荐系统需要设计反馈策略,不断自我学习,完善和优化用户画像。
- 文献综述(或调研报告):
1、国外研究内容
国外互联网发展较早,再加上许多大型的互联网公司,所以国外学者对推荐系统的研究较早,在1992年Xerox Palo Alto 研究中心成功开发出系统 Tapestry[1],该文率先提出了“协同过滤”概念,该系统可以采集全部用户的反馈数据,帮助用户过滤垃圾邮件。1997年Resnick 等人[2]首先提出“推荐系统”的概念,并正式对其进行了定义。在此之后,国外学者们开始研究如何改进算法来提高计算效率以及推荐系统的实际应用,许多公司也开始将推荐系统引入到自身领域,并取得了显著的成效,如亚马逊的营业额中,有20%-30%得益于推荐系统[3];2001年,Google实现了AdWards盈利模式,即根据搜索引擎技术来推送广告;2009年,著名互联网零售商Overstock运用个性化广告推荐方案投放广告,并取得了不错的效果[4]。近几年,学者对个性化推荐算法的研究也取得了许多进展,Bhartt等人[5]提出了基于主题序列的推荐模型。Y.Cai等人[6]使用聚类算法建立了用户项目模型,以通过预测用户偏好来实现个性化推荐。Cui等人[7]通过将深度信念网络(DBN)与协作过滤算法相结合来构建视频推荐系统,从而学习到了用户的深度特征。
2、国内研究内容
国内研究起步较晚,曾春等人[8]对个性化服务技术进行了综述,同时详细探讨了实现个性化服务的一些核心技术;爱林等人[9]提出了一种基于物品评分预测的协同过滤推荐算法,弥补传统相似性度量方法的不足。许海玲等人[10]对互联网推荐系统做了比较研究,并对未来可能研究的热点进行了展望。为了克服单一推荐技术的缺点,许多研究者提出了将多种推荐技术相结合方式,例如,曹毅等人[11]分别利用内容过滤和协同过滤算法得出的预测推荐结果,进行加权求和,形成最终的推荐。在商业运用方面,2009年,北京百分点信息科技公司成立,是国内首支推荐系统科研团队;2011年,李彦宏在百度世界大会上提出将推荐引擎列为互联网重要战略规划以及发展方向。2012年,张一鸣创建了基于数据挖掘的推荐引擎为核心技术的产品--《今日头条》。如今,个性化推荐系统已经广泛应用于各类咨询网站、视频平台及电商平台等,这些推荐系统的应用改变了许多企业的商业模式,带了巨大的变革。
综上所述,国内外对个性化推荐系统的研究越来越成熟,人工智能方面技术的引入,以及各种推荐算法的创新也能有效地提高推荐效果,但在不同的领域中还是存在数据稀疏性、冷启动等问题,当前哔哩哔哩的推荐系统依旧采用传统的推荐算法,没有自学习的机制,推荐效果不佳。
