旅游推荐系统;实现一个旅游推荐算法并做一个系统展示出来
- 本算法采用的是Foursquare个人签到数据。Foursquare个人签到数据集是一个公开的数据集,包含了Foursquare社交媒体平台上用户的签到记录。该数据集包含了来自全球的用户签到数据,包括签到的地点、时间、用户ID等信息。这些数据可以用于研究用户行为、地理位置分析、社交网络分析等领域。
- 主要有4个数据文件users.dat,venues.dat,ratings.dat,checkins.dat
本算法主要是分为三部分:群组划分、主题建模、地点推荐。群组划分采用的是K-Means聚类算法实现,地点主题建模采用LDA主题模型进行构建。地点推荐采用了前两步的数据进行实现。
TCM模型基于三种考虑:
- 不同的旅游群组喜欢不同的景点,有的喜欢自然景观类的,有人喜欢现象级的。TCM模型将景点类型作为潜在主题。
- 群组选择旅游景点还受成本因素的影响,对于某个群组,即便是某个景点风评很好,景观也很美丽,但是消费却非常高,这个群组也未必会选择该景点作为访问。
- 群组是否选择旅游景点同样受评分的影响,评分是最直接、直观的给用户带来感觉的影响因素,因此本模型还融入了评分因素的影响。
TCM:基于潜在主题及成本的推荐 |
---|
Input: User_id, Top-N,表3.7中的其他数据 |
Output: Top-N地点 |
1. 根据输入获取用户群组以及群组的历史访问记录 |
2. 获取群组访问的主题信息以及频次 |
3. 获取对应主题下的地点数 |
4. 获取用户对这些地点的成本数据 |
5. 获取群组对这些地点的评分数据 |
6. 综合上述数据获取每个地点对应的综合结果 |
7. 根据综合结果排序,获取Top-N个地点信息 |