Contents
  1. 1. 任务描述
  2. 2. 评价指标
  3. 3. 分析

任务描述

• 这是一个经典的评分预测任务。 要求在训练数据上学习得到评分模型,然后预测Test 数据上给定用户对给定电影的评分。 系统评价由预测评分与实际评分的误差决定。

• 除用户评分矩阵外,另有用户标记(tag)和电影元信息
http://gucasir.org/SC/Proj/MovieRecTask.tbz

解压命令: tar jxvf MovieRecTask.tbz

• 评分数据 (分为ra.train和ra.test两个文件)UserID::MovieID::Rating::Timestamp

– 任务需预测的是ra.test文件中的Rating数据

– 注意:不得使用 ra.test文件中的Rating进行训练!

• 标签数据 (tags.dat) UserID::MovieID::Tag::Timestamp

• 电影元信息数据 (movies.dat) MovieID::Title::Genres

• 数据描述详见README.html

评价指标

RMSE(Root Mean Squared Error),结果取四舍五入小数点后4位,精确到0.0001。

例如,参赛者的算法预测用户对某电影的预测评分是Y,而用户对此电影的实际评分是X,那么所得的RMSE=sqrt(sum(for all items(XY)^2)/n)

分析