1. 研究目的与意义
选题的理由或意义:
近年来,随着手机的广泛应用和电影业的迅速发展,越来越多人选择网络购买电影票。用户在手机上购买电影票后,通常都会在观影后发表自己对电影的评论,比如电影的情节、电影的特效、演员的表现等等。这些影评一般是以非结构化的文本形式发表在网络上,具有表达方式多样化、褒贬态度鲜明等特点。利用自然语言处理技术对评论信息进行情感倾向性分析,可以得出观众对某类型电影的关注点。对电影评论大数据进行情感分析具有很大的商业价值和社会意义,电影公司可以通过对评论进行情感分析,得到观众对某个类型电影的情感倾向,为新电影的设计改进提供参考。除此之外,还能为潜在的观众在观影选择方向提供一定参考。
最后,本次对电影的情感倾向研究对影视艺术教育有着重要意义,影视艺术教育是以电影等为教育媒介,以学生素质能力的提高为目的的教学活动。此次研究对电影评论的情感进行分析,得到了观众对不同类型电影的赞点,抱怨点,为影视艺术教育提供新方面,SVM模型和LDA模型又为其提供新方法。影视艺术教育不仅是艺术教育的重要分支,也是社会主义精神文明建设的重要方面。加强影视艺术教育是教育面向现代化、面向世界、面向未来的需要,是培养高素质复合型人才的需要。
2. 研究内容和预期目标
研究内容: 基于不同类型的电影评论数据(以喜剧片、动作片、科幻片为例)作为数据挖掘的数据源,并建立情感分类模型与主题分析模型进行综合分析研究。
拟解决的关键问题: 观众对不同类型电影的赞点,抱怨点;采用SVM模型对评论信息进行正负面情感的分类和好评属性的分析;对分类后的评论采用LDA模型进行主题提取
3. 国内外研究现状
国内外目前的研究所说的电影评论大多是研究性电影评论。它大而言之是文艺评论、小而言之是艺术评论的一种, 属于较为高级的审美活动。它有文艺评论和艺术评论的共性,更具有由鉴赏对象、使用媒介及观赏条件、过程、方式等的独特性而致的个性。
中国当代研究性电影评论的创作主体是各级电影评论学会,包括中国电影评论学会和省、市 级的电影评论学会。并没有专门针对观众在观影后影评的研究,更没有按照电影不同类别的划分,利用自然语言处理技术对评论信息进行情感倾向性分析,注重观众对某类型电影的具体关注点。此次研究对电影评论的情感进行分析,可以得到观众对不同类型电影的赞点,抱怨点,对于各种电影的改进方向有相应的参考价值。
采用SVM模型对评论信息进行正负面情感的分类和好评属性的分析。对分类后的评论采用LDA模型进行主题提取,可以得出人们对喜剧片、动作片和科幻片的关注点,这两个模型的综合利用于电影评论中也是首例。
4. 计划与进度安排
第八学期第一周至第二周:完成毕业设计的目录及大纲,整理数据
第三周至第五周:运行程序分析数据、得出结论,并整理撰写论文初稿
第六周至第八周:交给老师审查过后总结需整改的地方,并对论文进行修改
第九周至第十周:反复修改论文,完成二、三稿及外文文献翻译工作
5. 参考文献
[1] Duyu Tang,Bing Qin,Ting Liu. Deep learning for sentiment analysis: successful approaches and future challenges[J]. WIREs Data Mining Knowl Discov . 2015 (6)
[2] ZHANG L,LIU B.Identifying noun product features that imply opinions. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics . 2011
[3] KajiN,Kitsuregawa M.Building lexicon for sentiment analysis from massive collection of HTML documents. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning . 2007
