国产好看电影介绍几部 豆瓣排名前50电影( 四 )


流程:
1.规范训练数据(揭巴分词) 。
2.使用CountVectorizer类构建词袋模型 , 从数据中提取特征或属性(豆瓣Top250故事板) 。对于每个数据点 , 我们将有特征集(故事板的文档字矩阵DTM)和相应的类型(逻辑值(1 , 0)电影是否属于“故事板”) 。
3.该算法从训练数据中学习每个分类的不同模式 。学习后 , 我们得到一个训练有素的模型KNN 。
学习步骤:计算距离:给定测试对象 , 计算它与训练集中每个对象的距离 。寻找邻居:圈出最近的k个训练对象作为测试对象的最近邻居 。决策类别:根据K个邻居所属的主要类别对测试对象进行分类 。简单投票法:少数服从多数 , 邻域内那个类别的点最多归入这个类别 。
3.未来 , 测试数据样本的特征(一朵小红花的剧情梗概)将被送入模型KNN , 模型可以预测它是否属于“剧情” 。
4.制作混淆矩阵 , 评价分类模型 。过程:训练 , 从训练集中统计两种概率:每种标记的文档数量和每种中每个词项出现的频率 。分类:计算类标签的先验概率和条件概率 。
概念公式:
召回率=系统检索到的相关文件/系统所有相关文件的总数 。
准确性=系统检索到的相关文件/系统检索到的文件总数 。
F1=2PR/(P+R)
KNN算法预测的混淆矩阵如下所示:

图19
准确度=184/(184+59)=75.72%
召回率=184/(184+0)=100%
5结论
本文通过探索豆瓣电影Top250的指标 , 并对其榜单中的数据进行分析 , 得出以下结论 。
电影艺术是与时俱进的 , 大多数观影者在这个时候更容易接受类似时代的电影 。21世纪前10年的电影是最受好评的时期 。电影制作人可以选择翻拍10年前到20年前的电影 , 以口碑吸引观众 。观众也可以选择在休息期间看电影 。电影会随着时代的变化而变化 , 今天的观众会更容易接受现代电影艺术 。导演是一部电影质量的关键因素之一 , 一个好的导演才能拍出一部电影 。在选择导演时 , 电影制片人可以选择名单上有很多作品的导演 。观众可以选择观看克里斯托弗·诺兰和宫崎骏其人导演的电影 。导演对一部电影有很大的影响 。可以说 , 一个好的导演可以决定一部电影的成功与否 。3.好的电影一般来自于好的电影氛围 , 制作国家可以影响电影 。在受欢迎的电影中 , 美国电影占了近一半 。电影制作人可能会借鉴美国电影的流行趋势 , 观众可能会选择美国电影观看 。电影的主题、创作风格和视听语言 , 以及导演的地位和价值 , 也可以在相应电影中演员的表演和后期制作中看到 。4.电影类型是观众选择是否看这部电影的重要因素之一 。“剧”“爱”“喜剧”是观众的主流 , 可以看作是电影制作方口碑的保守选择 , 观众可以选择这些类型观看 。一部电影的类型很难用一两种类型来概括 。将会有越来越多的多流派电影同时出现 , 其结构和手法也会更加成熟 。单一电影类型的多元化将成为电影类型发展的必然趋势 。
【国产好看电影介绍几部 豆瓣排名前50电影】

推荐阅读