One - One Code All

Blog Content

准确率与召回率

自然语言处理 机器学习 数据挖掘 推荐系统   2012-05-12 20:16:17

准确率与召回率这个评价指标一般用于推荐系统,机器学习系统,数据挖掘等。是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
准确率:Precision,也叫精度,查准率:是检索出相关文档数与检索出的文档总数的比率,检索出来的条目(比如:文档、网页等)有多少是准确的;

召回率:Recall,查全率,是检索出的相关文档数和文档库中所有的相关文档数的比率,所有准确的条目有多少被检索出来了。

指标的定义:【两者取值在0和1之间,数值越接近1,查准率或查全率就越高。】

正确率 = 提取出的正确信息条数 /  提取出的信息条数     
召回率 = 提取出的正确信息条数 /  样本中的信息条数  
 
F值  = 正确率 * 召回率 * 2 / (正确率 + 召回率) (F 值即为正确率和召回率的调和平均值)


召回率大小直接影响准确率,直接影响机器学习模型、深度学习模型线上效果。
模型实时计算第一步是模型上线,将spark、TensorFlow训练模型通过实时加载,使用到线上实时CTR点击量预估。第二步是不断扩大线上召回集,增加新特征来提升点击量预估准确率。


上一篇:php计算两个时间相差的天数、小时数、分钟数、秒数
下一篇:php获取数组所有的key,数组的key组成数组

The minute you think of giving up, think of the reason why you held on so long.