准确率与召回率这个评价指标一般用于推荐系统,机器学习系统,数据挖掘等。是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
准确率:Precision,也叫精度,查准率:是检索出相关文档数与检索出的文档总数的比率,检索出来的条目(比如:文档、网页等)有多少是准确的;
召回率:Recall,查全率,是检索出的相关文档数和文档库中所有的相关文档数的比率,所有准确的条目有多少被检索出来了。
指标的定义:【两者取值在0和1之间,数值越接近1,查准率或查全率就越高。】
正确率 = 提取出的正确信息条数 / 提取出的信息条数
召回率 = 提取出的正确信息条数 / 样本中的信息条数
F值 = 正确率 * 召回率 * 2 / (正确率 + 召回率) (F 值即为正确率和召回率的调和平均值)
召回率大小直接影响准确率,直接影响机器学习模型、深度学习模型线上效果。
模型实时计算第一步是模型上线,将spark、TensorFlow训练模型通过实时加载,使用到线上实时CTR点击量预估。第二步是不断扩大线上召回集,增加新特征来提升点击量预估准确率。