c语言sscanf函数的用法是什么
248
2022-11-22
搜索数据浅谈
作者介绍
@edan
前商业数据分析师,现 TMD 数据产品经理;
期望和数据小伙伴一起做些有意思的事情;
“数据人创作者联盟”成员。
在信息获取方式上,当用户在没有明确诉求场景下会逛信息流,当用户有明确诉求时则使用搜索做信息获取。今天我带大家简单了解一下搜索产品的基本知识,并介绍搜索场景的核心指标体系。
01 产品视角的搜索
02 系统逻辑视角的搜索
我们再从看看当用户输入一个关键词后,系统的处理逻辑。
这里更多从产品视角去理解搜索系统具体做了什么工作。
Query预处理:这一步更多是基于中文本身对用户输入的搜词作处理,保证文法的准确性。常规的操作基本有以下几种:
拼音转文字:比如在搜索框中输入 “yujunchanpinfangfalun” 时能理解出 “俞军产品方法论”,并给出搜索结果;自动纠错:比如当用户在搜索框中输入 “于军”,其实用户想搜的是 “俞军”;同义词转换:比如当用户输入 “首都机场”,可以理解为 “北京机场”。
意图理解:李善友老师在课程里讲过供需连模型。而搜索也是供需连模型里的连。在点评业务里,我们需要从意图的视角来理解用户的需求。举一个例子:
咖啡可以在饭店里作为饮料出售 - 美食类目;咖啡可以在 KTV,酒吧作为饮料出售 - KTV 和酒吧类目;咖啡可以是咖啡培训,在教培业务里是一个体验课;咖啡可以是咖啡豆采摘体验之旅,是酒旅的一个特色旅行项目。
所以一个 query(关键词请求)并不能代表一个用户的需求,我们必须结合用户社会特征、时间特征、地理特征来理解用户 query 背后的意图,进而针对不同搜索意图给出不同的供给来满足用户。
供给召回与结果排序:搜索系统基于意图理解的结果,去库里面找到对应匹配的供给内容。并基于匹配度作最终的排序。
类似大众点评核心提供本地生活信息,其供给类型会多种多样,比如上面例子中用户搜咖啡,即可能是到店里要喝咖啡的商户(到店商户),也可能是想外卖回家的商户(外卖商户),也可能是想看咖啡相关的评价内容(内容)。
所以系统先按照可能的意图,对每个意图下的内容做了高匹配度商户的圈定召回。最后在按匹配度顺序排出各类供给以及供给下具体内容的先后顺序做内容展示。
03 搜索指标体系如何设计
在指标层面核心会从三个角度来考量:
在核心维度上,除了基础的流量维度(用户类型,页面城市等);我们可以搜前/搜中/搜后页面上不同粒度视角来分析;也可以用系统视角的意图理解相关维度来分析。
以上是相对基础核心的搜索产品应该看的指标维度,当产品复杂度变高,迭代策略更精细的时候会有更多指标考核不同模块,比如我们可以思考一下,用什么指标可以衡量 suggest 页确实提高了用户的效率。
04 搜索数据产品建设
搜索产品最初的阶段,可以对标竞品做产品迭代,并基于核心指标搭建报表体系做监控。
但当搜索入口的流量做到一定规模的时候,业务会开始更多从用户视角,通过搜索关键词粒度的分析(query 分析)来发现问题。
比如业务发现最近 “室外餐厅” 搜索量比较大,但是搜索结果页的 ctr 比较低,排查发现是没有做近义词改写,需要将其里加到改写词表相关集合 “室外餐厅;户外餐厅;露天餐厅” 中。
除了通过运营干预手段,也可以通过产品层的整体迭代来帮助提高核心路径的转化率。这个过程我们可以简单抽象成两个步骤:发现问题,定位问题原因。
第一,发现问题。通过构建搜索关键词榜单可以帮助用户发现问题所在:
热词榜单:所选时间段的搜索体量排名靠前的搜索关键词。升势榜:搜索量环比前一时段增长快,且体量规模较大的搜索关键词。高曝低点榜:搜索 ctr 较低,且体量有一定规模的搜索关键词。少无结果榜:搜索召回结果小于一定阈值,且体量有一定规模的搜索关键词。业务类榜单:比如美食热搜榜,酒店热搜榜单。(这部分基于业务实际运营抓手来做构建)。
基本的分析模块有以下几个:
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~