THERE IS NO END TO LEARNING

搜索引擎的3个核心问题

1、用户真正的需求是什么?(用户需求角度出发)

搜索引擎用户输入的查询请求一般情况下都非常简短,虽然用户查询的平均长度是呈上升趋势,但整体来说搜索词还是比较简短的。

如何从如此段的查询请求里获知隐藏其后的真实用户需求?这点从《搜索引擎发展史》可以看出来搜索引擎一直在琢磨用户的需求。这是搜索引擎首先要解决的重中之重,如果不能获取用户的真正搜索意图,搜索的准确性无从谈起,即使后续内容匹配算法再精准也无济于事。

从另外一个角度看,即使是同一个查询词,不同用户的搜索目的的不同,如何识别这种差异?如果更进一步,即使是同一个用户发出的同一个查询词,也可能因为用户所处环境不同,其目的存在的差异,又如何识别?所有这些都是搜索引擎需要解决的核心问题,即用户在此时此刻发出某个查询,它的真实搜索引擎意图到底是什么?

 

2、哪些信息是和用户需求真正相关的?(数据角度考虑)

搜索引擎的本质上是一个匹配的过程,即从海量数据里面找到能够匹配用户需求的内容。所以,在明确用户真实意图这个前提条件做到后,如何找到能够满足用户需求的信息则成为关键因素。

判断内容和用户查询关键词的相关性,一直是信息检索领域的核心研究课题,不断提出的信息检索模型视图解决这个问题。从关键词匹配到让机器真正理解信息所代表的含义是这个问题的重中之重,尽管包括人工智能在内的很多相关研究领域对此有所进展,用户为中心一代正在逐渐融入如今的搜索引擎。

 

3、哪些信息是用户可以信赖的?(数据角度考虑)

搜索本质上是找到能够满足用户需求的信息,尽管相关性是衡量信息是否满足用户需求的重中之重,但并非全部。信息是否值得信赖是另外一个重要的衡量标准。

搜索引擎需要处理的信息对象是互联网上任意用户发布的内容,但是内容发布者所发布内容是否可信并无明确判断标准。这其间存在恶意的信息发布者故意歪曲事实的情况,也有信息发布者无心的错误。在同一个查询的搜索结果内,完全可能存在相互矛盾的搜索答案,此时信息可信性成为突出问题。

从某种角度看,链接分析之所以能够改善搜索结果,可以认为是对信息的可信作出的判断。网页重要性作为是否可信赖的一个判断标准,返回重要网页即是返回可信赖网页。

点赞
  1. 得道SEO说道:

    要考虑到用户的体验,内容的质量,还要针对搜索引擎是否喜欢

  2. beyondme37说道:

    看的好朦胧啊。。 :arrow: