搜索引擎技术与发展
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 搜索语法

专业的搜索引擎一般会实现一个搜索语法,基本的搜索语法有如下逻辑运算符。

● 与(+、空格):查询词必须出现在搜索结果中。

● 或(OR、|):搜索结果可以包括运算符两边的任意一个查询词。

● 非(-):要求搜索结果中不含特定查询词。如果搜索结果中有某类网页是您不希望看见的,并且这些网页都包含特定的关键词,那么用减号运算符就可以去除所有这些含有特定关键词的网页。

例如,如果搜“神雕侠侣”,那么希望是关于武侠小说方面的内容,但搜索结果中存在很多关于电视剧方面的网页。因此,可以这样查询:神雕侠侣-电视剧。

需要注意的是,前一个关键词和减号之间必须有空格,否则减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间有无空格均可。

除了与逻辑运算相关的搜索语法,还有以下几种。

● 把搜索范围限定在网页标题中——intitle。

网页标题通常是对网页内容提纲挈领式的归纳。把查询内容的范围限定在网页标题中,有时能获得良好的效果。使用这种方式,就是把查询内容中特别关键的部分用“intitle:”修饰。

例如,找小沈阳的小品,可以在浏览器的搜索框中输入“小品 intitle:小沈阳”。

需要注意的是,“intitle:”和后面的关键词之间没有空格。

● 把搜索范围限定在特定站点中——site。

有时候,如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,从而提高查询效率。使用这种方式,就是在查询内容的后面加上“site:站点域名”。

例如,要从网站CSDN中查找Java文档,就可以这样查询:java site:csdn.net。

需要注意的是,“site:”的后面是站点域名,没有“http://”;另外,“site:”和站点域名之间没有空格。

site 语法的另外一个用处是查看一个网站被搜索引擎收录的情况,如通过site:lietu.com可知Bing中收录了多少条“猎兔”搜索的信息,这些信息对搜索引擎优化SEO是有参考价值的。

● 把搜索范围限定在URL链接中——inurl。

网页URL中的某些信息,常常具有某种有价值的含义。因此,如果对搜索结果中的URL做某种限定,就可以获得良好的效果。实现的方式是用“inurl:”,后跟需要在URL中出现的关键词。

例如,找关于Word的使用技巧,可以使用:word inurl:jiqiao。

上面这个查询串中的“word”可以出现在网页中的任何位置,而“jiqiao”则必须出现在网页URL中。

需要注意的是,“inurl:”和后面的关键词之间没有空格。

● 精确匹配——双引号和书名号。

如果输入的查询词很长,搜索引擎在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果对这种情况不满意,那么可以尝试让搜索引擎不拆分查询词,为查询词加上双引号就可以达到这种效果。

例如,搜索“Elasticsearch大数据搜索引擎”,如果不加双引号,搜索结果就会被拆分,效果不是很好,但加上双引号之后,即“"Elasticsearch 大数据搜索引擎"”,获得的结果则全部符合要求。

书名号是中文搜索独有的一个特殊查询语法。在有些搜索引擎中,书名号会被忽略,而在百度、Google等中,中文书名号是可以被查询的。加上书名号的查询词有两层特殊功能:一是书名号会出现在搜索结果中;二是被书名号扩起来的内容不会被拆分。书名号在某些情况下特别有效果,如查名字很通俗和常用的那些电影或小说。例如,查电影《手机》,如果不加书名号,在很多情况下搜索结果是通信工具——手机,而加上书名号之后,搜索结果就都是关于电影方面的。

● 要求搜索结果中不含特定查询词。

如果发现搜索结果中有某类网页是不希望看见的,而且这些网页中包含特定的关键词,那么用减号运算符,就可以去除所有这些含有特定关键词的网页。