第五节 搜索网上信息资源的方法与技巧
一、关键词的选择
关键词就是用户输入搜索框中的文字,也就是用户命令搜索引擎寻找的东西。用户可以采用搜索引擎查找任何内容,所以关键词的内容可以是人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文……关键词可以是任何中文、英文、数字,或中文、英文、数字的混合体。例如,可以搜索“大话西游”“windows”“911”“F-1赛车”。关键词可以只有1个,也可以输入2个、3个、4个……甚至可以输入一句话。例如,可以搜索“读书”“美女”“MP3下载”“游戏攻略大全”“蓦然回首,那人却在灯火阑珊处”。搜索技巧最基本同时也最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循。
1.表述准确
查询词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确情况是脑袋里想着一回事,搜索框里输入的是另一回事。例如,要查找2011年国内十大新闻,查询词可以是“2011年国内十大新闻”;但如果把查询词换成“2011年国内十大事件”,搜索结果就没有能满足需求的了。另外,典型的表述不被确定的情况是查询词中包含错别字。例如,要查找杨幂的写真图片,用“杨幂写真”,当然是没什么问题,但如果写错了字,变成“杨密写真”,搜索结果就差得远了。
2.查询词的主题关联与简练
目前的搜索引擎并不能很好地处理自然语言,因此在提交搜索请求时,最好把自己的想法提炼成简单的,而且与希望找到的信息内容主题关联的查询词。例如一位三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”,这个查询词很完整地体现了搜索者的搜索意图,但效果并不好。绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉“小学三年级”的信息;“关于”也是一个与名人名言本身没有关系的助词,多一个这样的助词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。因此,最好的查询词应该是“时间名言”。
3.根据网页特征选择查询词
很多类型的网页都有某种相似的特征:例如小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而界面上通常有“目录”二字,单击界面上的链接,即可进入具体的章节页,章节页的标题是小说章节名称;软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词;等等。经常搜索、总结各类网页的特征,并将这些特征应用于查询词的选择中,就会使得搜索变得准确而高效。例如,找明星的个人资料页。一般来说,明星资料页的标题通常是明星的名字,而在界面上会有“姓名”“身高”等词语出现。比如找宋丹丹的个人资料,就可以用“宋丹丹姓名身高”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名身高intitle宋丹丹”(intitle表示后接的词限制在网页标题范围内)。这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是用户必须了解这种共性(或者通过试验性搜索预先发现共性)。
二、基本检索语法
专业的搜索引擎一般都会实现一个搜索语法,基本的搜索语法有以下逻辑运算符。
“与(+、空格)”:查询时必须同时出现在搜索结果中。
“或(OR)”:搜索结果可以包括运算符两边的任意一个查询词。
“非(-)”:要求搜索结果中不合特定查询词。如果用户发现检索结果中有一类网页是其不希望看见的,而且这些网页都包含特定的关键词,那么用减号语法就可以去除所有这些含有特定关键词的网页。例如,搜索“康熙王朝”,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页,那么就可以通过输入“康熙王朝-电视剧”来进行搜索。注意:前一个关键词和减号之间必须有空格,否则,减号会被当成连字符处理而失去减号语法的功能。减号和后一个关键词之间有无空格均可。
除了与逻辑运算相关的搜索语法,还有以下几种常用的搜索语法。
1.把搜索范围限定在网页标题intitle
网页标题通常是对网页内容提纲挈领式的归纳,把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式是把查询内容中特别关键的部分用“in-title:”修饰。例如,找赵本山的小品,就可以这样查询:小品intitle:赵本山。注意:“intitle”和后面的关键词之间不要有空格。
2.把搜索范围限定在特定站点中
如果用户知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中心提高查询效率。使用的方式是在查询内容的后面加上“site:站点域名”。但要注意:“site:”后面跟的站点域名不要有“http://”;“site:”和站点名之间不要有空格。
3.把搜索范围限定在URL链接或inurl链接
网页中的某些信息常常具有某种有价值的链接含义,因此,如果对搜索结果的URL做某种限定,就可以获得良好的效果。实现的方式是用“inurl:”,后跟需要在URL中出现的关键词。注意:“inurl:”和后面所跟的关键词之间不要有空格。
4.精确匹配——双引号和书名号
如果输入的查询词很长,搜索引擎在经过分析后,给出搜索结果中的查询词可能是拆分的。如果用户对这种情况不满意,可以尝试让搜索引擎不拆分查询词。给查询词加上双引号,就可以达到这种效果。
例如,搜索上海科技大学,如果不加双引号,搜索结果被拆分,只要包含“上海”“科技”“科技大学”等字眼的信息都会显示到结果界面,很杂很乱,检索效果不是很好,但加上双引号后,即搜索“上海科技大学”,获得的结果就全是符合要求的了。
三、一些特殊的搜索功能
随着新技术的不断推出,各搜索引擎提供了各种特殊搜索功能以方便搜索者查询信息。下面介绍一些常见的特殊搜索功能。
1.网页快照
快照是直接从搜索引擎数据库缓存中调出的该网页的存档文件,以方便用户在预览网页内容后决定是否访问该网站,或是在对应网页发生变动时查看原始网页。通常缓存中保存的是网页的文字部分,图像等多媒体元素需要实时从对应的网站上下载。这种快照非常实用,如果原地址打开很慢,就可直接查看“快照”内容。因为“快照”服务器运行速度很快。经搜索引擎处理后,搜索项均用不同颜色标明,并通过标题信息说明其存档时间和日期,提醒用户这只是存档资料。因此,如果打开的网页信息量巨大,一时找不到关键词所在位置,则可以通过快照迅速找到关键词。同时,如果原链接已经失效或者因为网络的原因暂时链接不通,也可以通过“快照”查看该网页的信息,“快照”内容不是该网页的最新界面。多次检索时最好使用一个以上的搜索引擎,直到找到完美的搜索结果为止。不同的搜索引擎的索引数据库具有低交叉重叠性,如果我们不使用一个以上搜索引擎进行搜索,将会错过很多有用的网络资源。因此,要想得到更好的搜索结果,需要养成使用多个搜索引擎进行搜索的习惯。另外,还可以尝试一下元搜索引擎,利用它可以多次输入检索式,同时输出多个搜索引擎的检索结果,从而大大提高检索的查全率。
2.使用好搜索的辅助工具
检索不一定每次都要从搜索引擎入手,可以利用平时积累的有用的网址,直接进入相关的站点。建议大家平时注意收集常用的网址或者用浏览器的“书签”功能,将经常访问的网站加入“收藏夹”进行保存,再次使用时,直接单击便可进入,省去大量输入网址和利用搜索引擎的时间。另外,还可以利用网上书签。许多网站都提供已整理好的书签,有了它就不必自己去找了;有些网站甚至提供存放书签的地方,这样就不用担心系统将书签弄丢了。将网站的内容加以收藏或保存,既可以节省时间和费用,也省去了日后搜索的麻烦,还可以避免有价值信息的丢失。
3.有意识地培养搜索的好习惯
搜索技巧与其他技术不一样,只有通过不断的练习和总结才能逐渐熟练,并形成自己的一套有效的搜索习惯,这将有助于更快地完成搜索。首先要养成一个利用搜索引擎的好习惯,在日常生活中遇到一些不清楚、不明白的事,都利用搜索引擎好好地搜索,一方面可以增长知识,另一方面也可以在实践中学到更多搜索引擎的知识,自己的搜索技巧也会不断提高。另外,除了要在不断的搜索实践中摸索经验之外,向搜索高手学习绝对是快速提高搜索技巧的捷径,可以通过订阅搜索杂志、加入搜索论坛、向高手请教等多种方式,让自己不断向搜索高手这个目标迈进。