3.3 怎样检索:设计有效率的检索策略
为了有效率地确定信息来源,你需要使用检索策略。本部分利用一个研究问题的例子解释怎样设计检索策略:“美国2001年的经济下滑在多大程度上是由股票市场下跌引起的?”
存在两种确定信息来源的通用方法。Ackermann和Hartman【33】(1998)将其称为浏览检索(1)与关键词检索。你可以认为它们分别强调人力资本(或思考)与物质资本(或蛮力)。没有一种方法对所有检索都优于另一种方法,设计检索策略的关键任务是对既定检索确定这两种方法的最优组合。
3.3.1 浏览检索
浏览检索意味着手动检查文档(如印刷的文献目录或在线主题目录)以获取有用信息或有用信息的引用。有效地浏览要求你深入并逻辑清晰地考虑一个学科的信息是如何组织的。美国经济学会(American Economic Association,AEA)利用层级系统来对经济学中各主题的信息进行分类,该分类的概览如表3.2所示。[3]这些总标题中【34】的每一个都可以进一步进行扩展,表3.3展示了“A—经济学总论和经济学教学”的分类。完整的分类系统可以在http://www.aeaweb.org/journal/elclasjn.html上找到。通过了解这个分类系统,你能够更容易地发现关于某个研究主题的有用信息。[4]
表3.2 AEA/JEL/EconLit分类系统
A—经济学总论和教学(General Economics and Teaching)
B—经济学思想史和方法论学派(Schools of Economic Thought and Methodology)
C—数理和数量方法(Mathematical and Quantitative Methods)
D—微观经济学(Microeconomics)
E—宏观经济学和货币经济学(Macroeconomics and Monetary Economics)
F—国际经济学(International Economics)
G—金融经济学(Financial Economics)
H—公共经济学(Public Economics)
I—卫生、教育和福利(Health, Education and Welfare)
J—劳动和人口经济学(Labour and Demographic Economics)
K—法律和经济学(Law and Economics)
L—产业组织(Industrial Organization)
M—企业管理和商业(Business Administration and Business)
N—经济史(Economic History)
O—经济发展、技术变迁和增长(Economic Development, Technological Change, and Growth)
P—经济系统(Economic Systems)
Q—农业和自然资源经济学(Agricultural and Natural Resource Economics)
R—城市、农村和区域经济学(Urban, Rural and Regional Economics)
Z—其他专题(Other Special Topics)
表3.3 AEA分类系统的扩展:A—经济学总论和经济学教学
在开始进行研究时有两本期刊需要特别关注。Journal of Economic Perspectives(JEP)是为满足经济学家的一般兴趣而创办的。因此,它发表的大部分文章都是经济学家对特定主题当前研究的总结。与此相似,Journal of Economic Literature(JEL)主要发表经济学中特定主题文献的综述性文章。美国经济学会同时出版这两种期刊,它们过去几年的目录都可以在美国经济学会的网站(http://www.aeaweb.org/jep/contents与http://www.aeaweb.org/journal/contents)上找到。[5]如果你在这些期刊的任何一本中发现了关于你研究主题的一篇文章,那么你已经占据了一定的优势,因为它几乎肯定找出并讨论了该文章发表日期之前的有关主要研究。当然,你仍然需要检索最近的研究。
更一般地讲,当你确定了一篇有用的期刊文章时,你还应该考虑把它引用的参考文献作为你评述的重要对象。【35】然而要记住的是,由于该文章作者与你研究的可能不是同一个问题,因此他的参考文献应该是你自己文献检索的补充而不是替代。总之,浏览检索比简单地进行关键词检索更可能给出有用的信息,但是你的结果依赖于你所浏览文献的作者或编辑的判断。
浏览检索的例子
假如你正在研究“美国2001年的经济下滑在多大程度上是由股票市场下跌引起的”这一问题。你了解到消费理论的生命周期模型表明家庭财富是消费支出的重要决定因素。浏览Journal of Economic Perspectives的目录时你发现了2000年春季刊中James Poterba名为“Stock Market Wealth and Consumption”的文章。该文章包含两页参考文献,可以追溯到Ando与Modigliani 1963年关于生命周期模型的经典论文。
3.3.2 关键词检索
确定信息来源的另一种方式是进行关键词检索。关键词检索使用互联网或专门数据库中的搜索引擎进行检索。后者包括文献目录数据库,比如EconLit(正式的说法是Economics Literature Index),它仅包括引文和摘要,以及全文数据库,如Dow Jones Interactive,它包含完整的文档。专门数据库的入口由一些商业供应商提供,如OCLC First-Search或者DIALOG。研究者可以通过所在大学的图书馆或计算机网络进入许多数据库。
即使你熟悉浏览检索,关键词检索还是比浏览检索能使你查阅到更多的文档。主要的网络搜索引擎宣称对网上全部的文档进行了索引,而电子数据库搜索引擎对数据库中的全部文档进行了索引。[6]例如,当前EconLit收录了超过600种经济学期刊、超过1 700种新书以及每年超过900篇新的学位论文——1969年以来几乎全部英文经济学出版物的完整记录。因此,在进行经济学研究时,EconLit应该是你开始检索的首选之一。
关键词检索的一个出色工具是社会科学引文索引(Social Science Citation Index, SSCI)。SSCI允许你在时间上后向与前向检索引文。在前面浏览检索的讨论中,我们指出,当你发现一种有用的【36】出版物,如DeLoach(2001)时,查阅它引用的更早研究是可行的。由于SSCI对它归类的每一篇期刊文章或每一本书籍,也对其引文进行了索引,所以SSCI能够以电子的方式帮助你完成这项工作。尽管以电子的方式完成检索能够比阅读研究文献目录快一些,但是SSCI的真正优势在于前向检索。也就是说,SSCI数据库也收录了所有在其参考文献列表中引用了DeLoach(2001)的出版物。因此,非常容易得到关于一个主题的主要研究的完整清单。
对新手研究者的提醒
不要把你的检索限制在全文数据库!
本科生有时会把文献检索仅仅看作完成研究项目道路上的一个障碍(这是不正确的——实际上,就像我们所努力说明的,发现本领域其他研究者完成的研究在完成你自己研究的过程中可能是一种重要帮助)。因此,这些学生可能会把自己的检索限制在全文数据库。归根结底,他们的理由是,即使你在文献目录数据库中发现了某些文献,它们仍然可能是难以获得或者不可获得的。这是一个错误的观点!文献检索的目标是发现一个关于该主题最重要的研究,而不仅仅是最容易获得的研究。换句话说,如果有一个没有在全文数据库中列出的重要研究你没有发现,那么你的研究就存在一个重大缺陷。[7]几乎所有大学的图书馆都订阅了主要的经济学期刊。这意味着这些期刊的文章在你的图书馆中能够以印刷版、胶片或影像的形式获取。即使你的图书馆没有订阅你需要的期刊,你的某位老师也可能订阅了,你可以毫不犹豫地去询问。把自己限制在全文数据库实际上也排除了把任何书籍作为资料来源。最后,很难想象存在通过馆际互借不能获得的文献。简而言之,不要把你的检索限制在全文数据库!它是谬误经济——最终你付出的代价将超过它的价值。
SSCI的另一个优势是它是跨学科的:它覆盖了社会科学的各个领域。这意味着你不太可能错过经济学以外其他领域关于你研究主题的研究,就像你仅检索EconLit时的情况一样。SSCI的劣势是它【37】十分昂贵,因此许多学院和大学都不订阅它。如果你所在的机构订阅了,你就应该利用它。
尽管你的学术文献检索应该集中于使用专门数据库发现文献,但网络搜索引擎也会很有帮助。最好的可用于学术用途的网络搜索引擎可能是谷歌(http://www.google.com)。对基于网络研究的批评是,大部分网络上的信息本质上不是学术性的。谷歌的一个优势是除了索引网页外还收录了大量其他类型的文件,包括Adobe(.pdf)文件、Word和WordPerfect文件、Excel和Lotus 123电子表格、PowerPoint演示文稿,等等。因此,研究者可以使用谷歌在研究者的个人网页上发现学术性的工作论文或数据集,即使它们还没有被发表。
关键词检索的主要劣势是在使用专门主题目录或网络搜索引擎时,会产生很多“被命中结果”,但仅有少量是有用的。假设使用词组“股票市场”(stock market)进行电子检索。基于你的数据库,你可能会得到数百甚至数千条记录。即使其中存在许多有关的记录,你也需要大量的时间和精力来分清良莠。考虑商业捕鱼者使用的拖网方法。拖网捞起了方圆几英里之内水中所有的东西。那么即使捕鱼者只想要鳕鱼,他也需要检查并扔掉捕获到的其他东西。
解决这一困境的措施是利用布尔(Booleam)检索与词组检索的组合进行更高级的关键词检索。布尔检索允许我们以最可能获取有用结果的方式聚焦检索。存在三种布尔运算符:AND、OR与NOT。
AND用于缩小检索范围。例如,对于关键词 Keynesian AND Post 的检索将会仅仅找到包括全部关键词的那些条目,如“Post Keynesian”。
OR用于扩大检索范围。对于关键词Monetarist OR Keynesian的检索将找到包含任何一个关键词的那些条目。
NOT意味着排除。它包含了排除包括NOT之后的关键词的所有条目。例如,对于关键词Keynesian NOT Post的检索将识别所有包含“Keynesian”且排除了那些包括“Post Keynesian”的条目。
你也可以使用嵌套的布尔逻辑调整你的检索。例如,对于关键词Monetarist OR(Keynesian NOT Post)的检索将找到包括“Monetarist”或者包括“Keynesian”的,但是排除了那些包含“Post Keynesian”的所有条目。
【38】词组检索搜寻引文中精确包含你设定词组的条目。例如,对于关键词“Post Keynesian”的检索将精确找到那些包含完全相同词组的条目,但是排除了分别包含两个关键词的条目。通配符可以通过截取检索词组使你的检索更有效率。如果搜索引擎的通配符是*,对于关键词Keynes*的检索将找到那些包含“Keynes”或“Keynesian”或者“Keynesians”的条目。与此类似,对于关键词wom*n的检索将发现包含“woman”或“women”的所有条目。
3.3.3 一种基本的检索策略
Ackerman和Hartman(1998)提出了一种基本的检索策略,如表3.4所示(稍有修改)。尽管该表给了我们这是一个直线过程的印象,但实践中还存在大量的不确定性。首先,在过程的开始阶段研究者可能无法准确掌握检索什么。在研究者面临不熟悉的主题时尤其如此。其次,该过程是不断反复的。你从不会通过单独一次的检索就发现所有的东西!相反,你需要使用一个数据库尝试一个初始关键词的集合。一旦你发现一些好的信息来源,就阅读它们。当你对文献更熟悉以后,关于关键词的其他想法就会在心中产生,然后你就可以利用【39】它们继续检索。如果一个数据库不成功,试试另外一个。如果一个学科没有发现足够的结果,试试另一个领域。关键词检索是一种艺术,某些研究者比其他人更擅长这个方面。幸运的是,每个人都可以在实践中变得更好。
表3.4 一种基本的检索策略
1. 从陈述你的研究主题或问题起步;
2. 找出与你的主题相关的重要概念;
3. 采用头脑风暴来创建描述这些概念的关键词列表;
4. 确定这些关键词的所有同义词;
5. 选择一个学科,即确定哪一个学科或哪些学科可能存在关于你研究主题的文献,例如经济学、法学、公共政策、商业、社会学、教育;
6. 确定使用哪种检索格式,例如布尔运算、通配符;
7. 选择一个适合检索给定主题的数据库,例如EconLit;
8. 阅读数据库的检索指南;
9. 使用合适的语法(syntax)建立检索表达式;
10. 查看结果;
11. 如果有必要,修改检索(返回第2步);
12. 使用另一个数据库尝试同样的检索(返回第6步)。
3.3.4 关键词检索的例子
下面我们采取表3.4列出的检索策略对我们研究主题的例子进行关键词检索:
1. 回忆一下该研究主题是“美国2001年的经济下滑在多大程度上是由股票市场下跌引起的(the extent to which the 2001 economic slowdown was caused by a decline in the stock market)”。
2. 研究主题表明了初始的重要概念。它们包括stock market decline与economic slowdown。
3. 关于这两个概念间可能联系的简单头脑风暴给出了其他的检索关键词:household wealth、consumer spending与life-cycle model。还应该注意的是,在选择关键词时,你可以在Journal of Economic Literature主题分类中选择一个主题。在这种情况下,我们选择G100“广义金融市场”或者E200“宏观经济学:消费、储蓄、生产、就业、投资、总论”。
4. (stock market)decline的同义词是crash或correction或者bear market。(economic)slowdown的同义词是recession。wealth的同义词是savings或saving。consumer spending的同义词是consumer expenditure或consumption。
5. 研究主题表明经济与商业这两个领域的文献可能是有用的。
6. 对于多个词汇的表达式,我们需要使用词组搜索,例如,“consumer spending”。对于同义词我们需要使用布尔运算符,例如,“consumer spending” OR “consumer expenditure” OR “consumption”。对于它们之间的关系我们需要使用布尔运算符AND,例如,“consumption AND wealth”。
7. 当进行经济学检索时,好的起始数据库是EconLit。对于其他领域,下面的内容可能是有帮助的:
• Expanded Academic ASAP——商业学术期刊;
• Wilson Business Abstracts——商业学术期刊;
• Business & Company & Resource Center——公司层面的商业信息;
• ERIC——教育;
• PAIS——公共事务与国际研究;
• Dow Jones Interactive——学术文献中当前不存在的主题,也包括商业学术期刊;
• SSCI——任何社会科学。
必须注意,检索结果的用户界面和格式可能因数据库入口提供【40】商的不同而不同。
8. EconLit的检索指南可以在http://www.econlit.org/econlit/hints.html上找到。[8]
9. 使用表达式“consumption AND wealth”进行初始关键词搜索。
10. 这一搜索命中1 422条记录,这太多了以至于不能深入阅读。
11. 使用表达式“consumption AND stock market”改进的检索共命中97条记录,包括Shirvani和Wilbratte(2000)的重要文章,“Does Consumption Respond More Strongly to Stock Market Declines than to Increases?”接下来使用表达式“consumer spending(OR “consumption”)AND recession”的检索共命中78条记录,包括另一篇高质量文章:Blanchard(1993)的“Consumption and the Recession of 1990-1991”。使用表达式“stock market AND recession”的另一个检索共命中13条记录,其中有3条看上去是有用的。
12. 我们再试着检索其他数据库:Expanded Academic ASAP。使用表达式“consumer spending(OR “consumption”)AND recession”的检索共命中22条记录,其中许多都是我们感兴趣的。其中之一是我们前面发现的Blanchard(1993)的研究。
你应该对每一个检索的数据库都试着采用所有得到好结果(即命中记录不太多,其中许多是有用的)的检索表达式进行检索。有时,你可能会发现相同的来源,就像Blanchard(1993)。这是你的有效检索接近结束的信号。注意,我们的关键词检索没有发现前面通过浏览发现的Poterba(2000)的论文。这就是两种类型的检索都有必要的原因。完成浏览检索和关键词检索并查阅找到研究所引用的文献后,我们就可以得出结论:我们发现了到目前为止关于我们的研究问题已发表的主要研究。