旅游地网络关注度与客流量互动关系
上QQ阅读APP看书,第一时间看更新

第四节 样本选择和数据来源

一 样本选择

依据案例的典型性,数据的可获取性,在研究游客网络检索特征及旅游信息需求特征时,本书选取张家界为样本。在研究旅游地网络关注度时空分布特征时,本书选取张家界、湖南“红三角”、喀纳斯、如家快捷酒店为样本。在研究网络关注度与客流量相互关系时,选取九寨沟、张家界为样本。在分析事件对旅游需求的影响时,以“爸爸去哪儿”和“天价虾”为样本。在分析居民旅游需求时以北京和湖南为样本。在分析旅游流网络结构特征时,以湖南省各市(州)、全国30个城市为样本。

二 数据来源

本书的研究所需数据资料庞大,大致有以下两个数据系列。

(一)网络关注度数据

包括张家界、湖南“红三角”、九寨沟、喀纳斯、如家快捷酒店各研究年份内逐日的网络关注度数据。同时,还包括湖南省各市(州)3A级及以上景区、全国213家5A级景区、30个典型城市3A级及以上景区,以及中国31个省(市、区)对“爸爸去哪儿”“天价虾”等事件逐日网络关注度数据,该数据主要是利用百度指数进行关键词检索获得。

(二)客流量数据

张家界旅游客流量数据涉及时间序列数据和空间地域分布数据,其中,时间序列数据主要来自张家界统计信息网;为获取客流量空间地域分布数据,本书作者于2016年10月赴张家界开展问卷调查,一共发放问卷1250份,有效问卷1224份,并对问卷进行统计,从而获得张家界景区客流量空间地域分布的数据。九寨沟客流量数据由九寨沟景区官方网站收集2016年每日进沟游客人数,需要说明的是2016年5月24日、6月18—19日、7月8日进沟游客数据缺失,在分析中予以剔除。

此外,还需要中国31个省(市、区)、湖南省各市(州)等地区生产总值、人口数量、空间距离、网络普及率等数据,数据来源于各省(市、区)或城市的统计年鉴、统计公报、百度地图等,具体的采集标准、采集方法在下文中会有具体的阐释。