以上论证惯常环境界定时,阐述了利用位置大数据识别惯常环境的主要规则。无论在理论和技术上如何清晰界定惯常环境,在具体执行的过程中众多受访者很难准确理解这一概念,更难形成准确的空间限定。比如我国的10公里要求和其他国家40公里、50公里或者80公里的要求,那去往11公里、41公里、51公里或81公里以外的地方旅游,游客就一定能准确判断出来自己已经离开了自己的惯常环境吗?何况定义中所述是直线距离,道路交通状况差异很大,有的居民到山的另一侧旅行,直线距离不到10公里,实际翻山越岭就到了数十公里开外,可能旅行者自己大概率认为自己是在旅游了。即便如西班牙和英国以行政区划作为惯常环境,也不是每位居民能准确了解东南西北各个方位的行政边界在哪里。当然,惯常环境的规则无论怎么定义都存在漏洞,都有理解和执行的障碍,尽可能减少到最低而不是完全消除才是我们追求的目标。笔者带领课题组研究了本章第一节关于惯常环境的大数据识别方法,在此基础上深化游客统计监测的相关算法,利用承接科技创新2030重大项目(2021ZD0111400)课题三的契机,对相关规则和算法进一步调优和系统化处理,结合2019年开展的短信推送调查(该项工作2018年1月开始开展),得到2019年各省域国内游客接待人数情况如表1-5所示。需要说明的是,理论上应该分别对每个省域接待游客通过动机调查剔除非游客比例,由于问卷回收仅千分之三左右,在保证足够多有效问卷的情况下,需要推送的短信极其庞大,人财物成本较难承受,表1-5中各省域用全国平均旅游动机确认系数(59.88%)扣除非游客。
表1-5 基于位置大数据的2019年省域旅游接待人数情况
通常,短信调查得到的旅游动机确认系数比较稳定,受疫情影响在符合离开惯常环境6小时以上(不包括通勤等)的旅行者当中具有旅游动机的游客变少,2022年为43.35%,据此生成的2022年省域国内游客接待人数情况见表1-6。需要指出的是,无论表1-5还是表1-6,其中的数值并不是官方统计数据,只是研究成果,仅供参考。一方面,表中国内游客接待人数汇总较相应年份全国出游口径的旅游人数多,有口径的原因,也有其他方面的难以探明的原因。全国国内游客调查中,异地游占比接近五成,过夜游占比接近六成,与各地的游客拦访情况存在较大差异,其原因恐怕是电话调查中本地有可能存在较为明显的漏统。另一方面,表中数值与各省(区、市)统计结果存在较大差异,并不是希望用表中数据否定各地的旅游统计工作。方法、规则、执行时间等都存在天壤之别,数值不同是正常现象。相较各地自行统计调查,表中数据所用数据源相同、计算方法相同、时间跨度相同(各省域自行调查时间自主确定,差异较大),数值距离真实情况可能存在一定差距,但横向可比性肯定更高,而且每个省域的客流流向哪里、每个省域的游客来自哪里都更加清晰,有其独特的参考价值。
表1-6 基于位置大数据的2022年省域旅游接待人数情况
表1-6(续) 基于位置大数据的2022年省域旅游接待人数情况