金税工程的落实与推进是税收信息化的具体体现。在中央主导、地方密切配合下,从1994年3月底金税一期工程开始,实现了我国增值税计算机交叉稽核,到2001年7月1日金税二期工程建立了开票、认证、交叉稽核、协查四个增值税防伪税控发票子系统,2006年金税三期工程正式展开,并从2015年开始在全国范围内全面推行金税三期优化版系统。
1.金税三期工程的核心内容
金税三期工程所代表的信息化发展的历史阶段已由控制阶段上升到了集成和数据管理阶段,其建设思路遵循“利用信息技术手段,规范执法行为;优化纳税服务;完善体制建设;提高业务人员素质”的总体目标,构建起“一个平台,两级处理,三个覆盖,四个系统”。
(1)一个平台
一个平台指建立一个包含网络硬件和基础软件的统一的技术基础平台。主要任务是逐步建立覆盖国家税务总局,国、地税各级机关与相关政府部门信息共享的网络体系,统一网络硬件和基础软件技术平台建设,建立安全管理和运行维护体系,以保证税收工作在统一、安全、稳定的网络化平台支撑下平衡运行。其中,统一的标准是实现各信息系统互联互通、兼容运行,并顺利实现系统升级换代的基础。税收管理信息化建设的标准体系包括总体标准、基础设施标准、技术支撑标准、应用标准、数据标准、管理标准、安全标准等。安全保障体系,就是按照现代信息安全理论,遵循国家标准,采用目前国内外先进的信息安全技术,通过建设税务CA、加强密钥管理和权限管理以及采取防火墙过滤、入侵检测、系统加固、安全性分析等防护措施,建设涵盖税务系统网络、应用和管理等各个方面的统一、稳定、高效的信息安全保障体系。运行维护体系,就是通过建立以国家税务总局为核心、省级为基础,集中管理的运行维护体系,加强监控管理,及时解决运行中发生的各类问题,为用户提供方便、快捷的技术和业务支持。
(2)两级处理
两级处理指依托统一的技术基础平台,逐步实现税务系统的数据信息在国家税务总局和省税务局集中处理。主要任务是在“一个平台”的支撑下,结合各地实际情况,逐步建立国家税务总局、省税务局两级数据处理中心和两级数据处理机制,实现涉税电子数据在国家税务总局、省税务局两级的集中存储、集中处理和集中管理,使业务流程更加简化,机构趋于扁平化,管理和监控更加严密,纳税服务更加简便,系统维护更加便捷,系统运行更加安全,并使得数据的宏观分析与微观分析相结合、全局分析与局部透视相结合,全面提升数据利用的价值。
(3)三个覆盖
三个覆盖指应用内容逐步覆盖所有税种,覆盖税收工作重要环节,覆盖各级税务机关并与有关部门联网。主要任务是通过税收管理信息化建设,促进信息技术和管理方法在全国税务系统得到广泛应用,逐步实现税务管理信息系统对税务机关管理的所有税种以及税收工作运行的重要环节进行全面、有效的电子化监控,并实现与有关部门的联网,以保证税收工作便捷、规范、高效进行。
(4)四个系统
四个系统指通过业务的重组、优化和规范,逐步形成包括征收管理、纳税服务、管理决策和行政管理系统在内的四个信息管理应用系统。主要任务是建立以税收征管业务为主要处理对象的税收征管系统,以为纳税人服务为主要处理对象的纳税服务系统,面向各级税务机关税收经济分析、监控和预测的管理决策系统和以税务系统内部行政管理事务为处理对象的行政管理系统,以满足税务工作多层面、全方位的应用需求。
税收征管系统包括征收、管理、稽查、处罚、执行、救济等子系统,是税收管理信息化的核心应用系统。采用全国数据大集中的模式,通过一体化的规划设计,统一征管数据的标准和口径,实现全国征管软件的统一集中,支持全国统一执法,实现征管数据实时监控。
纳税服务系统包括网上税务局、纳税人关系管理和纳税服务渠道整合软件,通过大厅系统、呼叫中心、短信、网上税务局及自助终端等渠道,提供公众信息服务、纳税人交互服务和涉税办理服务。
管理决策系统包括查询统计、征管状况分析、报表管理、政策评估、纳税遵从风险管理、知识管理、绩效管理七个子系统,通过对大量业务数据的整合、加工和处理,利用数据管理及商务智能等技术,实现对管理决策的有效服务。
行政管理系统包括综合办公、财务管理、人事管理和纪检监察四个子系统,运用面向服务架构技术整合现有行政管理系统,实现行政管理工作流程电子化,实现部门之间、部门与上级机关之间信息互联互通。
2.金税三期工程的主要贡献
(1)统一国、地税征管应用系统版本,实现数据集中共享
金税三期工程首次实现国、地税软件版本统一,建立国家税务总局、省税务局两级数据处理中心,建立了以省税务局为主、国家税务总局为辅的数据处理机制,将原先分散于各种独立系统中的数据统一整合到一个平台当中,往期运行的CTAIS系统各模块各自独立,但金税三期系统优化版实现了数据之间的逻辑校验,这样的监控增强了数据的延续性和准确性,为深度利用税收数据完成了重要的前期准备,实现了从国家战略层面上税收数据的大集中。
(2)重视数据统一性,构建全局化、规范化的数据架构
我国国、地税系统生成及收集和处理的数据经过金税三期工程的改造,实现了数据的国家税务总局集中式存储,并进行集中式的分析和处理,在存储体系内部建立了基础的数据仓库式体系,虽不完善,但为后期的管理和决策提供了基础性工作。
(3)在税源精细化和专业化管理方面有了长足进步
一是加强了网络发票管理。第三方网络开票服务平台和企业自开票软件开放,保证提供多种接入方式。网络发票通过发票的实时开具、实时采集、实时查询,达到发票信息的数据化与发票闭环管理,为发票管理提供了一套全新的管理模式,做到由以票控税向信息管税转变。
二是加强了个人所得税精细化管理。第一次实现了在税务系统中建立面向自然人的税源管理体系,这与面向组织的核心征管系统相对应。以自然人有效身份证件号码作为唯一的纳税人识别号,并建立统一的税收管理档案,便于归集、汇总从多处取得的收入;标识重点纳税人、重点扣缴义务人、高收入者等并支持对其分类管理。建立健全自然人信息库,将基础信息、家庭信息、财产信息、收入信息等纳入数据库。
三是对房地产税收进行一体化管理。以“税源管理编号”保持不变为基础,在土地使用权的取得环节、房地产的开发建筑与销售以及后期的保有环节分别进行管理。其土地、房屋信息登记业务对应于三期需求的土地出(转)让信息采集、存量房销售信息采集、增量房销售信息采集流程。房地产开发商税收项目申报或纳税人在房产交易相关税收申报时,开发商报送房屋销售合同和《增量房销售信息表》,纳税人提供交易的房产合同或房产证(交易房产未录入系统的情况),系统采集相关报送信息后,由此产生“房源编号”,并同时实行契税的征管完善。
四是让绩效考核与税源管理挂钩。金税三期工程的绩效考核跟大部分业务挂钩,特别强化对征管主观性方面的考核,税源管理涉及的考核会在三期整体绩效考核中体现,包括税源管理、税务部门及税务人员的能级管理等,同时支持地方根据情况进行自行加载。
3.金税三期工程需改进的方面
总体而言,目前金税三期系统虽然在税收信息化方面具有里程碑的意义,但与税收大数据的要求尚有一段差距。具体表现为:
(1)从金税三期自身数据来源看,税务部门的税收征管、服务的数据信息来源单一,没有海量的纳税人信息作为支撑。税收征管、服务信息化建设没有实现全方位的外联,税收征管、服务系统还是一个独立的系统,没有接收和传递海量信息的对外开放接口。在大数据环境下的税收征管、服务信息系统必须具有开放的系统接口,才能实现大数据技术目标。
(2)从金税三期具备功能看,税收征管、服务信息化系统建设不适应大数据环境,还只进行税收征管、服务的低端业务处理。同时,税收征管、服务信息化系统由于是低端建设,信息整合、数据挖掘能力不足。
(3)从税务系统工作机制看,虽然在很多工作规划、部署安排上使用了大数据的概念,但是还缺乏大数据的实质,还没有真正树立大数据思维。从税收管理体制、税种设计、税收管理制度、信息化设计建设上,与大数据的要求还有很大差距。
2013年,党的十八届三中全会以后,税收治理的概念被提出,税收管理被提升到税收治理的层面。2013年在全国税务工作会议上,国家税务总局提出到2020年基本实现税收现代化的目标要求。2015年,国家税务总局下发了关于《“互联网+税务”行动计划》的通知,以四个部分全面部署该行动计划,重点突出五大板块和二十项行动计划。2016年,国家税务总局印发《国家税务局、地方税务局合作工作规范(3.0版)》,其中强调加强国家税务局、地方税务局之间合作,推进互联网办税、共建联合办税大厅等项目,从而减少纳税环节、方便纳税人网上办税、避免纳税人“两头跑”问题,为纳税人提供更加便利的纳税服务,增加纳税人的满意度。《推进税务稽查随机抽查实施方案》也提出国家税务局、地方税务局开展联合抽查的要求。国家税务局、地方税务局联合开展随机抽查机制,共同随机抽取税务稽查对象,共同制定税务稽查预案,共同进行税务稽查,共同解决问题、互通信息,能够加强税务稽查工作有效性和国、地税合作深度。
随着营改增全面实施,金税三期工程在全国各地分批分阶段全部正式上线运行,国家税务局与地方税务局之间统一核心征管应用系统版本,制定统一规范的业务操作和执法标准,实现了全国数据大集中,加强了国、地税合作及信息共享,促使税务机关更加及时全面地获取准确的信息。在国家税务总局的总体部署下,为实现我国税收管理的科学化、现代化、精细化和高效率,利用大数据和电子信息化技术构建“涉税信息管理系统”的工作,已经在全国国、地税系统有条不紊、深入扎实地展开。
1.税收大数据来源、结构及应用概况
目前,税收大数据的来源主要是税务机关在管理纳税人过程中自行取得的有关纳税人的涉税信息及少量通过第三方取得的信息数据。在涉税数据管理工作中,既需要拓展涉税数据来源,也应充分挖掘已有数据信息,盘活存量信息。对于征管服务中所需信息,尽可能地依靠纳税人报送信息或税收管理活动生成信息,并加以充分利用。应该将日常税收征管过程作为信息收集与应用的过程,通过信息的应用,提高税收征管的质量和效率,实现对税收征管全过程的监控。要立足已有数据,深入分析各行业海量信息,根据行业管理规律,逐步构建覆盖所有国民经济行业分类的评估模型和指标体系,预测经济与税收发展趋势,不断提升税源管理能力,更好检验涉税数据信息质量。
(1)税收征管方面的大数据应用概况
为适应税收现代化的需要,国家税务总局正在建设大数据云平台。目前,在全面集中与整合全国范围内各类业务数据基础上,提供了增值税发票查询分析、纳税人关系分析、票流分析、风险情报系统、用户画像五大功能。
①增值税发票查询分析:提供全国的增值税发票信息查询分析,包括纳税人信息查询、发票明细查询、一户式纳税人发票流向分析(商品和服务税收分类编码分析)、一户式纳税人发票流向分析(企业流分析)、一户式纳税人发票流向分析(票种分析)、一局式增值税发票开具情况统计、一局式商品和服务税收分类统计。
②纳税人关系分析:纳税人关系云图基于关联图谱算法,依托税收大数据及其他外部数据,依据其投资关系、关联交易关系、涉税关系等建立各类关联关系,展现全国视角下的纳税人关系云图,开展纳税人关系网络分析。
③票流分析:通过票流分析模拟实现物流监控,理清纳税人生产经营的货物、发票上下游、全链条的来龙去脉,进一步分析其业务的真实性、各税种的申报准确性及完整性。
④风险情报系统:实现非正常纳税人、信用评级低的D级纳税人信息推送,满足各级税务机关跨省数据需求,建立纳税人跨省风险情报项目。
⑤用户画像:在全面集中与整合全国范围内各类业务数据基础上,借助互联网大数据领域“画像”“标签”等新思路、新技术,对税务领域的纳税人、自然人、税务机关构建标签体系,刻画主体特征,形成有价值的主体群体画像,从而更加便利、高效地辅助国家税务总局决策者、管理者、分析者对目标群体进行识别、分析,帮助他们对全国范围内的纳税人、税务机关进行全面、深入的了解,帮助各司局专职分析人员有效识别纳税风险、掌握纳税服务诉求,以满足日常管理的需要。
从应用情况来看,部分税务机关通过应用大数据技术,解决了许多过去难以解决的问题,但总体来看,尚处于初级阶段,互联网、大数据思维还没有全面深入到税务系统的各个领域。
(2)纳税服务方面的大数据应用
①拓展办税渠道,逐步创建以自助办税为主、大厅办税为辅的办税服务新格局
传统办税以实体大厅为主。随着经济的发展,大厅数量与税务资源的有限性和纳税人数的扩张性、纳税服务提升性的矛盾凸显。可采取如下措施借助大数据及技术手段改善这一现状。
第一,实现传统办税大厅的提档升级。为从根本上解决传统办税大厅存在的服务标准参差不齐、服务数据分散、应急管理“慢半拍”等问题,税务机关应以“便民办税春风行动”为契机,借力现代科学技术,将大数据统筹、分析、共享等特性运用到纳税服务工作实际,打造具有“全程化、可视化、数字化”监控功能的纳税服务综合管理系统。该系统至少应具备以下特点:一是服务数据“大集中”,纳税服务数据分秒可查;二是服务过程“大监控”,工作状态实时可见;三是考核评价“大绩效”,考评数据自动生成;四是服务需求“大响应”,预警应急从容应对。依托该系统,将传统办税窗口建成“一窗式”“一站式”智能办税集约管网,实现省、市、县多级信息数据集成管理,突破时间、空间、区域限制,多维度直观反映办税服务流程,全程无盲点实施过程控制,提升纳税服务质效。
第二,创新和丰富自助办税方式。利用大数据和信息化技术,全力打造智能化办税服务平台,实现智能化终端和网上税务局的自主办税。a.智能终端自助办税。利用大数据和信息化技术研发智能化自助办税终端,逐步启动办税服务厅“外移”工程,将智能办税终端放置在政府行政审批中心、银行网点、房产交易中心、商业中心区等场所,方便纳税人就近办理相关业务。赋予智能办税终端代开发票、税费缴纳、纳税申报等实体办税服务厅功能,实现纳税人与税务人员实时远程视频联系,以便纳税人在使用过程中遇有困难时,可及时与后台税务人员视频通话,加强操作指导。b.网上税务局自助办税。进一步整合涉税数据,优化现有信息化软件,打造高效、安全的网上报税系统,利用计算机和手机自助办税,突破传统大厅办税的时间和地域限制,为纳税人提供无时间约束、无地域约束的智能化纳税服务,提高基于互联网的办税服务水平。
②拓展涉税信息获取渠道,创新电子化的信息传递系统
根据经济合作与发展组织(OECD)通行的纳税服务渠道的层级构成划分,纳税人涉税信息获取渠道按服务效率从低到高可分为面对面传递、书信传递、电子邮件传递、电话传递和网络传递。我国税务机关已建立了包括上述所有渠道在内的涉税信息传递渠道,在转变观念的前提下,可考虑借助大数据为纳税人提供以下更快捷、更有针对性的涉税信息:
一是根据纳税人的网站浏览痕迹、网上交易信息、广告投放资讯和企业新闻等,把握纳税人的关注重点和经营变化等带来的动态涉税需求,主动为纳税人提供智能化的信息传递和个性化的纳税服务。
二是建立由税务机关主导、纳税人参与的分门别类的税企微信群、QQ群,实现海量涉税信息的快速发布、最新政策的及时传递、涉税问题的共同探讨、征纳双方的实时沟通、税务人员的在线答疑和个性需求的预约办税。此外,纳税人可通过微信、QQ上传意见、建议,服务投诉,形成征纳一体的移动互联网通道。
三是依托大数据,建立税收大数据服务平台,为纳税人提供税费申报、缴纳、查询等功能,用于发票开具信息即时查询和真伪校验,开展纳税信用等级查询、欠税公告查询,使纳税人足不出户就能轻松了解海量涉税信息。同时,与移动、电信、联通等运营商合作,拓展涉税查询平台和手机、平板电脑等查询新途径。
四是利用“网上税务局”,对纳税人进行有针对性的税前、税中、税后辅导,并针对不同纳税群体和不同优惠群体举办不同主题、不同行业的在线访谈,请税务专家走进直播间与纳税人实时沟通,在线交流,对其进行个性化辅导。
2.国内税收系统大数据应用的典型案例
面对当前经济发展的新形势、不断出现的新问题、蓬勃发展的新业态、税收管理的新矛盾,从税务总局到各省、市税务局开展了一系列探索。据课题组调研,河北、黑龙江、广东、江苏、安徽等各省国家税务局、地方税务局的做法各有不同,并取得了明显的成效。
【案例1】河北省国家税务局:聚类分析与关联分析,在增值税风险防控方面取得突破 。该局以需求为导向,依靠自己的技术力量进行先期探索,找出大数据与税收工作的契合点。目前,在聚类分析和关联分析方面取得了突破,并在增值税风险防控方面取得了良好的应用效果,在国地税全税种风险管理方面进行了有效探索。
①聚类扫描打败虚开“游击队”
优化涉税审批后,部分不法企业利用便民措施,大量新办企业、申领发票、虚假开具后迅速注销或走逃,严重破坏了税收秩序。由于该类企业具有“快办、快领、快开、快跑”的特点,传统属地管理的阵地战面对虚开“游击队”,无从下手、疲于应付,出现了“打不死、赶不走、且打且蔓延”的被动局面。
河北省国家税务局利用大数据与数据挖掘技术和数据图形学的方法进行研究分析,并对当前登记、申报、征收、发票领购、发票开具等信息点进行语意解读,将现有的一个信息点拆分成几个到几十个信息点,利用信息点的互斥性和互证性来排除干扰、强化特征,最终找出了一套包含语意解读、聚类分析、关联分析、专业剪枝、确定分组、业务优选、验证滤杂、锁定目标等步骤的风险识别新方法。该方法既有现实性又有预测性,既可以挖出已经注销、走逃了的虚开“游击队”,又可以锁定当前正在实施违法行为的团伙成员,还可以发现刚刚登记,领了发票的将要虚开的团伙成员。在风险应对上,河北省国家税务局采用各属地税务机关同时出击,让虚开团伙无处遁形,有效地击溃了虚开“游击队”的多点、多轮次的进攻。
②图形挖掘找出虚开全链条
从增值税风险的宏观视图来看,特别是在互联网时代,具有虚开、虚抵风险的企业呈现专业分工、跨区域协作、网络化运作,违法网络组建迅速、供需在线直通、协作形式灵活、整个网络的再生能力强、扩散速度快等特点。基于互联网时代企业运作的新特点和当前虚开、虚抵风险存在的主要问题,河北省国家税务局确定了以大数据、数据挖掘、数据图形学等先进技术为主导,税收业务分析为印证的四步分析法,即“整合数据建主题、构建网络绘整体、识别风险做标识、层层挖掘现谜底”。
首先,整合金税三期、防伪税控、电子底账、进销项分析、协查等系统信息,构建面向风险管理的主题集合,主要构建了纳税人与发票两大主题集。
其次,依托发票与纳税人主题集,以纳税人为“节点”,以购销关系为“边”,运用大数据中图形数据库技术,建立涵盖河北省全部企业的商品交易网络全图,称之为“涉税关联网络”。
再次,应用大数据技术和数据挖掘技术,确定八大类、40余种风险商品,再对单户企业的购、销商品按照产品结构智能组合,整体比对,识别出了大量“购销不一致”的风险企业。
最后,通过追踪“涉税关联网络”上企业的商业轨迹,以风险企业为锚点,以企业运作规律为线索,层层推进,点点剖析,逐个挖出虚开虚抵网络、骗取出口退税网络、避税筹划网络、关联交易网络等涉税风险交易网络。
在风险应对上,按图索骥,层层突破,环节之间相互印证,实现风险交易网络的整体打击。
③智能分析实现税收风险自动排查
目前的税收风险管理数据源基本是征管数据,第三方数据采集、交互及应用欠缺,国地税征管数据共享度也不高。风险识别方式主要通过人工设定的量化指标进行风险识别,国地税风险指标设计侧重自身管理税种,有重合的只有所得税,国地税税种之间的勾连关系没有有效利用。风险识别后再通过人工手段进行排查。这一方式存在“信息采集单一、技术分析受限、风险识别率低、人工排查难”的问题。为提高风险应对质量,河北省石家庄市国家税务局、地方税务局联合开发了《国、地税全税种税收风险分析暨税款智能排查系统》,该系统由大数据采集转换、人机结合风险智能分析、税款智能排查三个子系统组成。大数据采集与转换系统将来源于国地税征管数据、第三方数据及网络爬虫取得的数据,通过深度挖掘分析和加工处理,模拟人工智能读取、甄别提取有效数据;人机结合风险智能分析系统对企业主体数据、历史数据、外部关联数据、国地税不同税种数据进行多维度比较分析,以项目关联数据为纽带,以其他信息为补充,还原出实际业务逻辑,进行聚类、成分分析,建立具有针对性的风控数据模型和规则引擎库,创建关系型模型数据库,精准定位风险企业和风险点,并对今后的风险点进行预测分析,全面应对税收风险;税款智能排查系统对企业从购入、生产到销售全流程中相关重点数据、关联关系进行监控和排查,基于大数据挖掘实现风险自动排查和税款智能排查。该系统开发成功后,2017年上半年,石家庄市国家税务局、地方税务局首先对全市房地产行业开展专项风险应对。通过把从金税三期核心征管系统提取全市建筑和房地产行业21922户纳税人自2013年以来申报纳税数据、发票信息、财务报表信息和从石家庄涉税信息云计算平台抽取的115万条第三方信息,全部灌入系统进行整合分析。产生疑点数据2801条,涉及企业879户,初步估算产生税款109732.84万元,其中增值税62216.79万元,企业所得税46088.65元;明确问题指向待进一步核查的问题1228条,其中企业所得税16条、增值税1212条。通过专项风险应对,共确认税款9.8亿元,该系统的税款直接指向精准度超过50%,通过疑点指向发现问题的有效率达75%。
【案例2】某省税务系统:风险监控,提高税收精细化管理水平。
该省地方税务局在税源专业化管理过程中,要求各级税务机关根据税源结构及其风险特点对税源科学分类,将税源管理职责在不同层级、不同部门和不同岗位间进行科学分解、合理分工,以实现管理组织经营方向的专业化和员工岗位分工的专业化,从而实现管理质量和效率的提升,增强纳税人遵从度、降低执法风险。该省地方税务局大数据在税收治理方面的运用,不是停留在简单的数据获取层面,而是将数据进行深度挖掘和利用,通过大数据信息比对技术进行风险识别,将风险划分为高、中、低三个等级的风险级别,并对应税务稽查、中等风险应对和提示提醒三种应对方式,最后利用大数据平台进行税收风险的后续监控。
该省地方税务局以大数据思维构建的税收风险防控管理系统,基础数据由政府各部门交换的第三方数据、互联网采集数据和税收征管数据组成政府各部门交换提供的第三方数据,从2009年《××省地方税收保障办法》颁布实施后,持续拓展。第一批次涉及17部门49类425项内容,此后不断增加,到目前为止共采集了41部门138类1238项数据内容。为了充分挖掘这些数据中的税源价值,该省地方税务局各部门分级建设了风险识别的指标体系。2017年,结合营改增的全面推行和金税三期的上线,该省地税部门对全省风险识别指标体系进行了全面整合,将普适性的指标全部升为省级指标,目前省级指标为269个。按照该套指标,2011年全年,通过分析利用第三方信息,税务部门取得税收成效77.7亿元(其中国税65.59亿元,地税12.11亿元);2012年有效采集265.1万条信息,比2011年增加155万条,增长140.7%,通过分析利用第三方信息,取得总成效84.57亿元(其中国税63.8亿元,地税20.77亿元),比2011年全年增加6.87亿元,增长8.84%。2013—2016年,地税部门每年采集外部门数据量均保持在6000万条以上,查补税款年均超过60亿元,其中2016年全年增收税款达到99.8亿元。在整个经济步入调整期,税源增长乏力的大背景下,第三方信息的分析利用,越来越成为地方税收增长的一大可靠稳定来源,对地方财政的贡献也越来越大。
该省国家税务局作为国家税务总局首批“互联网+税务”试点项目,为该局纳税服务和税收管理的创新发展提供了信息支撑和情报保障。以数据采集、数据存储、数据加工、数据分析、数据应用为主线,运用大数据技术,拓展第三方信息共享和互联网数据采集,实现了海量数据存储和高性能计算分析能力,提升了税收风险管理数字化、网络化、智能化水平,使之成为推动税收征管体制改革、实现税收管理现代化的重要引擎。大数据平台集成多种先进技术,覆盖了数据管理的各环节。在数据采集中集成网络爬虫、信息嗅探技术,在数据存储中引入Oracle DB+Hadoop HDFS混搭架构,在数据加工中应用ODI、OGG等工具,在数据分析应用中集成智能分析(Business Intelligence)和集群计算(如Spark)等框架。不同技术和工具有效整合、各展所长、形成合力,形成了具有该省国家税务局特色的解决方案。该局税收大数据将“数据应用”作为信息化体系核心内容,以专业化税收情报人才队伍和组织管理体系为保障,逐步实现了数据采集、信息加工、情报应用、知识管理等分工科学、相互协调,与税收风险管理衔接配套的专业化、网络化、智能化的税收情报管理体系,实现了税收管理方法和管理能力的变革型发展。在此基础上,通过对纳税人行为的采集、分析,对接各类办税资源,实现了向纳税人按需配置、个性配置和合理配置办税资源,提升了纳税服务的综合质量和服务水平,帮助解决了纳税服务的“痛点”和“难点”。最重要的是,通过最纯粹、最准确的税收大数据,为政府提供了最准确的分析评估信息,辅助政府做出正确的决策,提升税务系统的数据话语权 。
【案例3】扎兰屯市国家税务局:信息共享,助推地方梯级税源建设。
2015年8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,内蒙古扎兰屯市国家税务局以此为契机,积极运用大数据思维构建现代税收征管体系,全面掌握各种涉税信息、监控和建设梯级税源。
2016年,扎兰屯市国家税务局运用大数据、云计算技术,依托金税三期工程等数据分析平台,对纳税人互联网非结构化信息实施垂直搜索和抓取,加工分析后用于税源监控和分析评估,找出管理薄弱环节。同时,与扎兰屯市工商局、地方税务局、人社局、银行等部门建立共享机制,定期进行批量数据传递;专门成立了风险管理团队,利用统计报表、数据分析模块、将纳税额、收入规模与行业数据、财务指标进行时间比对和交叉比对,生成趋势分析图,及时反映趋势性和倾向性问题,突破以往税收管理中的“瓶颈”。
一是助推农产品深加工产业税源建设。扎兰屯市国家税务局根据所辖区域农产品生产比重大的特点,积极开发了基于大数据的纳税服务平台,进一步优化纳税服务,培养了一批以农产品为原料的大型加工企业和出口企业,产业化经营带动能力明显提升,促使更多的农户加入到产业化行列,推动了农业经济向科学化、规模化和产业化方向发展。同时,一批规模大、竞争力强、效益好、带动农民增产增收作用显著的龙头企业生成,促进产供销、贸工农相结合的“一条龙”产业链的经营机制形成。
二是助推铅锌矿业税源建设。随着国民经济对于铅、锌等有色金属资源的需求逐渐增大,2007年呼伦贝尔市被国土资源部确定为全国三大重点采矿带之一。2014年以前,呼伦贝尔市铅锌矿采选企业的数量为14家。截至2017年6月底,呼伦贝尔市铅锌矿企业共有29家。该行业的纳税人基本分为两类:一类是私营有限责任公司,属于个人独资(或者合伙)组建的企业,投资主体多为外地个人投资者,投资额相对较少,生产历史较短;另一类是原国有企业转制组建的有限责任公司或是国有控股的股份制公司,其投资主体多元,投资额较高,生产历史较长,生产设施设备齐全完善。通过与工商、国土资源、质检等部门的信息共享,税务部门了解到该市铅锌矿多为伴生矿,品位较低,企业均以采选和初级原料加工为主,综合回收率低,产业链条短,且属于季节性生产,各企业地质条件、经营成本等有许多不可比因素。呼伦贝尔市国家税务局运用大数据获取的资料,对各企业税负变动、资本结构、经营成本等进行分析比较,找出铅锌矿业税源建设存在的问题,采取有针对性的措施和方法,促进铅锌矿业的发展和梯级税源建设。
1.税收大数据共享应用的法律保障问题
河北省税收大数据应用及税收风险管理实践的一个突出亮点是借助地方政府云平台的建设和涉税综合治理机制的扎实有效推进。但是,税收大数据应用涉及国税系统大数据与地方政府各部门交换共享的法律保障问题,因此,应建立纳税人涉税信息数据保密机制和相应的制度,建立和完善相关的法律制度及运行机制,为进一步在全国范围推广普及和应用税收大数据提供强有力的法律层面的保障和支撑。
2.数据应用受限与质量管理问题
随着增值税发票管理系统全国联网,方便了国家税务总局层面发票大数据集中比对应用管理的同时,也方便了犯罪分子利用该系统进行全国性的虚开、虚抵,但税务系统的属地管理机制却束缚于信息应用权限只能在辖区税收征管和发票信息的基础上处理犯罪事项,打击犯罪的范围和力度有限,因此,需要研究建立全国范围的“风险防控”的联防联控管理机制,实现税收大数据的更大范围的跨区域共享。另外,受限于税收征管系统数据的不真实、不完整、不及时、不关联等质量问题,各地税务系统税收大数据风险防控与征管服务经验的全面推广还需要对数据资源进行有效整合,进一步开展深度的质量管理和建模应用。研究如何解决跨区域数据共享与风险联控问题,以及围绕大数据应用的管理体系进行税务系统内部组织架构与业务流程的重构都是需要深度探讨的课题。
3.运行管理机制的建立和完善问题
税收大数据的来源涉及诸多部门,以河北省为例,其试点建立的云技术平台涉及34个部门提供的大数据,一定程度上存在数据格式不统一、更新频度不一等业务和技术问题;此外,还应进一步拓宽第三方信息的渠道,多渠道、多维度地将证券交易、金融等部门的信息也采集进入大数据系统。此外,应考虑进一步放开金税三期系统决策二包相关数据权限,让专业的数据分析工具结果能及时导入风险管理系统中,实现风险分析识别、应对处理、风险排查、反馈优化的闭环良性循环。
4.税收大数据全面共享和协同共治问题
税收大数据共享的理念和思维不能仅仅局限于税收征管和服务工作,大数据的综合应用还包括将涉税违法犯罪信息反馈应用于社会综合治理,包括工商管理、金融管理及社会征信体系大数据平台的共建及信息共享,更好地促进税收遵从,防控税收风险,实现更大范围的税收治理体系和治理能力的现代化。