大数据下改变税收风险识别方法的思考

(整期优先)网络出版时间:2019-10-20
/ 2

大数据下改变税收风险识别方法的思考

毛云芳

(厦门市税务局)

摘要:本文通过对税收风险识别基本思路的分析,说明传统风险识别的难点和存在的问题,并深入分析大数据下税收风险识别工作方式的转变,如果不能清醒认识到这种转变,就容易陷入工作误区,大数据在税收风险识别中的实践运用。

关键词:大数据;税收风险;风险识别

2019年政府工作报告提出“智能+”,取代“互联网+”为传统产业升级赋能,大数据行业开始与各行业应用进行深度融合。与此同时,税务系统金税三期全面上线和大数据云平台的建成,为税务系统应对纳税人数量增长快、类型复杂、监管方式转变等巨大挑战提供运用大数据技术的实践条件。而习总书记提出税收监管方式“既要以最严格的标准防范逃避税,又要避免因为不当征税导致正常运行的企业停摆。”的要求,为税收风险识别提出更高的要求,而大数据的发展为税收风险识别拓展了思路。

一、税收风险识别概述

(一)税收风险识别概念

微观层面的税收风险识别是围绕税收风险管理目标,利用来自税务系统内部和第三方外部的各种涉税数据,通过设立风险特征指标,建立数据模型,开展研究和探索规律,发现可能存在的税收风险点,识别单个纳税人的税收遵从度,减少税收流失,指导税收征管工作。

具体包含两部分内容:一是政策性风险。纳税人的风险值主要来自其对税收政策的理解和遵从。二是行为类风险。主要分析对象是纳税人的登记申报等涉税行为是否准确,是否切实履行相关的纳税义务。风险识别必须把握与税收风险相关的微观要素,收集、处理纳税人申报域、发票域以及财务报表等多维度的、大量的细节数据,指标及参数设置较复杂,比较耗时、力、物,梳理可能存在的风险点,最终锁定税务机关面临的所有可能的风险来源,确定这些风险可能导致的税收流失。

(二)税收风险识别内容

税收风险管理基本流程由风险目标规划、风险识别排序、风险应对和绩效评价等环节构成。税收风险识别是其中的关键环节。只有先准确识别税收征管中可能存在的风险,税务机关才能选择合适的方法开展有效风险应对,提升征管主观努力程度。否则,即使建立运行协调高效的风险管理机制,或者风险应对人员精通业务,都只能起到事倍功半的效果,最终不仅难以实现税收遵从最大化的目标,也会导致基层税务人员的不满乃至对风险管理机制的怀疑,动摇整个风险管理体制基础。所以,税收风险识别不仅为税收风险管理提供精准指向和具体对象,更是关系到基层税务人员对风险管理的认可度,是税收风险管理中最为关键的环节。

二、传统风险识别采用的方法及存在问题

(一)传统风险识别方法

我国税收风险识别传统上最常使用的是指标峰值比较法,在指标法以外,统计方法在风险识别中也得到深入使用。一般认为,在经济环境稳定情况下,企业生产经营活动具有一定的延续性,涉税风险指标的增减变化与企业生产经营活动有密切相关性,可以通过数量关系反映。通常认为这种数量关系在某个区间(峰值)是合理的,那么超过区间(峰值)的指标变化就是不合理的,说明存在税收流失的风险。

(二)传统税收风险识别存在的问题

限于数据收集的质量和规模,实践中传统税收风险识别指标容易偏向税负等直接与申报数据、发票数据相关的分析指标,但是更主要的是指标设置、峰值测算出现偏差以及权重设置容易流于主观,最终造成分析结果误差。

首先,指标设置内在联系差且样本信息不全。风险指标的设置通常仅通过单一要素的变动情况如销售收入变动率,以及简单要素的趋势分析和配比分析来进行,科学性较差,而且指标峰值的设定主要是以少数生产规模较大、财务制度较健全的企业资料为依据,样本数据含量相对较少,缺乏完整性和可靠性。其次,指标峰值测算容易受外界因素干扰。诸如税收数据采集是否具有完整性、有效性和真实性、参数设置是否合理、纳税人分类是否科学、数理统计工具选取是否得当等因素都会对峰值测算产生干扰。最后,权重设置方法容易出现偏差。主观赋权评分过程比较复杂,需要花费较长时间,而且理论基础不够扎实,难以量化;客观赋权的定量方法各自具有一定的局限性,实际工作中更多采用管理经验识别分析法和典型案例识别分析法,具有较大的局限性。

三、大数据下税收风险识别工作方式的转变

进入2019年,随着大数据与产业的融合加深,大数据理念、思维、方法在税收风险识别中已经具备“天时、地利、人和”的实践条件,以数据挖掘为代表的大数据分析方法为税收风险识方法开启了新的领域,改变传统经济学研究方式和手段,数据分析理念也随之改变,工作方式方法也随之发生变化。

(一)数据量的大小决定风险识别对数据精确性要求转变

数据量的大小决定对数据精确性的要求不同。小数据时代测量次数有限,由于各种因素可能导致收集的数据是不精确的;而大数据时代基于上万次的测量,数据来源和数据量都多,虽然也会获得不精确性数据,但是这种不精确在小数据时代可能导致抽样误差,在大数据时代不仅不会破坏总体信息,还有利于了解总体,帮助人们通过尽可能全的数据发现更加细节的东西,提高识别准确性。小数据时代适用的是大数定律,说明随着样本数量的增加,样本平均数越来越接近总体;但大数据时代,样本就是总体,即真实情况。

(二)数据关系的不同决定风险识别思路的转变

大数据时代,由于数据规模巨大、数据结构复杂以及数据变量错综复杂,预设因果关系以及分析因果关系相对复杂,处理的流式数据往往存在“此一时,彼一时”的情况,变量间的因果关系具有时效性。因此,大数据时代研究数据由传统因果关系转向相关关系,这将导致风险识别思路相应转变。传统风险识别方法思路是一个“先假设,后关系”的过程,即先假设某种关系存在,然后根据假设计算变量之间的相关关系,构建模型通常是回归方程探求现象之间的因果关系。前沿风险识别思路往往是直接计算现象之间的关联性,注重的是关联关系和关联规则的挖掘,解决问题从“为什么”转向“是什么”。

(三)数据形式不同决定风险识别工作认识的转变

与因果关系相比,相关关系是一种最常见的关系。也就是说,因果关系是特殊的相关关系,即有因果关系必存在相关关系,但存在相关关系不一定导致因果关系。传统税收风险识别方法的思路中指标解释的是因果关系,涉税疑点指向性明确,而前沿风险识别方法解释的是变量或现象之间的相关关系,对选出的评估对象难以提供涉税疑点的指向性,存在不透明性和不易解释的问题,风险识别工作必须注重对模型的输出结果进行后续处理,提供涉税疑点指向性,方便基层风险应对人员把握风险点,有的放矢开展风险应对取得实效。

(四)关系表现形式不同决定风险识别结果展示方式的转变

大数据时代数据结果依靠可视化展示,与小数据时代数据展示以线性关系为主不同。大数据时代万物皆可数字化,无法通过数量关系衡量的如文本、图片、视频、声音、动画、地理位置等半结构或非结构数据都是分析对象,导致平均数、方差、相对数等常用描述统计方法无法使用。现象的关系可能是线性关系,也可能是非线性函数关系,甚至是知道现象之间相依的程度,但关系的形式并不清楚。在这种情况下,就需要借助可视化来解释数据结果。

参考文献

[1]李扬,张长,朱建平.融合统计思想的大数据算法[J].统计研究,2018(7):125-128.

[2]俞立平.大数据与大数据经济学[J].中国软科学,2013(7):177-183.

[3]张景华.税收风险识别模型的构建[J].税务与经济,2014(1):96-99.