范文网 论文资料 纳税评估模型建设方法(通用)

纳税评估模型建设方法(通用)

纳税评估模型建设方法第一篇:纳税评估模型建设方法地税纳税评估模型商河地税制造业纳税评估模型制造行业在全县经济总量中占有一定的比重。2011年全局共入库5231万元,占全年总入库税收33456万元的16%。纺织行业作为我县制造业的支柱行业,首。

纳税评估模型建设方法

第一篇:纳税评估模型建设方法

地税纳税评估模型

商河地税制造业纳税评估模型

制造行业在全县经济总量中占有一定的比重。2011年全局共入库5231万元,占全年总入库税收33456万元的16%。纺织行业作为我县制造业的支柱行业,首先根据行业特点和工艺流程,以产能分析为中心、以纺织产品品种结构和生产工艺特点分析为切入点、依托评估指标和产能测算展开分析,对企业收入、成本、费用的真实性、准确性进行评估,确保了行业模型具备科学性、适用性。其次开展了行业典型调查。以生产经营正常,财务核算健全,具有代表性为条件,将商河县织布厂企业作为典型调查对象,摸索建立评估模型。三是科学测算。深入企业调查核实,充分掌握该行业生产经营特点、具体的工艺流程,通过各种途径对大量数据进行采集和测算,如通过“一户式”查询系统采集相关征管数据;通过国税部门采集企业增值税纳税信息;通过电力部门采集企业用电量信息;通过劳动部门采集企业用工信息;通过有关渠道获取原材料采购、产品销售价格、投入产出比率、成本费用率等行业标准指标,从而为建模工作提供科学依据,提高合理性和说服力。四是深入分析。根据掌握的数据指标,分别设立预警区间,并对低于预警范围和超出预警范围的情况进行分析判断,从而发现纳税疑点,同时,设立了规范统一的数据采集模板,内容包括产品购销信息、成本费用构成、财务指标等,建立起一套严密科学的纺织行业纳税评估模型。

评估具体方法及内容

除进行指标测算、数据比对等实证分析外,还要对本企业内部控制制度、财务核算情况进行总体分析评价,并根据分析情况对企业的有关数据进行校正,保证采集数据的准确性。

(一)财务税收指标的分析

1、企业的销售额与企业的实际经营规模是否相适应,具体可分析以下指标:企业注册资金、固定资产、流动资产规模,企业在职职工人数;

2、销售额、存货购进额与资金周转情况是否相适应,具体可分析、查看资金周转率,一定时期内资金循环几次,确定是否存在销售不入账的可能;

3、查看销售利润率是否合理,在达到销售保本点的情况下,同行业、同一类型产品与正常、市场销售利润率应相近(剔除路途远近,技术工人熟练程度,管理不善等因素);

4、收入、费用是否配比:

(1)销售额与水电费支出是否配比。一般来说,同行业每万元销售额与水电费支出比是相对稳定的,如果脱离了正常比例,则可能存在隐瞒销售现象;

(2)数量与运费支出是否配比。一般情况下,一定路程的运费在一定时期内是相对稳定的,如果销售数量与运费市场价格不配比,发生异常,则有可能存在虚列运费支出或销售不入账等现象;

5、销售数量与存货出库数量是否对应。一般情况下,产成品出库数量与销售是相对应的,否则存在销售不入账现象;

6、投入与产出是否配比。正常情况下,购进存货数量与产成品入库数量,剔除生产过程中正常损耗值,一定数量的存货应该生产出相对固定数量的产成品,如果不在正常值范围,则说明产成品未全部入库或存货未经加工而直接销售未入账;

7、成本费用是否配比。产成品入库数量与工人工资应当配比,每件或每批产成品入库,生产人员工资是相对固定的,如果发生异常,则存在虚列工资成本或产成品未完全入账现象。

8、是否存在视同销售行为,有无按规定进行纳税调整。

(二)能耗、物耗指标的分析。

1、单位产品耗用水、电、油等能源情况分析;

2、单位产品主要原材料耗费情况分析;

姜堰地税辖区内现有棉纺织行业企业190户,2010入库企业所得税574.3万余元,所得税的贡献率平均值仅为0.24%。调查发现:棉纺织行业企业多为民营企业,中小企业与个体经营者数量居多,资本投入量相对较大,会计核算水平普遍不高,财务核算基础较低。加之纺织行业属劳动密集型产业,产品科技含量不高,规模大小不等,销售不开具增值税专用发票的现象比较普遍,少申报或不申报应税销售收入的现象更是屡见不鲜。

为加强棉纺织行业税收管理,堵塞税源漏洞,该局根据棉纺织行业机器设备生产能力及使用状况,生产棉纱过程中实际消耗原材料、辅助材料、包装物等数量,废棉产出率和再利用率,企业存货、固定资产与其成本、收入分析,生产人员工资发生金额:期间费用变动率等六个方面生产经营规律,确立了相关的风险指标值,探索出“设备生产能力评估法、原材料投入产出评估法、废棉产出评估法、资产评估法、工资与工时评估法、特定项目评估法”等六种评估方法,并以此为基础建立了“棉纺织行业纳税评估模型”。

第二篇:行业(产品)纳税评估模型

行业(产品)纳税评估模型模板

一、行业(产品)介绍

(一)行业(产品)定义

介绍该行业(产品)定义、概况、属性以及编号。

(二)企业类型划分

对该行业(产品)企业具体划分类型,并加以说明。

(三)工艺简介

简要介绍该行业(产品)的主要工艺流程及特点。

二、行业(产品)生产经营规律及涉税管理要点

(一)行业(产品)生产经营规律

描述该行业(产品)的主要生产经营规律。

(二)涉税管理要点

详细列举评估的要点。

三、评估方法

结合该行业(产品)企业的生产工艺流程、生产经营规律、涉税管理要点,详细列举主要评估方法(包括运用两种及以上方法进行评估测算,相互比对和印证)。

具体评估方法表述内涵应包括以下部分:

1.原理描述

2.评估模型

3.标准值参考范围

4.数据获取途径

5.疑点判断

6.应用要点

四、印证案例

选取若干典型案例对评估模型进行验证。验证案例包括以下内容:

1.企业基本情况介绍

2.数据采集来源及内容

3.确定疑点列举

4.实地核查情况

5.测算税收差异情况

6.评估约谈

7.评定处理

第三篇:汽车修理行业增值税纳税评估模型

汽车修理行业增值税纳税评估模型

一、行业生产经营特点、工艺流程和征管难点

(一)行业生产经营特点

1、资格认证制度。汽车维修行业根据经营项目、服务能力、规模大小,实行资格认证,共分三种资质:一类、二类、三类。其中一类企业包含有汽车大修、总成修理、汽车维护、汽车小修;二类企业包含有汽车一级、二级维护和汽车小修;三类企业为“专门从事个别专项修理和维护的企业和个体户”。

2、价格公示制度。机动车维修经营者在经营场所必须公布统一式样的收费项目。主要包括:工时定额和工时单价,同时应公布主修车型的常用配件价格。工时单价、配件进销差价率由企业自定。并由当地道路运输管理机构批准备案,维修价格一经确定,原则上一年内不得随意变动。机动车维修经营者不得超过公示的收费项目和收费标准收费。

3、机动车维修服务价格组成。维修结算价格=工时费(工时单价* 结算工时定额)+[材料进价 *(1+进销差率%)]+外加工费+车辆牵引费+施救服务费。

(1)工时费:按工时单价乘以结算工时定额进行计算。工时单价由经营者依据自身的资质、技术等级、维修及服务质量、市场需求等自行制定;工时定额按照省交通主管部门制定的《**省机动车维修行业工时定额》执行。全省范围内的维修业户在计费时不应超过此工时定额的限度,但允许低于此定额核计费用。

(2)材料费:是指机动车维修过程中更换、修理零配件及使用耗材所发生的费用。零配件及材料价格按实际购入价格和合理的进销差价构成。进销差价率由经营者参照**省机动车行业组织定期公布的市场平均进销差率自行确定。

(3)外加工费:是指受本企业的技术条件限制,需要委托其他企业进行维修或加工零、配件所发生的费用,外加工费按实际发生的净额结算。

(4)施救服务费:凡应托修方要求为抛锚车、事故车提供的现场排障、施救、牵引服务的,承修方收取的服务费用。

4、完备结算制度。机动车维修竣工出厂时,机动车维修经营者应当使用省运管局统一格式的《机动车维修结算清单》,严格按照公示的工时定额和收费标准结算,并分项结算修理费和材料费,同时向托修方出具机动车维修发票。

5、实行维修记录制度。维修企业应执行相关维修技术标准,进行修前检测诊断、确定故障、制定维修方案,填写由省道路运输管理机构统一规定的《机动车维修记录》。其中维修记录主要内容有:诊断、故障原因、维修项目、更换的配件、具体承修人及技术负责人等情况。

6、机动车维修合同制度。维修企业从事整车大修、总成大修、二级维护或预计维修费用在2000元以上的维修业务,以及事故车的修理,应使用省交通厅运管局推荐的《机动车维修合同》文本签订书面合同。在维修过程中,确需增加维修项目、扩大维修范围的,应征得托修人同意,签订补充合同。

7、档案保存制度。机动车维修经营者对机动车进行二级维护、总成修理、整车修理的,应当将机动车维修合同、维修项目、具体维修人员及质量检验人员、检验单、竣工出厂合格证(副本)及结算清单存入机动车维修档案。机动车维修档案保存期限不得少于二年。

(二)保险、维修作业流程

保险流程:出现交通事故--向交通管理部门报案--向保险公司报案--出示保险单证--出示行驶证--出示驾驶证--填写出险报案表--详细填写出险经过--详细填写报案人、驾驶员和联系电话--检查车辆外观,拍照定损--(理赔员开具任务委托单确定维修项目及维修时间)--车主签字认可--车主将车辆交于维修站维修。

维修作业流程:车辆及来客进入—前台接车员迎接—试车初步判断—填车辆维修单,签定委托协议,初步估价定时(事故车,联系保险公司洽谈)--建立客户档案—打印派工单--生产调度—配件仓库领料—维修作业(发现新故障再和客户估价签补充协议)--修竣后质量检验—内外清洁—通知客户提车—办理结算手续—工作单存档—电话回访。

(三)征管难点

目前整个汽车修理行业从形式上分为两大类,一是专业汽车修理厂;二是4S专卖店采取前店后厂经营方式,前店销售,后面维修、保养;从税收管理方式上分一般纳税人和小规模纳税人,其中小规模纳税人的数量占80%以上。

1、帐外经营行为在不少企业中或多或少的存在。

主要手法是售后维修费和配件销售不入账,如装潢费、加急费、服务费、返利、赠品和零配件销售等,存在未开具发票或未申报纳税的情况,这是汽车维修行业最难核实的偷税手段。

2、虚开、代开、开具大头小尾发票现象时有发生。一是有的客户在没有进行维修的情况要求汽修企业代开发票,并按发票一定比例支付给汽修企业扣点。二是由于小规模纳税人仍然使用手工发票,开具大头小尾发票的情况较为严重。

3、开具不符合规定的红字发票冲减销售。汽修企业每年都有较大数额的定向修车款收不上来,但汽车修完后已开具发票,也计提了销项税,因客户不给钱,于是用红字发票把所欠修车款的发票冲减掉,从而冲减了当期销售收入。

4、汽车改装、装潢、汽车修理、汽车美容等项目未分别核算,存在国税、地税发票混开现象。

二、相关评估指标参数

汽修行业主要指标 参 数 备 注

工时定额 《**市机动车维修行业工时定额(试行)》(2004版)

工时单价

12、

14、

16、

18、20元等 各企业均不同,具体见企业《收费价目表》

材料进销差价率% 15%-25% 各企业均不同,具体见企业《收费价目表》 (工时收入+配件收入-当期耗用配件进价)/当期耗用配件进价 >35% 配件加价15%-25% 工时价值20%-40% (备注:高档汽车有的在40%-70%之间)

4S店销售结构 汽车销售收入占90% 汽车维修收入占10% 评估期修理费总收入/评估期修理工工资金额 8.33-11.11 评估期修理费总收入/评估期零部件采购金额 1.35-1.70

三、行业评估模型及评估方法

1、销售结构评估法(仅适合4S店)

经调查了解到,汽车销售服务企业主要的利润来源于维修收入,企业维修收入占销售收入总额的比例也相对稳定,一般为10%以上,高档车的这一比例更高,并随着经营期的延长而逐渐提高。 企业维修收入占销售收入总额的比例=评估期维修收入/销售收入总额

如果比例低于10%,可以进一步怀疑该企业纳税异常,有隐瞒维修收入的可能。

2、工资系数评估法

经调查发现,汽车修理企业在计算一线修理工应得工资时,均以其实际完成的修理工时为依据,由于修理工时与修理收入具有直接的相关性,因此修理工工资金额与应发生的修理费收入也有紧密的相关性。根据我们测算的结果(在对修理费收入取数时,提取的是包含零部件金额的毛收入,即修理总收入),修理工工资金额与应发生修理费总收入的相关系数为8.33至11.11,即修理企业每发生1万元工资,就应当发生8.33至11.11万元的修理费总收入。 评估期修理费总收入=评估期修理工工资金额*修理工工资金额与修理费总收入的相关系数

3、配件采购金额系数评估法

由于汽车修理企业是根据修理现场的实际需要购进配件,所以零部件的采购金额与实际耗金额是基本相当的,又由于材料费金额与修理费总额存在统计学上的相关性(非逻辑相关性),所以零部件的采购金额与应发生的修理费总额也存在相关性。根据我们本次调研的结果,零部件采购金额与应发生修理费收入的相关系数为1.35至1.70,即企业每发生1万元零部件采购金额,就应当发生1.35至1.70万元的修理费总收入。

评估期修理费总收入=评估期零部件采购金额*零部件采购金额与修理费收入的相关系数

4、维修及配件销售加价率推算评估法

维修及配件销售加价率一般由两部分构成:配件加价,一般为15%~25%左右;人工费(工时)一般为配件的20%~40%左右。维修及配件总的销售加价率下限为35%左右。如果维修及配件销售加价率低于35%,可以推论有隐瞒维修销售收入的可能。 评估公式:

评估期维修及配件销售加价率=(评估期工时收入+评估期配件收入-评估期实际耗用配件进价)/评估期实际耗用配件进价

评估期实际耗用配件进价=评估期期初配件库存余额+评估期期间配件购进金额-评估期期末配件库存余额;

如:某公司2005年维修实现收入3376万元,2004年底维修备件账面库存为658万元,2005年账面维修购进2649万元,年底账面库存为593万元。

评估期实际耗用配件进价=上年底维修备件库存+当年维修购进-当年底库存=658+2649-593=2714万元。

评估期维修及配件销售加价率=(评估期工时收入+评估期配件收入-评估期实际耗用配件进价)/评估期实际耗用配件进价=(3376-2714)/2714=24.39%。

从行业情况看,维修及配件销售加价率肯定大于35%。可见企业维修及配件销售加价率明显偏低,存在偷税嫌疑。

5、应纳税款少缴推算法

假定企业账面配件实耗成本是真实的,根据维修收入与配件实耗成本的关系:维修收入=评估期实际耗用配件进价/(1-维修及配件销售加价率),按维修及配件销售加价率平均标准下限35%计算:

推算2005年维修收入=2714/(1-35%)=4175万元; 推算2005年少缴增值税=(4175-3376)×17%=135万元。

6、配件进销差价率推算评估法

维修结算价格=工时费(工时单价×结算工时定额)+[材料进价×(1+进销差率%)]+外加工费+车辆牵引费+施救服务费。

分析:在工时既定的条件下,配件材料加价=维修收入-配件材料进价-工时费-其他费用(外加工费+车辆牵引费+施救服务费) 配件进销差率=配件材料加价/配件材料进价

如:接上例数据,该公司核定的配件进销差率为15%,通过调取该公司资料,维修的工时费用为1079万元,假定工时费用数据准确,可以计算该公司2005年配件加价为:汽车维修收入3376万元-实耗材料2714万元-维修工时费用1079万元=-417万元。配件利润率为-15.36%。

和企业核定进销差率比对,如果显然不合常理,可推论其有瞒报维修销售收入或赠送未计收入的可能。

7、维修清单、维修记录、发票比对评估法

维修清单:根据行业规定,汽修行业必须给客户出具维修清单,手工清单由**市汽车维修行业管理处统一监制,根据企业领购手册查找一定时期企业领购的有顺序编号的《**市机动车维修工时费结算清单》和《**市机动车维修材料费结算清单》并评估确认企业收入。对使用计算机打印结算清单,可调取计算机中一定时期的结算清单评估确认企业收入。

维修记录:根据行业规定,每个客户必须有一本《机动车维修记录》才能参加年审,《机动车维修记录》相当于汽车“病历”,由汽修企业发放并在每次维修时登记,内容有:诊断、修理记录;维护记录;小修记录。

评估时通过汽修企业《机动车维修记录领购手册》查找一定时期企业已发送的有顺序编号的《机动车维修记录》和企业维修发票、维修清单比对评估确认企业是否少做收入。

8、特殊车辆二级维护评估法

针对特殊车辆如出租车、大货车、大客车、面的等营运车辆,一年内必须上2-3次检测线,在检测之前必须到二类以上资质企业进行全面的二级维护,由汽修企业出具二级维护合格证明方能上检测线。由于二级维护费用较高,又不在保险范围内,车主往往不需要发票,汽修企业往往也不入帐。评估时可要求企业提供《营运车辆二级维护竣工检测质量考核手册》,通过《考核手册》评估企业是否有销售收入不入帐。

9、废弃物评估法

机动车维修产生的废弃物主要是已损坏的大型配件,如换下的总成、废弃的车驾、车壳等,企业一般按废铁出售并且不入账。评估时可根据机动车维修企业购入的上述大型配件出库记录结合实地查看方法,查找维修换下的已损坏大型配件,通过约谈等评估方法评估企业是否帐外隐瞒销售。

10、保本点销售额法(仅适合小规模汽修企业)

小规模汽修企业由于帐证不全,很难使用以上评估方法对其评估,可以选择保本点销售额法评估其收入。

保本销售额=各项经营费用合计÷(1-毛利率35%)

纳税人各项经营费用支出包括工资、房租、水电费、购进配件、缴纳税款和其他费用等。

**市上海大众汽车特约维修站增值税纳税评估案例

**市上海大众汽车特约维修站属私营企业,增值税一般纳税人,主要经营范围:维修上海大众汽车,税收征管属大丰市国税局第二分局管理,主要原材料为上海大众汽车有限责任公司各种汽车配件,原材料和汽车维修收入适用税率为17%。

2007年8月,根据**市国税局的要求,开展对汽车维修行业部分企业的评估,从省局的监控决策系统中查询,发现**市上海大众汽车特约维修站2006年增值税销售收入2972764.32,申报增值税42616.00,增值税税负1.43%,明显低于市局测算同行业税负5.27%-6.46%,于是该局将该户纳入增值税纳税评估对象。

首先,该局评估人员对该站的财务报表及纳税申报资料进行了分析,发现该企业2006年全年申报抵扣的进项税额462753.95元,折算成存货的申报抵扣金额为2722076元。

其次,评估人员根据汽车维修行业特点,测算零部件采购金额与应发生修理费收入的相关系数为1.60至1.67,即企业每发生1万元零部件采购金额,就应当发生1.6至1.67万元的修理费总收入。由此推算,理论上企业应申报收入为(2722076元-资产负债表期末库存470004.22)*1.60=2252070.77*1.60=3603313.23,与企业实际申报2006年增值税销售收入2972764.32元,相差630548.91元销售收入。

约谈人员根据调查情况拟定了约谈提纲,并通知了该公司法人和财务人员携带有关资料进行约谈,约谈人员请财务人员税负偏低进行举证,公司财务人员解释说,我站由于经营资金缺乏,业务大减,加上我站维修配件均是**市上海大众汽车有限公司配供,价格高于市场价,所以成本高,税负偏低的。接着约谈人员向财务人员说明本行业的平均税负和相关税收政策,要求其自查申报。

约谈后,公司进行了自查申报,原来,该站经营不景气,出现财务混乱,有部份维修收入被维修人员收取,未入帐2006年12月份少记销售收入591256元,少报增值税100513.52元,购进抵扣税款真实。企业人员认识到问题的严重,主动将少缴的税款自查申报和补缴,并表示以后要加强税务知识的学习。

第四篇:机器学习中关于模型评估方法总结

1 模型评估

我们在建立模型之后,接下来就要去评估模型,确定这个模型是否有用。 在实际情况中,我们会用不同的度量去评估我们的模型,而度量的选择取决于模型的类型和模型以后要做的事。

1.1 二分类评估

二分类模型的评估。

1.1.1 业界标准叫法

二分类评估;分类算法。

1.1.2 应用场景

信息检索、分类、识别、翻译体系中。

1.1.2.1 新闻质量分类评估 对于新闻APP,其通过各种来源获得的新闻,质量通常良莠不齐。为了提升用户体验,通常需要构建一个分类器模型分类低质新闻和优质新闻,进而进行分类器的评估。

1.1.2.

2垃圾短信分类评估 垃圾短信已经日益成为困扰运营商和手机用户的难题,严重影响人们的生活、侵害到运营商的社会公众形象。 构建二分类器模型对垃圾短信和正常短信进行分类,并进行二分类评估。

1.1.3 原理

1.1.3.

1混淆矩阵 混淆矩阵(Confusion Matrix)。来源于信息论,在机器学习、人工智能领域,混淆矩阵又称为可能性表格或错误矩阵,是一种矩阵呈现的可视化工具,用于有监督学习,在无监督学习中一般叫匹配矩阵。 混淆矩阵是一个N*N的矩阵,N为分类(目标值)的个数,假如我们面对的是一个二分类模型问题,即N=2,就得到一个2*2的矩阵,它就是一个二分类评估问题。 混淆矩阵的每一列代表预测类别,每一列的总数表示预测为该类别的数据的数目,每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的实例的数目。

图1 2*2混淆矩阵图

阳性(P,Positive): 阴性(N,Negative):

真阳性(TP,True Positive):正确的肯定,又称“命中”(Hit);被模型预测为正类的正样本。

真阴性(TN,True Negative):正确的否定,又称“正确拒绝”(correct rejection),被模型预测为负类的负样本。

伪阳性(FP,false Positive):错误的肯定,又称“假警报”(false alarm);被模型预测为负类的正样本。

伪阴性(FN,false Negative):错误的否定,又称“未命中”(miss);被模型预测为正类的负样本。

灵敏度(Sensitivity)或真阳性率(TPR,Ture Negative Rate):又称“召回率”(recall)、命中率(Hit Rate)。在阳性值中实际被预测正确所占的比例。TPR=TP/P=TP/(TP+FN) 伪阳性率(FPR,false positive rate):又称“假正类率”、“错误命中率”、“假警报率”。FPR=FP/(FP+TN) 特异度(SPC,Specificity)或真阴性率:在阴性值中实际被预测正确所占的比例。SPC=TN/N=TN/(FP+TN)=1-FPR 假发现率(FDR,false discovery rate):FDR=FP/(FP+TP)=1-TPR 准确度(ACC):预测正确的数占样本数的比例。ACC=(TP+TN)/(P+N) 阳性预测值(PPV,positive predictive value)或精度(precision):阳性预测值被预测正确的比例。PPV=TP/(TP+FP) 阴性预测值(NPV,negative predictive value):阴性预测值被预测正确的比例。NPV=TN/(TN+FN)

图2 一个模型的2*2混淆矩阵图示例

我们可以看出,这个模型的准确度是88%,阳性预测值比较高而阴性预测值较低,对于灵敏度和特异度也是相同。这是因为我们选的阈值导致的,若我们降低阈值,这两对数值就会变得接近。 1.1.3.2 ROC曲线 ROC曲线(Receiver Operation Characteristic Curve),中文名叫“接受者操作特征曲线”,其实是从混淆矩阵衍生出来的图形,其横坐标是Specificity(特异度),纵坐标是Sensitivity(灵敏度)。

图3 ROC曲线图

随着阈值的减小,更多的值归于正类,敏感度和特异度也相应增加。而那条45度线是一条参照线,ROC曲线要与这条参照线比较。 如果我们不用模型,直接把客户分类,我们得到的曲线就是这条参照线,然而,我们使用了模型进行预测,就应该比随机的要好,所以,ROC曲线要尽量远离参照线,越远,我们的模型预测效果越好。 ROC曲线反映了错误命中率和灵敏度之前权衡的情况,即灵敏度随着错误命中率递增的情况下,谁增长的更快,快多少。灵敏度增长的越快,曲线越往上屈,反映了模型的分类性能越好。当正负样本不平衡时,这种模型评价方式比起一般的精确度评价方式好处尤为明显。

ROC曲线快速爬向左上,表示模型准确预测数据。 一般情况下,ROC曲线都应该处于参照线的上方。 1.1.3.

3AUC(ROC曲线下面积 Area Under ROC Curve)

图3 AUC曲线图

ROC曲线是根据与45度参照线比较判断模型的好坏,但这只是一种定性的分析,如果需要定量的计算判断,就用到了AUC,即:ROC曲线下面积。 参考线的面积是0.5,ROC曲线越往左上方靠拢,AUC就越大(这里的面积是0.869),模型评估的性能越好,完美分类的AUC值是1。 1.1.3.

4基尼系数 基尼系统经常用于分类问题,公式:Gini=2*AUC-1。基尼系数大于60%,就算好模型。 1.1.3.5

LIFT(提升)

图3 LIFT提升图

LIFT=(TP/(TP+FP))/((TP+FN)/(TP+FN+FP+TN)) LIFT越大,模型的预测效果越好。LIFT值应一直大于1,如果LIFT值等于1,模型就没有任何提升了。 横轴是预测为正例的比例,即:(TP+FN)/(TP+FN+FP+TN) 1.1.3.6

Gains(增益)

图3 Gains增益图

与LIFT类似,区别在于纵轴的刻度不同,横轴相同。Gains= TP/(TP+FP)=LIFT*((TP+FN)/(TP+FN+FP+TN))

1.1.3.7

K-S(Kolmogorov-Smirnov chart)图 K-S图是用来度量阳性和阴性分类区分程度的。若我们把总体严格按照阳性和阴性分成两组,则K-S值为100,如果我们是随机区分阳性和阴性,则K-S值为0。所以,分类模型的K-S值在0到100之间,值越大,模型表现越好。

1.2 多分类评估

多分类模型的评估。

1.2.1 业界标准叫法

多分类评估。

1.2.2 应用场景

1.2.2.

1商品图片分类 淘宝、京东等电商含有数以百万级的商品图片,“拍照购”等应用必须对用户提供的商品图片进行分类。

1.2.3 原理

同1.1.3节。

1.2.3.1 混淆矩阵 如果有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵如下:

每一行之和为50,表示50个样本。第一行说明类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3。 第一行第一列中的43表示有43个实际归属第一类的实例被预测为第一类,同理,第二行第一列的2表示有2个实际归属为第二类的实例被错误预测为第一类。

1.2.4 不同应用场景使用的方法及参数

1.2.4.1 混淆矩阵

混淆矩阵一般只能用于分类输出模型中。

对于混淆矩阵,一般情况下,我们只关心其中一个定义度量。例如:在医药公司,一般会更加关心最小化误诊率,也就是高特异度。而在磨损模型中,我们更关心的是灵敏度。 1.2.4.

2ROC和AUC曲线 ROC曲线的一个应用场景是在人脸检测中,很多相关的研究或者企业评价他们的检测性能程度是通过ROC曲线来评定的。

ROC和AUC曲线常被用来评价一个二值分类器的优劣。

1.3 Spark模型预测

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。是一种计算框架。

1.3.1 业界标准叫法

Spark。

1.3.2 应用

1.3.2.1 腾讯社交广告平台—广点通 广点通是最早使用Spark的应用之一。腾讯大数据精准推荐借助Spark快速迭代的优势,围绕“数据+算法+系统”这套技术方案,实现了在“数据实时采集、算法实时训练、系统实时预测”的全流程实时并行高维算法,最终成功应用于广点通pCTR投放系统上,支持每天上百亿的请求量。 基于日志数据的快速查询系统业务构建于Spark之上的Shark,利用其快速查询以及内存表等优势,承担了日志数据的即席查询工作。在性能方面,普遍比Hive高2-10倍,如果使用内存表的功能,性能将会比hive快百倍。

1.3.2.2 Yahoo—Audience Expansion(读者扩张) Yahoo将Spark用在Audience Expansion中的应用。Audience Expansion是广告中寻找目标用户的一种方法:首先广告者提供一些观看了广告并且购买产品的样本客户,据此进行学习,寻找更多可能转化的用户,对他们定向广告。Yahoo采用的算法是logistic regression。同时由于有些SQL负载需要更高的服务质量,又加入了专门跑Shark的大内存集群,用于取代商业BI/OLAP工具,承担报表/仪表盘和交互式/即席查询,同时与桌面BI工具对接。目前在Yahoo部署的Spark集群有112台节点,9.2TB内存。 1.3.2.3 淘宝—搜索和广告业务 阿里搜索和广告业务,最初使用Mahout或者自己写的MR来解决复杂的机器学习,导致效率低而且代码不易维护。淘宝技术团队使用了Spark来解决多次迭代的机器学习算法、高计算复杂度的算法等。将Spark运用于淘宝的推荐相关算法上,同时还利用Graphx解决了许多生产问题,包括以下计算场景:基于度分布的中枢节点发现、基于最大连通图的社区发现、基于三角形计数的关系衡量、基于随机游走的用户属性传播等。

1.3.2.4 优酷土豆—视频推荐和广告业务 优酷土豆在使用Hadoop集群的突出问题主要包括:第一是商业智能BI方面,分析师提交任务之后需要等待很久才得到结果;第二就是大数据量计算,比如进行一些模拟广告投放之时,计算量非常大的同时对效率要求也比较高,最后就是机器学习和图计算的迭代运算也是需要耗费大量资源且速度很慢。 最终发现这些应用场景并不适合在MapReduce里面去处理。通过对比,发现Spark性能比MapReduce提升很多。首先,交互查询响应快,性能比Hadoop提高若干倍;模拟广告投放计算效率高、延迟小(同hadoop比延迟至少降低一个数量级);机器学习、图计算等迭代计算,大大减少了网络传输、数据落地等,极大的提高的计算性能。目前Spark已经广泛使用在优酷土豆的视频推荐(图计算)、广告业务等。

1.3.3 原理

1.3.3.

1Spark生态圈 如下图所示为Spark的整个生态圈,最底层为资源管理器,采用Mesos、Yarn等资源管理集群或者Spark自带的Standalone模式,底层存储为文件系统或者其他格式的存储系统如Hbase。Spark作为计算框架,为上层多种应用提供服务。Graphx和MLBase提供数据挖掘服务,如图计算和挖掘迭代计算等。Shark提供SQL查询服务,兼容Hive语法,性能比Hive快3-50倍,BlinkDB是一个通过权衡数据精确度来提升查询晌应时间的交互SQL查询引擎,二者都可作为交互式查询使用。Spark Streaming将流式计算分解成一系列短小的批处理计算,并且提供高可靠和吞吐量服务。

图4 spark生态圈图

1.3.3.2 Spark运行框架

图5 spark运行框架图

Spark的运行框架首先有集群资源管理服务(Cluster Manager)和运行作业任务节点(Worker Node),然后就是每个应用的任务控制节点Driver和每个机器节点上有具体任务的执行进程。 与MR计算框架相比,Executor有二个优点:一个是多线程来执行具体的任务,而不是像MR那样采用进程模型,减少了任务的启动开稍。二个是Executor上会有一个BlockManager存储模块,类似于KV系统(内存和磁盘共同作为存储设备),当需要迭代多轮时,可以将中间过程的数据先放到这个存储系统上,下次需要时直接读该存储上数据,而不需要读写到hdfs等相关的文件系统里,或者在交互式查询场景下,事先将表Cache到该存储系统上,提高读写IO性能。另外Spark在做Shuffle时,在Groupby,Join等场景下去掉了不必要的Sort操作,相比于MapReduce只有Map和Reduce二种模式,Spark还提供了更加丰富全面的运算操作如filter,groupby,join等。 1.3.3.3 Spark与hadoop

 Hadoop有两个核心模块,分布式存储模块HDFS和分布式计算模块Mapreduce  spark本身并没有提供分布式文件系统,因此spark的分析大多依赖于Hadoop的分布式文件系统HDFS  Hadoop的Mapreduce与spark都可以进行数据计算,而相比于Mapreduce,spark的速度更快并且提供的功能更加丰富 1.3.3.4 Spark运行流程

图5 spark运行流程图

1. 构建Spark Application的运行环境,启动SparkContext。 2. SparkContext向资源管理器(可以是Standalone,Mesos,Yarn)申请运行Executor资源,并启动StandaloneExecutorbackend。 3. Executor向SparkContext申请Task。 4. SparkContext将应用程序分发给Executor。

5. SparkContext构建成DAG图,将DAG图分解成Stage、将Taskset发送给Task Scheduler,最后由Task Scheduler将Task发送给Executor运行。

6. Task在Executor上运行,运行完释放所有资源。 1.3.3.5 Spark运行特点

1. 每个Application获取专属的executor进程,该进程在Application期间一直驻留,并以多线程方式运行Task。这种Application隔离机制是有优势的,无论是从调度角度看(每个Driver调度他自己的任务),还是从运行角度看(来自不同Application的Task运行在不同JVM中),当然这样意味着Spark Application不能跨应用程序共享数据,除非将数据写入外部存储系统。 2. Spark与资源管理器无关,只要能够获取executor进程,并能保持相互通信就可以了。

3. 提交SparkContext的Client应该靠近Worker节点(运行Executor的节点),最好是在同一个Rack里,因为Spark Application运行过程中SparkContext和Executor之间有大量的信息交换。 4. Task采用了数据本地性和推测执行的优化机制。

1.4 回归评估

对回归模型的评估。

1.4.1 业界标准叫法

回归模型评估。

1.4.2 应用

1.4.3 原理及方法

1.4.3.1

均方根误差(Root Mean Squared Error,RMSE) RMSE是一个衡量回归模型误差率的常用公式。 然而,它仅能比较误差是相同单位的模型。

1.4.3.2

相对平方误差(Relative Squared Error,RSE) 与RMSE不同,RSE可以比较误差是不同单位的模型。

1.4.3.3

平均绝对误差(Mean Absolute Error,MAE) MAE与原始数据单位相同, 它仅能比较误差是相同单位的模型。量级近似与RMSE,但是误差值相对小一些。

1.4.3.4

相对绝对误差(Relative Absolute Error,RAE)

1.4.3.5

相对绝对误差(Coefficient of Determination)

决定系数 (R2)回归模型汇总了回归模型的解释度,由平方和术语计算而得。 R2描述了回归模型所解释的因变量方差在总方差中的比例。R2很大,即自变量和因变量之间存在线性关系,如果回归模型是“完美的”,SSE为零,则R2为1。R2小,则自变量和因变量之间存在线性关系的证据不令人信服。如果回归模型完全失败,SSE等于SST,没有方差可被回归解释,则R2为零。

1.4.3.6 标准化残差图(Standardized Residuals Plot) 标准化残差图是一个对在标准化尺度上显示残差分散图有帮助的可视化工具。标准化残差图与普通残差图之间没有实质不同,唯一区别是在Y轴的标准化可以更容易检测到潜在的异常值。

第五篇:增值税纳税评估部分方法及行业纳税评估指标(试行)

增值税纳税评估部分方法及

行业纳税评估指标

(试行)

第一部分 增值税纳税评估部分方法

一、税负对比分析法

税负即税收负担率,是应纳税额与课税对象的比率,它比较直观地体现了一个企业实现税收的能力和负担水平。行业内全部企业的应纳税总额与课税对象总额之比,即行业税负。

行业税负反映了行业内企业的总体负担水平。行业中单个企业的税负在一定时期内对行业税负的背离,造成企业税负与行业税负的差异。而税负对比分析法是税务部门对企业税负背离行业税负进行有效监控的方法之一。它是通过企业税负与行业税负的对比,对税负异常的企业围绕关联指标展开分析,以发现企业税收问题的一种方法。

税负对比分析法的适用范围很广,基本上对所有行业均可适用。 模型:

税负差异率=(企业税收负担率-行业税收负担率)÷行业税收负担率×100% 税负对比分析法属于综合分析法,影响因素较多,涉及税基的多个方面。因此,用该法发现企业税负异常时,应结合其他分析方法进行多角度分析。

需要注意的几个问题:(1)季节性因素。企业生产经营受季节的影响变化,本期进入销售淡季,造成应税销售收入降低,同时,为销售旺季准备生产,购进货物大幅增加,造成购销失衡等。(2)政策性因素。出口企

业本期出口销售额占销售总额的比例突然增加,直接免抵税额增加,应纳税额减少,税负降低。(3)价格因素。受市场竞争影响,企业经营的货物价格本期大幅度下降,增值额减少,税负降低。(4)经营范围发生较大变化等特殊情况。

二、工业增加值评估

(一)应纳税额与工业增加值弹性评估模型与评估方法

1.应纳税额与工业增加值弹性评估模型

应纳税额与工业增加值弹性系数应纳税额增长率 其中:

工业增加值增长率应纳税额增长率当期应纳税额基期应纳税额100%

基期应纳税额当期工业增加值基期工业增加值100%

基期工业增加值

工业增加值增长率 2.评估方法

工业增加值是指工资、利润、折旧、税金的合计。一般情况下,应纳税额与工业增加值弹性系数为 1 ,对弹性系数<1的,可根据造纸行业一定时期的发展状况,确定一定区间作为预警值。弹性系数小于预警值,则企业可能有少缴税金的问题。应通过其他相关纳税评估指标与评估方法,并结合纳税人生产经营的实际情况进一步分析,对其申报真实性进行评估。

(二)工业增加值税负评估模型与评估方法 1.工业增加值税负评估模型

工业增加值税负差异率=〔本企业工业增加值税负÷同行业工业增加值税负〕×100%。其中:

本企业工业增加值税负=本企业应纳税额÷本企业工业增加值

同行业工业增加值税负=同行业应纳税额总额÷同行业工业增加值

2.评估方法

应用该指标分析本企业工业增加值税负与同行业工业增加值税负的差异,如低于同行业工业增加值平均税负,则企业可能存在隐瞒收入、少缴税款等问题,结合其他相关评估指标和方法进一步分析,对其申报真实性进行评估。

三、投入产出法

投入产出法,就是根据企业评估期实际投入原材料、辅助材料、包装物等的数量,按照确定的投入产出比(定额)测算出企业评估期的产品产量,结合库存产品数量及产品销售量、销售单价测算分析纳税人实际产销量、销售收入,并与纳税人申报信息进行对比分析的方法。

投入产出法主要适用于产品相对较为单一的工业企业。由于测算、分析侧重的内容和角度不同,不同的行业适用的投入产出测算指标和模型不同,以及投入产出表现形式的不同,分析的方法也不尽相同,如按其表现形式可分为投入产出比、单位产品定耗的分析;按其侧重面的不同可分为原材料投入产出比、废料的产出及再利用率、单位产品辅助材料(包装物)耗用定额的分析等。

(一)投入产出比模型:

测算应税销售收入=(期初库存产品数量+评估期产品数量-期末库存产品数量)×评估期产品销售单价

评估期产品数量=当期投入原材料数量×投入产出比

问题值=(测算应税销售收入-企业实际申报应税销售收入)×适用税率(征收率)

应用中该模型的分析重点是:根据已确定的行业或产品的投入产出比及企业评估期原材料的耗用数量,测算出产品生产数量,与企业账面记载产品产量相比对,同时结合产品库存数量及销售单价等信息进行关联测算,并与企业实际申报的应税销售收入对比,查找企业可能存在的问题。

(二)单位产品定耗模型的应用

测算应税销售收入=(期初库存产品数量+评估期产品数量-期末库存产品数量)×评估期产品销售单价

评估期产品数量=评估期原材料或包装物耗用量÷单位产品耗用原材料或包装物定额

问题值=(测算应税销售收入-企业实际申报应税销售收入)×适用税率(征收率)

该方法是通过单位产品耗用原材料定额指标,评估产品实际产量和销售额,进而评估出纳税人是否存在有隐瞒销售收入的问题。单位产品耗用原材料定额可以根据产品配方中的定额直接确定。单位产品定耗既可以是单位产品耗用原材料定额,也可以是单位产品耗用辅助材料和包装物定额等。分析应用时要灵活运用,关联分析,及时查找企业可能存在的线索和问题。

需要注意的几个问题:(1)注意测算分析和实地调查相结合。对测算分析结果,必须深入调查,从企业仓库保管、库存明细账目、辅助材料、包装物耗用等多方面印证、分析,查找线索;(2)注意模型中指标的计量单位,特殊情况下必须进行单位换算,以免出现错误;(3)对农副产品收购、废旧物资收购等企业可利用该法关联分析收购发票开具的真实性。

四、能耗测算法

能耗测算法主要是根据纳税人评估期内水、电、煤、气、油等能源、动力的生产耗用情况,利用单位产品能耗定额测算纳税人实际生产、销售数量,并与纳税人申报信息对比、分析的一种方法。其中耗电、耗水等数据可从电力部门、自来水公司等取得核实,相对较为客观。

该分析方法广泛应用于工业企业。对账务核算不健全、材料耗用情况难以估算,但可从第三方取得客观能耗信息的小规模企业或个体工商户同样适用。

评估模型:

评估期产品产量=评估期生产能耗量÷评估期单位产品能耗定额 评估期产品销售数量=评估期期初库存产品数量+评估期产品产量-评估期期末库存数量

评估期销售收入测算数=评估期产量×评估期产品销售单价×适用税率(征收率)

问题值=(测算应税销售收入-企业实际申报应税销售收入)×适用税率(征收率)

此法就是根据生产耗用的电力、水、煤、气等能量耗用定额指标,测算产品产量,进而测算其销售额和应纳税额,与申报信息进行对比分析,查找企业纳税疑点和线索的方法。

需要注意的几个问题:(1)正常的企业非生产性(办公照明、空调使用等)用电占比例很小,可以忽略不记。但对差异额较大的,应分析是否存在隐瞒产量,少计销售收入的可能,是否存在将电转售其他企业或用于非应税项目等情况,少计其他业务收入或多抵进项情况;对需要由电费推算用电量的,应考虑扣除企业缴纳的基本电费。(2)应加强同当地电业管理部门、自来水公司等单位的联系,核实企业用电、水量等数据的真实性。同时,要求纳税人申报时向主管税务机关提供电力、自来水发票复印件;或利用金税工程中供电系统的抄税信息核实。(3)在实际分析中,应选取企业生产经营中最具客观实在性、企业不易人为改变、不易隐瞒、便于收集、纳税评估可操作性强的指标。对能耗指标的分析应用,应充分考虑企业生产设备、生产工艺、工人熟练程度等因素的影响。指标的运用不可生搬硬套,应因地制宜,根据当地实际选用或增设辅助指标,确定科学、合理的参考系数,多个指标并用,便于发现问题和疑点。

五、工时(工资)耗用法

工时耗用法是指在单位产品耗用生产时间基本确定的前提下,按照纳税人在一定时期耗用工时总量,分析、测算该时期内的产品产量及销售数量或销售额,并与申报信息对比分析的方法,工资耗用是生产耗用工时反映在货币上的金额表现。该方法主要适用于单位产品耗用工时或者工资基本稳定,工资或工时记录完整、核算规范的工业企业。

由于工时在纳税人的账面不反映,不易于收集。工时往往反映在工资上。这部分工资仅仅指生产一线工人的工资,即生产成本中的直接人工成本部分,可以在会计核算健全的纳税人账簿、凭证中直接反映。

评估模型:

评估期产品产量=评估期生产人员工时总量(工资总额)或某一主要生产环节工时总量(工资总额)÷单位产品耗用工时(或者工资)

测算应税销售收入=(期初库存产品数量+评估期产品产量-期末库存产品数量)×评估期产品销售单价

问题值=(测算应税销售收入-企业实际申报应税销售收入)×适用税率(征收率)

该方法主要是通过生产耗用的工时或者工资测算产品产量,进而测算其销售额和应纳税额,并与申报信息进行对比分析,查找纳税疑点和线索。

需要注意的几个问题:(1)企业的生产工时(工资)标准或者关键生产环节工时(工资)标准应相对稳定,相关数据应易于收集和计算;(2)参考当地同行业或规模、效益相近企业的生产工时(工资)标准,便于税企双方工时(工资)标准的共同认可;(3)生产工时总量(工资总额)的所属期要与生产产品的所属期配比。

六、设备生产能力法

设备生产能力法是指主要生产设备在原料、动力和人员等正常运转下产出的能力。可分为设计生产能力和实际生产能力。设计生产能力指按照国家标准生产或引进的设备,经过国家有关部门审验、认可的标准性生产能力。实际生产能力是指设备在实际运转时的生产能力。在一般情况下,设备的实际生产能力与设计生产能力有一定出入。随着各个行业国标、强制性国标及行业管理标准的出台和完善,设备的实际生产能力越来越接近设计生产能力。

设备生产能力法就是按照纳税人投入生产的单位设备生产能力,测算、分析纳税人的实际生产量,进而核实应税销售收入,并与纳税人申报信息对比、分析是否存在涉税问题的方法。该方法主要适用于一些特定的行业,如造纸业、水泥制造业、微粉、发电等行业。该方法与其他分析方法结合使用,效果会更好。

评估模型:

评估期产品产量=评估期若干设备的日产量或时产量×评估期正常工作日或工作时

测算应税销售收入=(期初库存产品数量+评估期产品产量-期末库存产品数量)×评估期产品销售单价

问题值=(测算应税销售收入-企业实际申报应税销售收入)×适用税率(征收率)

该方法通过设备生产能力、生产耗用的时间测算产品的生产量,进而测算其销售额和应纳税额,并与申报信息进行对比分析,查找涉税疑点和线索。

需要注意的几个问题:(1)设备生产能力可从随机文件中得到。随机文件包括产品说明书、合格证、装箱单等。产品说明书对了解和掌握纳税人的设备生产能力较为重要;(2)实地查看时要注意正确区分设备的规格、型号、数量和生产能力;(3)设备生产能力一般有幅度,要结合企业实际情况进行掌握。

上一篇
下一篇
返回顶部