数据分析助推经济责任审计提升效率

发布时间:2018-02-28
来源:
浏览次数:
字体大小

邹彩辉

  

编者按

经济责任审计是对领导干部权力运用进行监督的重要方式,在实施经济责任审计的过程中必须围绕领导人员的经济决策和权力运行轨迹,有针对性地确定审计内容和重点,这就要求审计人员对被审计单位的会议纪要、收发文、领导签批等文件资料进行审阅分析,从而判断筛选审计内容和重点。而这些文件的数目可谓是大量甚至是海量,如何明确目标减少文件阅读量缩小范围提高审计效率成为亟待解决的问题。

在对W同志任F集团有限公司(以下简称“F集团”)董事长、党委书记期间进行经济责任审计的过程中,审计人员根据行业特点、领导人员履行经济责任情况,结合广州中赢财富信息科技有限公司的文档分析工具,对被审单位的收发文、工作呈批等进行归类搜索及快速预览,从海量文档中初步筛选出有效数据进行审阅分析,从而达到缩小范围、提高审计效率的目标。

 

一、项目具体实施过程

(一)数据采集

1.系统介绍:F集团使用京华网络有限公司的《京华ExOA协同系统》,系统为B/SJ2EE架构,服务器为Linux系统,客户端为Windows系统,数据库为Oracle。系统在发展集团内40个单位使用,用户数量超过5200个。系统有公文操作、公文办理、表单智能、Word正文、任务管理、信息发布、综合管理等功能,设置了发文、收文、工作事项呈批、用车申请等板块,涵盖集团日常管理工作的方方面面。

2.采集需求:根据前期了解分析,审计人员确定发展集团OA系统中发文、收文、工作事项呈批板块的文档是审计需要的。但按照《京华ExOA协同系统》的设计,OA系统内全集团所有公司文档备份是统一存放,无法按公司或文档板块采集所需文档,据此审计人员要求发展集团提供W同志任期内所有文档备份。

3.采集数据量:采集文档201GB343077

(二)数据整理

采集的文档涵盖了发展集团内40个公司的所有板块,文档以“文档代码+日期/流水号”、“文档代码+流水号+日期+流水号”等多种方式命名(如:attach_971106_201210291311251),文档格式包括DOCEXCELPPTPDFZIPRAR等。因此,审计人员必须对所需文档进行重命名,以便后期的使用分析。

1.文档信息获取:在对OA系统进行分析后,从后台数据库中查询并导出整理文档所需要的相关信息,如文档名、文档格式、文档标题、所属事项、所属板块、创建时间等。

    得出结果如下:

FILE_NAME

CONTENT_TYPE

TITLE

NAME

FORMSET_NAME

CREATE_TIME

draft_1116395

doc

《关于组团出访日本、韩国的批复》预览文件

关于组团出访日本、韩国的批复

F集团发文

02-7 -14 02.25.05.320000 下午

attach_1113412_20141031095358100

docx

A集团关于加强B国际机场燃气供应保障工作的复函

ZG管理委员会关于加强B国际机场燃气供应保障工作的函

F集团收文

19-6 -14 05.11.26.722000 下午

……

 

 

 

 

 

 

2.文档名称转换:

1)在数据库中建表。

2)将文档名清单写入数据库。

3)使用文件名转换工具,对发展集团的文档名称进行转换。转换操作如下:

 

image003

步骤一:点击“转换路径”按钮,选择未转换名称的文件目录(选择文件夹);

步骤二:点击“输出路径”按钮,选择需要存放已转换名称的文件目录(选择文件夹);

步骤三:点击“转换文件”按钮后,自动完成文件名称转换。转换后的文件以“分类_事项_文件名.扩展名”方式命名。

3.转换后数据量:23.8G, 文档45981份。

(三)数据分析

1.分析工具介绍:文件分析工具主要是为了实现在海量文件中,快速并精确的找出用户所需要的文件而设计,可对文件名或文件内容通过设置关键字进行搜索。其特点一是速度快,二是支持多种可编辑文档格式,三是支持复杂条件组合。

(1)分析工具初始化设置

布尔表达式匹配设置

在工具中,可对布尔表达式设置为“逐行”或“逐个文件”:“逐行”是指同一组条件只在同一段文字中全部为true才算true;“逐个文件”是指同一组条件在整个文档中全部为true即为true

压缩文件设置

因不能排除部分文档是已压缩文件形式存在,因此勾选所有压缩文件类型,以便工具在分析时可对压缩文件里面的文档进行分析。

(2)分析工具操作说明

image009

搜索条件

文件名称:对文件的名称进行搜索,当符合条件时在2中显示相关文档,一般选用“布尔表达式”或“正则表达式”;

包含文本:对文件的内容进行搜索,当符合条件时在2中显示相关文档一般选用“布尔表达式”或“正则表达式”;

查找位置:要搜索的文件位置,可以是非底层文件夹一般选用“DOS表达式”。

注:文件数量相同时,文件名称搜索速度比文件内容搜索速度快很多,因此文档名称转换的好坏关系到搜索效率。

结果文件

符合上述搜索条件的文件会在此显示。

单击文档:可在右侧查看摘要或预览等;

双击文档:可打开文档;

右键:可复制、剪切、重命名等操作。

快速预览或统计

摘要:可查看本次搜索的摘要;

匹配:可查看符合搜索关键字的段落预览,并高亮关键字,仅对内容搜索有效;

文本:可预览全文,并高亮关键字;

缩略图:用缩略图形式展现文档;

报告:可对本次搜索进行统计。

2.文档分析步骤

步骤一:按文件类别分类

[思路]按收文、发文、呈批的类别对文档进行分类,以便观察分析不同类别的文档特点。

[主要操作] 文档名称搜索:收文

[结果]将已重命名的文档分成收文、发文、呈批三类。收文的文档大部分为不可编辑的图片型PDF等格式文档,而发文、工作呈批等则主要为DOC等可编辑格式文档。

步骤二:对各类文件去附件。

[思路]据分析,无论是收文、发文还是呈批事项均可能形成正文及附件多份文档,审计人员通过审阅正文基本可以获知某事项的主要信息,为迅速快捷获取信息需要对各类别的文件去附件。各类文件夹中,发文类、呈批类中的每一个事项均会形成一份“XXX预览文件”的文档作为正文记录,数据分析人类提取预览文件即可达到去附件的目的;收文类的事项正文没有统一的规律,主要通过文档格式及文档名去除部分附件。

[主要操作]文档名称搜索:预览文件  --发文及呈批类

文档名称搜索:(pdf OR doc OR docx) NOT 附件 ——收文类

[结果]提取出所有发文、呈批事项的正文;收文的正文及部分附件。

步骤三:将步骤二中提取的预览文件分为单一事项类及非单一事项类。

[思路]收文的文档大部分为不可编辑的图片型PDF等格式文档,仅能对文档名称进行分析;而发文、工作呈批等则主要为DOC等可编辑格式文档,可以对文档名称及文档内容进行分析。在发文、工作呈批档中请示、批复类文档一般仅涉及一个或一类事项,只需对其标题进行分析即可快速归类;而会议纪要等文档则可能涉及多个不同方面的事项,需对其文档内容进行分析。

[主要操作一] 文档名称搜索:NOT 纪要 NOT 决议 NOT 工作计划 NOT 工作总结 NOT 工作报告 NOT 工作重点

[结果一]提取发文类及呈批类所有单一事项文档

[主要操作二] 文档名称搜索:纪要 OR 决议 OR 工作计划 OR 工作总结 OR 工作报告 OR 工作重点

[结果二]提取发文类及呈批类非单一事项文档

步骤四:分别对发文及呈批类的单一事项文档、非单一事项文档以及收文类文档进行分析归类

[思路]根据F集团的特点并结合以前的审计结果,审计组确定需要关注的事项类别,根据该类事项可能出现的关键字对文档搜索归类以供后期的审阅分析。审计组确定以下十二类事项:股权类、土地类、资产处置类、招标类、资产核销类、资本金类、融资担保类、收购类、薪酬清算类、项目变更类、项目立项类、行政处罚类。

对收文及呈批类单一事项文档进行分析

[主要操作]文档名称搜索:股权 AND (转让 OR 划转 OR 划出 OR 划入 OR 收购 OR 购入 OR 出售 OR 受让 OR 报价 OR 处置 OR 变更 OR 出质 OR 质押 OR 抵押 OR 竞价 OR 持有)

[结果]提取单一事项文档中属于股权类事项文档

对收文及呈批类非单一事项文档进行分析。

[主要操作]文档内容搜索:股权(转让|划转|划出|划入|收购|购入|出售|受让|报价|处置|变更|出质|质押|抵押|竞价)          --注:此处使用正则表达式

[结果]提取非单一事项文档中属于股权类事项文档

不可编辑类文件分析:

[主要操作]标题搜索:股权 AND (转让 OR 划转 OR 划出 OR 划入 OR 收购 OR 购入 OR 出售 OR 受让 OR 报价 OR 处置 OR 变更 OR 出质 OR 质押 OR 抵押 OR 竞价 OR 调整)  NOT (办法 OR  规定 OR  制度  OR 草稿) NOT (OR _1 OR _2 OR _3 OR _4 OR _5 OR _6 OR _7 OR _8 OR _9)

[结果]提取收文中属于股权类事项文档

3.分析结果

序号

事项

对单一事项的文件

非单一事项

收文

合计

1

股权类

33

24

37

94

2

土地类

14

2

16

32

3

资产处置类

50

12

84

146

4

招标类

400

35

371

806

 

直接委托

 

 

 

57

 

询价(密封报价)

 

 

 

88

 

邀标

 

 

 

108

 

竞争性谈判

 

 

 

139

 

……

 

 

 

 

5

核销类

8

2

11

21

6

资本金类

27

14

31

72

7

融资担保类

75

33

112

220

8

收购类

5

15

6

26

9

薪酬

2

0

3

5

10

项目变更

60

3

75

138

11

项目立项

101

13

142

256

12

处罚处分

13

 

27

40

 

 

788

153

915

1856

 

 

 

 

 

 

 

二、项目成果

审计人员审阅了经过初步筛选出来的12类共1800多份收发文、工作呈批及相关会议记录,通过分析、判断,筛选出76项事项,审计组结合相关资料对其中26个事项跟进审查,发现多个问题:

如在某次会议纪要中,决定同意承接A公司持有的B公司22%股权。经过调查发现,B公司主要负责某项目的建设工作,G集团在该项目未获正式核准的情况下委托B公司启动了该项目的建设工作,并在该项目被“十三五”规划的征求意见稿中撤掉后,仍签订了股权转让协议。201X9月,该项目被国家能源局取消,为该项目已签订合同额达20.52亿元,已支付合同款3.69亿元,潜在损失尚无法估计。此决策实际上是承接了转让方A公司应承担的投资损失。

又如C公司位于某地的土地使用权被政府收回事宜。审计组发现,C公司负责的D公司利用某工程项目未在国有建设用地使用权出让合同约定的日期前开工,致使C公司多次收到国土部门发出的闲置土地调查通知书、闲置土地认定书及听证告书并上报E集团,E集团未向F集团汇报土地存在被回收的风险。由于未能及时传递重要信息,致使未能对风险进行有效控制,购买的16 645平方米土地被国土资源和房屋管理局在2015年无偿收回,造成资产损失627.38万元。

此外,还发现F集团及属下企业多个工程建设项目应公开招标未公开招标、部分工程变更金额或变更比例较大、因建设施工、污染物排放、税款缴交方面政策执行不力被相关部门罚款等问题。

三、经验总结

在经济责任审计中对非结构化数据进行分析,一定程度上可实现对被审计单位收发文、呈批等文档的快速分类及快速预览,从海量文档中初步筛选出可能需要关注的事项文档供审计人员审阅分析,从而达到缩小范围提高审计效率的目标。但目前还存在一些不足之处:一是还不能对图片式PDF等不可编辑文档的内容进行分析;二是不能从文档中识别和提取数字,从而也不能通过事项涉及金额进行判断分析。