导航菜单

利用数据挖掘技术构建基于审计数据仓库的商业银行新型审计模型

摘要:商业银行的快速发展,并建立了全国性集中式计算机数据处理中心和网络系统,给金融审计工作带来了挑战与机遇,利用数据挖掘技术建立基于审计数据仓库的新型审计模型,为商业银行审计工作提供了有利契机。

教育期刊网 http://www.jyqkw.com
关键词 :数据挖掘技术;审计数据仓库;审计模型

随着金融行业的快速发展,商业银行不断推出新产品和新服务,自助银行、电子银行等业务方便了客户使用。国有的工、农、中、建四大商业银行实现了三集中,即所有营业网点集中联网、会计账务集中处理、客户基本信息集中管理,建立全国性集中式的计算机数据处理中心和网络系统,数据仓库逐步建立完善。三集中方便了银行的管理工作,也给审计工作带来了机遇与挑战。使用原有的计算机审计模型,面对数据仓库中的海量数据,对于审计线索的发现如同大海捞针般困难。如果能够利用数据挖掘技术则可以利用银行建立的数据仓库,这一有利条件是发展商业银行审计的契机。由此可见利用数据挖掘技术构建基于数据仓库的新型审计模型对于商业银行审计工作尤为重要。

一、现有的计算机审计模型结构

随着信息技术的发展,其在审计过程中的应用是从利用Excel表格解决计算量大的问题开始的, 其后使用了Access数据库软件,如今更多利用的是多维分析技术嵌入数据库, 其计算机审计结构如下图所示:

整个计算机审计结构一般分为四层: 数据源, 数据库,审计分析模块,结果展示界面。这四层结构中数据源是基础,数据库从数据源中采集数据,存储并转换格式,其后审计人员依据经验开发小型的审计分析模块,利用SQL 查询语言、Excel 的统计功能等计算机技术发现审计线索,利用可视化工具、打印机等呈现审计结果。

二、现有的计算机审计模型在应用过程中存在的不足

从上述四层结构来看,从数据源提取数据组建数据库环节,由于数据源的组成较为复杂,不仅有来自于被审计单位内部的数据,还有来自于外部相关单位、网络等等不同质的数据,数据采集组建数据库的过程仅限于将这些数据提取出来,转换成统一格式,忽视了数据质量,这样的简单提取过程造成数据库中存在冗余的或者错误的数据,数据库中的质量不佳。

在进一步的审计分析环节,被审计单位的报表、会计凭证这些账项仍然是审计的主要对象,是获取审计证据的主要方式,虽然审计人员根据经验开发一些小型的审计分析模块,调用数据库中的数据,但这些分析模块的目的是为了发现报表存在的问题,是从局部的数据考虑的而非全局性考虑。

另外,如此反复进行的局部数据调用会使数据库中存在大量的操作性数据,审计人员为了释放存储空间,又会根据经验判断哪些是无价值数据并进行删除,如果经验出错就会导致审计证据不足不具连续性,出现错误的审计结果。

最后,在这种四层结构的计算机审计模型上不利于数据挖掘技术的使用。应用数据挖掘技术其所要求的数据应是规则的、面向主题的,在这种结构下如果使用数据挖掘技术,就会要求审计人员每进行一次审计分析就要对从数据库中提取的数据再进行一次处理,大大减低了审计效率,增加审计难度。

总之,已有的计算机审计模型所能提供的审计功能具有局限性,尤其是面对商业银行这样数据量庞大的金融企业审计,它限制了金融审计的发展,迫切需要开发新型的计算机审计模型,解决现有的问题,提高审计效率,减低审计风险,推动金融审计的快速发展。

三、对现有的计算机审计模型的改进措施

首先,建立相对独立的数据收集系统,收集被审计单位有关的历史和现实的各种数据,并进行初步处理,改善数据质量,更重要的是建立数据仓库以替代传统的数据库,数据库侧重于数据的简单存储、分析与查询,而数据仓库将分析性数据和操作型数据进行分离,更侧重与数据的综合分析。数据仓库按照审计主题进行数据组织,其存储的数据会随时更新,具有高度集中和相对稳定的特点。

其次,研发各类数据挖掘算法,即将数据挖掘技术应用到审计分析系统中,根据不同的审计分析要求,采用不同的审计分析工具,选用合适的数据挖掘模块深入底层数据进行分析,而不是利用经验对报表、账项进行分析。

最后,为了解决数据的重复与冗余问题,可以将经过数据挖掘后产生的结果进行存储再利用,以提高审计效率。

四、采用数据仓库与数据挖掘技术构建新型商业银行计算机审计模型

基于上述内容的分析,商业银行已经初步建立了数据仓库,对于构建基于数据仓库与利用数据挖掘技术的新型计算机审计模型具备了有利条件,由于笔者所学领域的限制只能提出构建模型,具体程序的编写开发尚需专业人士去不断完善,也是本文的不足之处。

本文设计的新型计算机审计模型如下图所示:

该模型的主要组成部分包括:

(一)信息收集系统

审计人员利用信息收集系统收集被审计单位基础数据源,针对于商业银行基础数据中的内部数据来源于商业银行集中的数据库,外部数据则包括与审计范围和内容相关的外部单位信息,除此之外信息收集系统负责将外部数据转换成与内部数据相一致的类型。外部数据的收集采用直接录入的方式或者从移动存储器中导入的方式,也往往会用到例如MicrosoftSQLServer2000 中的数据转换工具。

(二)审计数据仓库

审计数据仓库是按照不同的审计主题对信息收集系统提取的信息再次加工,这个过程会包括数据的清理、转换、存储等方式。要明确一点的是审计数据仓库并没有改变被审计单位的原有数据仓库,是独立于被审计单位数据库之外的,服务于审计工作。这一点对于商业银行的审计工作尤为重要,审计数据仓库的建立不会造成商业银行业务系统的承载负担与运行风险。同时审计数据仓库不是一次性的,应具有可扩充功能和更新功能。以商业银行信贷风险审计为例,可按照贷款业务作为审计主题,需描述正常贷款金额、不良贷款金额、贷款性质、贷款客户单位代码、行业性质、经营规模、贷款期限、还款方式、担保方式等等内容,将这些数据导入到审计数据仓库中,形成不同的审计中间表,这些表格可以按照审计人员的需求设计成二维表或者多维数据集,以多角度、多层次、多种形式展现到审计人员面前,为后续的审计工作提供方便。

(三)审计分析系统

在接下来的审计分析系统中除了包括传统的简单分析、查询工具和多维分析工具外,更重要的是利用数据挖掘技术形成数据仓库。在这里充分利用数据挖掘技术的多种算法如统计分析法、决策树法、人工神经网络法、关联规则法,建立不同的数据挖掘模块,此部分模块的建立需要结合审计人员、计算机人员与数据挖掘技术人员的知识能力,形成计算机程序下的固定算法模块,不同算法下形成不同的数据仓库并分别存储。这些存储的数据能够给审计人员提供出有价值的规则,指导其快速发现审计线索。如上述商业银行信贷审计中,从众多贷款客户中发现不良贷款客户困难很大,采用数据挖掘技术可以建立不同的字段统计出该字段下的比例,如企业经营结果、贷款类别、借款用途、信用度等字段,根据比例发现规律,有针对性的排查。换言之数据挖掘技术是能够从海量数据中找寻规律,便于审计人员评估风险、评估客户或者简单地对审计数据进行描述和解释。

(四)审计结果呈现

审计结果呈现的主要作用就是利用可视化技术将审计分析系统形成的结果展示出来,形成审计报告,具体评价被审计单位。

这种计算机审计模型的优点在于,建立数据收集系统,提高审计数据质量,按照审计主题建立审计数据仓库,减少被审计单位业务系统的承载压力和风险,利用数据挖掘技术、多维分析技术等进行审计分析,提高审计效率,减少审计人员的工作量,为审计提供便利。

基金项目:

本课题内容为2013年度河北省审计厅重点研究课题,项目审批号:201326。

教育期刊网 http://www.jyqkw.com
参考文献:

[1]曾德胜,彭灿明,陈源,张新林.基于数据挖掘的审计系统研究[J].长春工程学院学报(自然科学版), 2011年第1期.

[2]文勇.数据挖掘技术在风险导向审计中的应用[J].财会通讯:综合(上),2013年第5期.

[3]刘莎,杨会朴.基于数据挖掘技术在金融审计中的应用[J].合作经济与科技,2013年第6期.

(作者单位:中国地质大学长城学院经济系)

下载文本