1.引言
从上世纪90年代中后期,我国各大商业银行都进入了数据化大集中的时代,数据集中是银行界对技术支持系统的一个改造,同时也是对传统银行业的整体管理理念的彻底再造。银行业经历了金融电子化时代,几乎各项业务都实现了数字化。多数的数据我们无法处理,因此可以说它是垃圾信息,但是并不能肯定它是没有价值的信息。那么许多有用的信息就被我们忽视或者丢弃在那些我们所认为的垃圾数据之中,这就给信息保护埋下了安全隐患。要保护大型数据和信息就有必要将数据挖掘作为信息安全策略的一个方面来进一步维护信息安全。
2.银行业需要重视和保护的信息内容
银行业信息可以认为是在银行的一系列业务发展过程中产生、应用和搜集的各类信息,这些信息是银行业经营和发展的基础。在银行业发展过程中信息安全情况决定其生存和发展的命脉,因此信息保护就成为各类银行发展中所必须重视的一项内容更。银行业信息可以划分为两大类:
2.1显性信息
显性数据主要包括由各类存储媒介保存的数据,包括软盘、硬盘、纸质等保存的文件,这部分资料可以占道银行信息的20%。这类是数据是业务发展所产生和存储的数据,包括账户的开立信息、个人储蓄记录、对公存款记录、贷款资料、贷款合同、还款记录等等。这些信息是可以随时调阅和查找使用的信息。
2.2隐性信息
隐性数据是相对于显性数据而言的,它没有具体的存储介质,比较抽象的但是实在存在的数据。这一类数据主要是柜员、客户经理、中层领导在日常工作中所掌握的隐性的没有量化的信息,这部分资料根据二八原则可占到银行信息的80%。柜员在储蓄柜台办理日常的业务过程中会直接接触到客户,柜员能够掌握经常办理业务的客户对不同产品的青睐和喜好,这也是一类重要的信息。
3.海量数据所造成的信息安全隐患
金融数据大集中之后,数据量增幅很大,以人民银行2009年对银行业务量统计作数据参考:
存储和保护所有数据,因此会有所删减和侧重。数据和信息的概念是不同的,数据是无规则、全描述性的、无具体指向的;而信息是有内容的可为做出经营决策提供参考的资源。银行业拥有的数据资源非常庞大,但是并不都是有用的信息,因此在处理和保存过程中就不会也不可能特别的保护所有的数据,大量的数据就会造成信息安全保护障碍。
3.1数据销毁不完全造成信息泄露
由于银行业的业务量非常大,同时每个工作日结束都会产生大量的垃圾文件及影印资料,在处理这些资料时就会有不同的处理方式,但多数是不会集中销毁。纸质资料是银行业务中必然会使用和产生的资料,在这些丢弃的废品中包含着大量的信息,有客户的存款账号以及存款金额、废弃客户资料、银行废弃报表资料等等。这些资料多数并不是错误的信息,相反这些是一些真实性相当高的信息,因此废弃资料的销毁和处理就有必要加以重视。事实上,通过对许多商业银行的调查与统计许多商业银行并没有制定具体处理措施规章制度,也没有指派专人负责处理,而是较随意的丢弃。从这些丢弃的资料中我们不难找到客户的存款资料,对公账户的基本信息,甚至是银行内部的经营状况等等。此类信息是银行非常机密的信息,泄露的损失会非常的严重。
3.2错误判断数据价值造成的信息安全威胁
在竞争如此激烈的银行业,当没有发展和改革是就相当于在退步,在失去竞争力。随着经济全球化和信息技术的发展,金融数据正在以空前的速度产生和累积。因此,迫切需要找到一种有效的方法从海量的金融数据中提取有用的信息以在银行制定战略性计划和投资时给予支持。由于银行业接触到的信息量相当大,因此会让领导人员对已有的数据视而不见。然而这些数据会提供很有用的决策支持,在拥有数据而不去利用就会造成利益的损失。由于贷款系统并不可能融入如此复杂的数据量,这些信息就容易被忽略,这样就容易造成错误判断,最终流失一个良好客户,也有可能会增加高风险客户。
3.3隐性信息价值带来的安全隐患
由于权限等级划分带来了权利和责任的高度集中,在多数银行都以授权与代办关系存在。往往代办员只是在办理业务过程中的操作者,而多数的信息是掌握在授权者手中。这些授权者一般属于银行的中层管理者,他们掌握的信息包括:大额存款户资料、贷款户的资信状况、营业网点的经营状况等等。这些都是整个营业网点经营命脉。根据二八原则的划分,20%的信息是组织运营中的存档信息,而大量的80%的信息是各个经营者所掌握的隐形的信息。这80%的信息安全就只能依靠职业道德规范和职业行为规范等制度对中层领导的约束来保证,存在着严重的安全隐患。
3.4金融欺诈
随着经济的发展,在金融领域的欺诈行为已经越来越多,形式也多种多样,有贷款、存款、银行卡等等。例如在银行业务发展过程中会考核信用卡的发卡量,为达到发卡规模就会盲目的发卡、放松发卡条件等等,大量的信用卡申请信息就会造成信息核实的时间和人力困难。调查表明[2]金融机构每年的欺诈损失占其年收入的6%,相当于美国每年的GDP损失数千亿美元。英国欺诈损失总额每年也达到了140亿英镑。欺诈行为会给银行带来巨大的经济损失,同时也会造成信誉和形象上的重大负面影响。欺诈行为也是多种多样的,主要类型有以下三种:一是由于业务量大而忽略银行柜员对信息的访问控制和跟踪,银行内部职员会利用系统漏洞,非法进入银行交易系统,直接获取不正当利益,或者为以后的作案做准备;二是由于信用卡等信用贷款量大,无法具体核实贷款人资信状况的真实性,造成以虚假的承诺和虚假的保证来骗取贷款额度;三是隐瞒重要的资信信息,避重就轻,造成银行的错误判断。银行可以通过建立自己的数据库,来跟踪核实此类信息,在大量的处理业务数据中对数据进行挖掘分析并找出相应的规则、规律、论断,再结合人工分析,达到有效检测金融欺诈的效果。
4.数据挖掘技术在银行业信息保护中的应用
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。 (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)