奔福德定律

全文总计 4691 字,阅读时间 12 分钟,快速浏览仅需 3 分钟。

副标题:———种舞弊审计的数值分析方法

内容摘要:一些有经验的注册会计师在常年与财务数据打交道的过程中都有这样的感觉:以“1”或“2”为首位数的所谓“小数字”数字似乎总是要比以“8”或“9”开头的“大数字”多。但是他们中间的大部分人并不了解其中奥秘。其实,在会计师日常接触到的大量财务数据的中间,隐藏着一个古老

GB/T 7714-2015 格式引文:[1].奔福德定律.[J]或者报纸[N].中国注册会计师,(11):70-72

正文内容

  一些有经验的注册会计师在常年与财务数据打交道的过程中都有这样的感觉:以“1”或“2”为首位数的所谓“小数字”数字似乎总是要比以“8”或“9”开头的“大数字”多。但是他们中间的大部分人并不了解其中奥秘。其实,在会计师日常接触到的大量财务数据的中间,隐藏着一个古老而奇妙的数学规律:整数1在数字首位数上出现的概率为30.1%,整数2在数字首位上出现的概率为17.6%……,而整数8在数字首位数上出现的概率仅为5.1%,整数9在数字首位数上出现的概率为4.6%。这一揭示整数1~9数字首位出现概率分布规律的数学定律就是本文要介绍的“奔福德定律(Benford's Law)”。奔福德定律是一个早在1881年就被人们发现的非常有趣的数学定律。近些年来,随着法务会计的兴起和计算机辅助数据分析技术在审计领域的应用,借助于计算机数值分析技术,人们发掘了这一定律在侦查财务欺诈征兆方面所具有的独特功效,使得沉睡了百余年的古老数学定律焕发出了新的生机。本文拟对此作些介绍。

  关于奔福德定律

  奔福德定律是由美国数学家、天文学家塞蒙·纽卡姆(Simon Newcomb)在1881年首次发现的。在1881年的一天,他在使用对数表做计算时,突然注意到了对数表的第一页要比其他页更为破旧。奇怪的现象激发了他的研究兴趣,当时他所能得到的唯一的解释是人们对小数字的计算量要大于对大数字的计算量。经过大量的统计分析,他发现了许多类型的数字都很好地符合这样的规律:以1为第一位数的随机数要比以2为第一位数的随机数出现的概率要大,而以2为第一位数的随机数又比以3为第一位数的随机数出现的概率要大,以此类推。当时纽卡姆关注这一数学现象完全是出于好奇,并没有对这一定律做出任何解释。由于当时的人们对这一规律的运用缺乏兴趣,这一发现很快就被人们忘却了。

  到了1938年,美国通用电器(GE)的物理学家弗瑞克·奔福德(Frank Benford)注意到了同样的现象。他收集并验证了总数为20229个数字,其中包括篮球比赛的数字、河流的长度、湖泊的面积、各个城市的人口分布数字、在某一杂志里出现的所有数字,发现在这些数字中,整数1在数字中第一位出现的概率大约为30%,整数2在数字中第一位出现的概率大约为17%,整数3在数字第一位出现的概率约为12%,而8和9在数字中第一位出现的概率约为5%和4%。这一规律因此也被人们称为“第一位数分布规律”(见表1)。

  表1整数1~9在数字首位上出现的概率

   n1 2 3 4 5 6 7 8 9

  P[dight(n)] 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046

  不过,并不是所有的数据都可以用奔福德定律来进行分析,能够用奔福德定律来进行数值分析的数据应该有如下条件限制:(1)数据不能设置最大值与最小值的限制,比如百分比、全世界政治家的年龄、人的身高、以秒为单位的400米跑的时间、邮件的邮资。(2)数值在一个很宽的范围里连续变动,不存在间断点或间断区间。(3)数字没有被特别赋值,如身份证号、股票代码、社会保险号。(4)数值既不完全随机,也不过度地集中。(5)数值的形成受多种因素的影响,是多种因素综合作用的结果。

  符合奔福德定律数据类型一般有:河流的长度,人口分布数,煤气耗用量、用电的账单金额数、公司的缴纳税款数、个人所得税的纳税额。一般认为,与会计、统计、税收、金融以及证券市场的各种数字可以很好地符合奔福德定律。

  我国上市公司主要财务数据符合奔福德定律的验证性测试

  借助于Excel电子表格,笔者对我国上市公司公布的主要财务数据进行了符合奔福德定律的验证性测试。笔者选择了截至2003年4月15日我国1394家上市公司公布的主要财务数据作为样本。为了进行对比测试,笔者还请参与测试的学生采用“模拟造假”的方式形成了1394个“虚假的”对比数据。数值分析的结果见表2。

  表2主要财务数据首位数分布概率以及与奔福德定律和随机数的对比(%)

   首位数出现概率%

   1 2 3 4 56 789

  资产总额32.48 16.72 11.82 8.54 8.10 6.42 5.91 5.11 4.89

  负债总额30.36 8.22 12.14 9.38 8.53 5.76 5.23 5.84 4.53

  股东权益总额25.73 14.22 13.92 2.11 9.10 8.88 5.79 6.02 4.21

  三营业务收入31.65 19.52 13.14 7.78 7.39 5.83 5.29 5.29 4.12

  净利润 25.73 18.39 14.60 10.65 8.23 6.21 6.21 5.16 4.84

  虑假的对比数据 14.75 10.03 10.45 13.34 9.72 15.11 12.4 8.41 5.83

  由表2的分析结果我们可以清楚地看出,我国上市公司公布的主要财务数据基本上都呈现出了奔福德定律所揭示的数据首位数出现概率递减的规律。而虚假的对比数据呈现各个首位数试图均衡出现的趋势,没有表现出奔福德定律所揭示的数据首位数出现概率递减的规律。

  奔福德定律在舞弊审计中的应用

  1.奔福德定律应用案例

  舞弊审计师就对某X公司近5年收到的820651张购货发票以及公司的4家主要供应商出具的发票金额首位数字出现的概率做了统计,并将统计的结果与奔福德定律进行对比。统计结果如表3。

  表3全部购货发票以及按照主要供应商出具的发票金额首位数字出现的概率分布

   首位数出现概率%

  12 3 4 5 6 7 8 9

  全部发票 0.298 0.17 0.122 0.105 0.084 0.071 0.063 0.059 0.052

  (820651张发票)

   0.295 0.168 0.138 0.099 0.073 0.071 0.062 0.049 0.043

  (35480张发票)

   0.308 0.173 0.123 0.102 0.081 0.061 0.054 0.058 0.042

  (560张发票)

   0.211 0.025 0.054 0.078 0.028 0.048 0.063 0.198 0.284

  (11023张发票)

   0.187 0.104 0.106 0.125 0.148 0.136 0.121 0.058 0.049

  (19605张发票)

  从表3可以看出,以全部发票为样本的统计曲线基本上与奔福德定律相吻合。但是如果按照不同的供应商来做进一步的分层统计,结果就不相同了,供应商A和B出具的发票金额的统计曲线与奔福德定律有很好的一致性。基本上可以说公司在与供应商A和供应商B的交易中没有购货欺诈的征兆。供应商C和D的统计曲线与奔福德定律存在很大的不一致,说明可能存在一定程度的购货欺诈问题。其中供应商C显示金额首位数字为8和9的概率比较高,金额首位数字为1和2的概率比较小,这样的结果似乎在提醒人们有人在发票上故意书写金额较大的数字。供应商D显示有人在试图让首位数字出现的概率尽量相同,说明有人为编造金额数字的嫌疑。舞弊检查人员应该以此为线索,进一步深入调查公司采购人员与这两个供应商的经济往来是否存在欺诈舞弊的问题。

  2.运用奔福德定律进行舞弊审计的优缺点

  运用奔福德定律进行舞弊审计具有如下优点:(1)它的使用成本低,几乎没有什么花费,只需要耐心,花点时间对有关的样本数据做些数据分析就可以了。目前在美国已经有人开发有专门的分析软件,利用该软件可以非常快捷有效地进行统计分析。(2)这种方法简便易行。在会计电算化的环境下,它只需要利用本公司自己的数据库资料就可以了,而且操作很简单易学,几乎任何人都可以做相关的统计工作,不需要高深的理论与技术。(3)保密性好。运用这种方法有很好的隐蔽性,可以在相关的人员不知情的情况下完成统计调查工作,防止欺诈者由于发现有人怀疑他而采取反调查手段。

  这种数值分析方法的局限性在于它类似于我们用霰弹猎枪打猎,我们每次扣动扳机,只可能有很少的枪弹击中目标。在上文提到的案例中我们可以看出,如果舞弊审计人员在做完对全部发票的统计就停止了数值分析工作,那他就会得出数值分布曲线与基本与奔福德定律一致,不存在购货欺诈征兆的结论。如果按照不同的供应商来做统计,欺诈的征兆就显现出来了。

  这里,统计的工作量加大了,击中的“目标”可能性也就加大了。这种方法的另外的一个缺点是它只能确定存在欺诈的可能性,并不能确定地说明一定存在欺诈。如果用此方法发现有异常存在,欺诈审计人员还须以此为线索,做进一步深入的调查,以获取欺诈舞弊的证据。

  3.用Excel电子表格进行有关的统计计算的方法

  笔者通过Excel电子表格的研究,摸索出了一套运用Excel电子表格进行有关奔福德定律数值分析的方法,可以非常方便快捷地进行有关的数据的统计分析。现将这种方法与步骤简单介绍如下:

  第一步:输入或整理样本金额数据。将样本数据全部输入或拷贝到Excel电子表格的第A列,我们假定有1500个样本数据。观察样本数据,如果发现有小于1的数值存在,则在B列第1行应利用公式[A1*10)或[A1*100]给A列所有的数据乘以10或100……,直至所有数据都成为大于1的数值,形成B列的新数据。

  第二步:截取样本数据的首位数。在C列第1行,我们设置函数[LEFT(B1,1)]并下拉拷贝公式至数据最后一行。这样电脑就会自动将B列的每一个数据的首位数选出并列在C列。

  第三步:计算C列数据,既样本数据首位数1~9出现的频数。在D列的第1行至第9行分别输入公式:[COUNTIF(C1:C1500,1)];[CCOUNTIF(C1:C1500,2)];[COUNTIF(C1:C1500,3)]……[COUNTIF(C1:C1500,9)]。此时,在D列就会出现样本数据首位数1~9出现的频数。

  第四步:计算本数据首位数1~9出现的频率。在E列第1行输入公式[D1/1500)下拉拷贝至第9行。

  小结

  奔福德定律描述了数据首位数出现的概率分布规律。通过我们所进行的验证性的测试,发现我国上市公司所公布的主要财务数据较好地符合了奔福德定律。这样的规律为舞弊审计师通过数据分析发现财务舞弊的线索提供了有用的工具。欺诈审计人员需要对大量发生的一些会计数据,如:应收账款数、应付账款数、存货数、成本费用数、收入数等的第一位数出现的概率进行统计,考察其是否符合奔福德定律。笔者认为,在运用这一定律进行舞弊审计时,需要注意以下几点:(1)要注意该定律运用的限制性条件,并不是所有的数据类型都适用奔福德定律。(2)数据样本要有足够的量,样本数越多,结果越可靠。(3)数据检测的结果如果不符合奔福德定律的概率分布,说明可能存在舞弊的征兆,审计人员还需以此为线索,追根寻源,查找欺诈存在的有力证据。如果数据检测的结果符合奔福德定律的概率分布,也并不一定说明就没有欺诈的发生。在大量样本的情况下,审计人员还可以进一步做分层的测试。(4)运用奔福德定律的数学表达式,我们还可以进一步计算出前2位数(10~99)、前3位数(100~999)分布的概率理论值,进而可以将对有欺诈问题数据的调查分析范围进一步扩大,使我们能够捕捉到更多的欺诈线索。

推荐10篇