统计分析论文(6篇)
统计分析论文篇1
[关键词]统计信息非技术性失真原因对策
统计信息是人们赖以判断、分析社会经济活动及其结果并借以进行经济决策的重要手段。统计信息功能的发挥,以真实性为前提。真实性是统计信息的生命,也是统计实践中应该遵循的基本原则。然而,现实经济生活中,尤其是在我国经济运行进入转型期后,由于体制转轨尚未到位及其它原因,统计信息失真呈现出泛滥之势,成为统计实践中一直未能解决的顽症。对这一难题,统计工作者和理论研究者作过不懈的努力,提出了不少治理对策,并对这一问题的解决发挥了一定作用。但由于问题本身的复杂性,统计信息失真现象仍然广泛存在着。
一、统计信息非技术性失真的原因分析
1、统计信息非技术性失真的含义
统计信息失真从其原因看可分为技术性失真和非技术性失真。
技术性失真是指由于某些客观条件的限制(如人们的认识能力、工作方式和手段、统计制度和方法、统计管理体制等因素)所引起的统计信息与实际经济过程和经济现象脱节的现象。技术性信息失真表现为一种无意识中产生的误差,具体有工作误差和代表性误差两种。工作误差是指在统计工作过程中,由于客观条件的限制(如度量工具不标准、统计方法不适宜等)或工作人员在登记、汇总和计算过程中的失误而造成的误差;代表性误差是指用部分单位的统计数据为代表去推算全及总体有关数据时所产生的误差。
非技术性失真是指在一定的客观条件下,有关人员为了个人或局部的经济和政治利益,有意识地提供虚假统计信息而造成的统计信息失真。与技术性失真相比,统计信息的非技术性失真对社会经济造成的危害要大得多。因为前者产生的误差一般较小,资料汇总后,正负误差可以相互抵消,使统计数据趋于真实;而后者由于相同利益趋向产生同向性误差,累积起来,失真就会加剧。比如,人口性别结构的统计,各地呈报的数据可能只有较小的误差,汇总的数据又基本上是真实的。但人口出生率的统计就不同,由于数据造假者有相同的利益动机,所呈报的数据都小于实际人口出生率,从而使汇总的数据严重失真。
2、统计信息非技术性失真的原因分析
前已述及,非技术性统计信息失真主要由统计信息的提供者主观上有意识地弄虚作假所致。根据行为科学理论,人们的行为方式由其内在动机和外在环境因素决定,内在动机提供行为动力,决定行为方向,而环境因素则通过强化或抑制行为动机来修正人们的行为。统计信息的提供者具有最大化自身利益的动机,通过何种行为最大化自身利益则取决于外在环境。即,当提供者客观上具有利用统计信息或者编制统计信息的机会最大化个人利益和局部利益的时候,外界环境因素或者刺激其谋取正当利益,或者刺激其谋取不正当利益;换句话说,当提供者产生谋取不正当利益的动机时,外界环境因素或者对其行为给予推动或者加以制约。这一理论为寻求统计信息失真的深层次原因提供了一条有效的线索。
统计信息提供者的行为有合规与违规两种,其选择取决于行为的结果是否能提供最大限度的利益,而行为的结果又受到所处监管环境的制约。监管成为影响提供者利益最大化目标实现的主要决定因素。这里所说的监管环境是指对统计行为的合规性所作的检查以及对违规统计行为的处罚等监督管理制度和习惯的系统。这一系统对统计行为产生直接影响,因为统计信息提供者在作行为安排时会考虑环境的约束力,然后根据环境给予的行为空间,依据最大化原则进行系统筹划,以最有效的方式实现目标。如果监督者能够有效地促使提供者按照统计规范来安排自己的统计行为,那么,统计规范的目标也就实现了。但问题是怎样才能促使提供者在统计规范给定的空间范围内安排统计行为,因此,如何合理地设计和安排统计行为的环境空间,是实现统计规范目标的关键。根据激励相容原理,要实现监管目标,必须设计出一种适宜的环境,使监管者与提供者的利益趋向一致,即使提供者采取合理的统计行为符合其自身利益。
在此,笔者设计一个博弈模型来分析统计行为的选择过程和选择结果。统计信息的提供者与统计行为的监管者为博弈的双方。提供者的行为只有两种:合规与违规;而监管者可选择的行为也只有两种:违规处罚和违规不处罚。假定提供者统计行为合规可以得到10个单位的利益,而违规不受处罚可以得到15个单位的利益,违规受处罚只能得到8个单位的利益。括号里的数字代表各种情况下社会得到的利益单位(负数表示损失)。这样,博弈双方的得益矩阵列表如下:
提供者行为选择监管者行为选择合规违规
不处罚10(1)15(-6)
处罚10(1)8(-1)
上述情况中,监管者的最优策略应为处罚,而提供者的最优策略应为合规,结果各自的目标都得以实现。事实上,如果提供者确实面临着严厉的监督,违规行为必受处罚,提供者会自觉地遵守规范。但是,现实经济生活中,统计违规现象为什么仍大量存在呢?这是因为,一方面,统计提供者具有机会主义行为倾向;另一方面,统计监管中的抽查制度以及监管不严,处罚不力强化了提供者的违规动机。
在违规处罚中,存在着两种典型的情况:监管不严,处罚不力。
处罚不力即统计行为的监管者对提供者的违规行为在制度安排上过于宽大,给予处罚的力度不大。《统计法》是监管者能依照的权威性大法。《统计法》中提及追究违法者刑事责任的行为只有两种,即对拒绝、抵制编造和篡改统计数据的统计人员进行打击报复和利用统计调查进行诈骗。可见,造假者玩弄数字,编制虚假信息并不构成犯罪。另外,《统计法》对法律责任的追究也缺乏可操作性,在什么情况下对造假者给予什么行政处分,没有作出严格规定。
处罚不严是指处罚的执行不够严格,所给予的处罚往往不能实施。统计信息提供单位上下级之间在数据造假上存在着相同的利益趋向,监管者查出问题,领导说情干预,或减轻处罚,或以经济处罚代替法律行政处罚,甚至不处罚。这样违规行为受处罚的可能性降低,使违规者有机会获得更大的收益。
假设违规不被处罚或处罚较轻,违规的收益只要大于合规的收益,则统计信息提供者肯定选择违规行为。反之,如果违规必被处罚,或处罚较重,使违规的收益小于合规的收益,则统计信息提供者选择合规行为。在现实中,违规行为都或多或少有受到处罚的可能性,因此,提供者究竟采取何种行为将取决于他们对监管行为的预期,他们通常会揣测有多大程度会被处罚,多大程度不会被处罚。下面,在前述搏弈矩阵基础上,分析在给定的利益分布状况下,违规与合规的均衡概率,即违规与合规的利益期望值相等时的概率。
首先,根据前表所示的利益分布状况,现假定违规受到处罚的概率为p,则违规不受处罚的概率为(1-p),因此有:
15(1-p)+8p=10
则p=71.43%
这表明,当违规处罚的概率为71.43%时,违规与合规的利益期望值相等。如果违规处罚的可能性低于71.43%,则违规的利益期望值高于合规的利益期望值,提供者会选择违规行为。否则,选择合规行为。这也说明,在既定的利益分布状况下,监管者可以通过提高处罚的严格程度,控制违规受处罚的概率,来影响提供者的收益,从而影响提供者的统计行为。
其次,监管者加大处罚力度,使违规受处罚的利益值发生变化,即改变提供者的利益分布状况,均衡概率将发生如下的变化。现在假设违规受处罚的利益值为5个单位,其他不变,则有:
15(1-p)+5p=10
解得:p=50%
这样,只要让违规行为有50%的可能性受到处罚,违规的期望利益值与合规的期望利益值相等。这说明在处罚力度较大的情况下,即使处罚不那么严格,违规受处罚的可能性小一些,也会使提供者的统计行为在很大程度上合乎规范,达到监管的预期效果。同时,这也说明,处罚的严格程度和处罚的力度可以结合起来,共同提高监管效果。
综上所述,统计信息提供者客观上具有追求最大化利益的倾向,其是否采取违规行为取决于其成本——收益核算,而监管及监管的严格程度可以影响提供者的成本和收益,监管成为制约提供者违规行为的关键因素。因此,统计行为的监管者若想使提供者的统计行为符合规范要求,就必须在监管环境上作出合理的安排,进行严格的监管。
二、统计信息非技术性失真的治理对策
基于以上分析,提出以下对策来遏制弄虚作假行为,改善统计信息失真的现状。
第一,完善统计法规。一是要尽快修订《统计法》中不合理的条款,使之适应当前市场经济发展的需要。对统计的基本职能、统计违法行为、统计违法的法律责任等问题作出更加明确、更加严厉的规定。二是以法律的形式确保统计部门的独立性和权威性,提高统计人员的地位以保证统计人员的切身利益,使他们有动力依法开展统计工作,严格维护法律尊严并勇于同统计违法行为作斗争。
第二,强化法制观念。各级政府部门要利用报刊、广播、电视等传播媒体进行统计法规、条款的宣传、教育,使各项法规制度深入人心,以提高全民的统计法律意识和依法办事的自觉性。调查单位领导者、广大群众、统计人员的统计法规意识都要增强,要通过学习领会各自的责任和义务,特别是要强化单位领导人在统计工作中的法律责任,即必须保证统计资料真实、完整,并对篡改报表、虚报、瞒报等损害国家和公众利益的行为承担法律责任。
第三,加强对统计执法情况的监督检查。这是控制信息失真的重要手段。一是统计部门要与纪检、监察、司法等有关部门配合,协同作战,共同查处弄虚作假行为。二是执法检查要经常化、制度化。各地统计部门应当积极创造条件,成立统计检查执法大队,加强对其业务领导,加大执法检查的力度,形成对统计违法行为的威慑作用。三是加大统计数据质量检查的频率,将定期与不定期检查相结合,减轻弄虚作假者的侥幸心理。四是完善抽样检查的制度方法。监管者在不可能对统计行为进行全面检查,只能采取抽样检查的情况下,可通过确定合适的抽查面,来减少违规行为不被检查出来的可能性,还可以通过对多次抽查样本的合理安排,使若干次抽查覆盖全部被监管单位,并规定违规处罚的追溯时效,以达到监管目标。
第四,对违法乱纪者给予严厉的处罚。在查处统计违法案件时要注意维护统计工作秩序,严格按照法定程序和要求办事,做到“证据确凿、手续完备、程序合法、处理适当、结案及时”。对那些严重违反《统计法》的当事人、责任者要依法追究法律责任,决不姑息迁就。以此降低他们的预期收益,增大他们的预期风险,抑制他们的造假的内在冲动。此外,应制定衡量法律责任的实施细则和独立的执法程序,以免人情关系和主观因素干扰法规的实施。对典型的统计违法案件要向社会暴光,以儆效尤。
[参考文献]
(1)郭洪波《新时期统计数据质量观三议》[J]《中国统计》1998年第2期
(2)刘鲸《非技术性统计失真:原因及对策》[J]《中国统计》1999年第5期
(3)邬补科《统计行为合理化与提高统计数据质量》[J]《财经论丛》1998年第1期
(4)何申明《建立防范机制制止数据造假》[J]《中国统计》第9期
统计分析论文篇2
经济全球化和信息技术与信息产业迅速发展,电子商务将成为今后信息交流的热点,成为各国争先发展,各个产业部门最为关注的领域。
1.互联网电子商务平台的普及使安全性经受新考验
由于INTERNET的迅速流行,电子商务引起了广泛的注意,被公认为是未来IT最有潜力的增长点。然而,在开放的网络上处理交易,如何保证传输数据的安全成为电子商务能否普及的最重要的因数之一。人们担心遭到黑客的侵袭而导致信用卡信息丢失,不愿意使用电子商务,安全成为电子商务发展中最大的障碍。
2.电子商务的国际化趋势使安全问题日益严峻
中国电子商务必然走向世界,同时也面临着世界电子商务强手的严峻挑战。我国电子商务企业将随着国际电子商务环境的规范和完善逐步走向世界。我国企业可以由此同发达国家真正站在一个起跑线上,变我国在市场经济轨道上的后发劣势为后发优势。
2、基于生物统计特征的生物识别技术
1.生物识别技术的特点
生物识别技术是以生物技术为基础,以信息技术为手段,集光学、传感技术、超声波扫描和计算机技术于一身的身份验证技术。它依靠人体的生物特征来进行身份验证,具有不可复制性和唯一性。生物识别技术是最为方便与安全的识别技术,它不需要记住复杂的密码,也不需随身携带钥匙、智能卡之类的东西。可借助于计算机技术实现,实现自动化管理。
2.生物识别技术分类
虹膜识别技术:通过对虹膜的特征结构进行检验,进而确定用户身份。这种方式方便可靠,无需物理接触,具有惟一性、稳定性、可采集性、非侵犯性等优点。
视网膜识别技术:包括虹膜技术与角膜技术。角膜扫描是用低密度的红外线去捕捉角膜的独特特征,血液细胞的惟一模式就被捕捉下来。它具有使用者和设备非接触、视网膜不会被伪造等特点,但由于要求被扫描者在它读取角膜信息时直立不动,很难获得用户的普遍接受,另外,角膜扫描仪对于盲者和眼睛患病的人是无效的。
面部识别:通过对面部特征进行识别。标准视频技术通过一个标准的摄像头摄取面部的图像或者一系列图像,记录一些核心点及它们之间的相对位置,然后形成模板;热成像技术通过分析由面部的毛细血管的血液产生的热线来产生面部图像,通过特定算法将图像变成数字信号,最终产生匹配或不匹配信号。面部识别是非接触的,用户不需要和设备直接接触。
签名识别:也被称为签名力学辩识,它是建立在签名时的力度上的。它分析的是笔的移动,而非签名的图像本身。签名力学的关键在于区分出不同的签名部分,有些是习惯性的,而另一些在每次签名时都不同。它容易被大众接受,但随着经验的增长、性情的变化与生活方式的改变,签名也会随之改变。
声音识别技术:是一种行为识别技术,识别设备不断地测量、记录声音的波形和变化,并将现场采集到的声音同登记过的声音模板进行精确的匹配,从而确定用户身份。是一种非接触的识别技术,用户可以很自然地接受。
指纹识别系统:它通过对指纹的全局特征和局部特征采集、分析后,与模板库中存储的指纹对比,自动、准确地鉴别出个人身份。用来采集指纹图像的技术为光学技术和电容技术。光学技术需要一个光源从棱镜反射按在一个取像头的手指,光线照亮指纹从而采集到指纹。电容技术是按压到采集头上的手指的脊和谷在手指表皮和芯片之间产生不同的电容,芯片通过测量空间中的不同的电容场得到完整的指纹。
3、生物识别技术发展趋势
随着数字时代的到来,基于生物特征的验证技术愈加显示出它的价值。生物密码时代呼之欲来,生物识别技术的可靠性,以及有效地鉴定个人的身份有着重大的社会和经济意义。“执生命密匙,启身份之锁”,在以计算机和生物技术为主流的知识经济崛起时代,身份的鉴定有了来自生物体自身的密匙,横跨这两大科技领域的生物特征识别技术正愈益显示出其旺盛的生命力和远大前景。
由于各种生物特征的识别方式都有其一定的适用范围,单一的生物特征识别系统在实际应用中显现出各自的局限性,生物特征识别技术开始向多生物特征识别技术结合方向发展。当然生物识别技术并非万无一失,与数字密码识别技术相比最大的缺点是,一旦当事人的生物特征被仿制,很难像改变密码一样更改自身的特征。
4、结论
从目前的应用现状看,生物特征是最好的验证方式,个体的生物特征不易丢失,不易仿造,是个体在出生的时候就获得了的惟一的、先天的身份证明,这份证明是由最可信,最具权威性和通用性的大自然发放的。总之,随着电子商务成为信息交流的热点,生物识别技术将获得空前的发展空间,多生物识别技术共同应用是大势所趋,随着时间的推移和技术的发展,电子商务安全体系将越来越完善。
参考文献:
[1]徐雪梅:浅谈保障电子商务活动中的信息安全[J].科技情报开发与经济,2003(5)
[2]王飞刘毅:可信计算平台安全体系及应用研究.微计算机信息,2007(3~3)P76~78
统计分析论文篇3
现代质量管理制度的形成应当由工业化时代算起。在初期的质量检验阶段,人们所熟知的质量管理手段仅限于质量检验,这时的质量检验并没有引入统计学中“抽样”的思想,因此,大部分产品都是进行逐个检验。这种检验的弊端很多,限于科技条件,所暴露出的问题无法得到有效的解决,但是在检验过程中产生了大量数据,如何对这些数据进行有效利用的思考,再加上当时统计学中各种统计方法的发展,导致了质量管理与统计学的彻底结合,从而出现了统计质量控制(sPc)这种在当今质量管理界仍有决定性影响的技术。这之后质量管理的发展始终与统计学密切相关。
统计质量控制作为质量检验的发展,其主要作用除进行检验之外,还进行过程控制。这一阶段的检验已不再是单纯的对产品逐个进行检验,而是引入了统计中“抽样”的思想,对产品进行科学的抽样检验。其做法是:在初步考察产品特性的前提下,采取相应的抽样方法抽取一定量的产品,通过对该批抽取产品(统计中称为样本)特性的检验从而推断整批产品的质量特性此即统计学中最基本的方法:根据样本特性推断总体特性。而统计质量控制中的核心理论—过程控制,其核心即是上文中所提到的3口理论。3J理论来源于统计学中的正态分布,它是统计学与质量管理的完美结合的体现,控制图中中心线的确定,控制限的制定等一些准则和方法直接来源于统计学中的相关理论。反过来,质量管理的不断发展也为统计学的研究提供了许多新课题,尤其是对于控制图的研究,迄今己取得了许多突破性的成果。
六西格玛管理作为质量管理的延伸,不可能完全脱离质量管理。在生产和质量部门,六西格玛管理仍包含质量检验和质量控制的功能。但是,作为整个企业运作的基石,六西格玛管理的作用又不仅限于此,六西格玛管理与统计学的结合也要比质量管理与统计学的结合要紧密的多。
六西格玛管理作为一种追求卓越的管理理念,在企业的运作中不仅对生产和质量部门起着指导作用,同时也决定着企业的其它部门乃至整个企业的运作形式。六西格玛管理所倡导的流程式管理,虽然不是首创,但其不遗余力的推行,并将“工作流程化”作为进行六西格玛管理的前提。在主张“重视人在工作中的因素”的同时,将工作流程化,流程量化,尽量减少工作中人的失误,量化的流程式管理使得六西格玛管理与统计学的结合更加紧密。六西格玛管理在长时间的实践中也形成了自己独特的管理模式,下面将结合六西格玛管理的DMAIC模型简单介绍六西格玛管理的实施过程,及其各实施阶段中的统计工具。
六西格玛管理实施的是流程式管理,强调“以顾客为中心”,这里的顾客可以是企业的外部客户,也可以是公司的内部客户。其做法是将各种业务或者工作过程分解成大小不一的流程,流程末端即为客户,即流程的成果—产品或服务的接受者。这样,六西格玛管理的实施就转化成为各种大小不一的例子如下:
上面的图示是进行试验的一个简单流程,其中试验人员即为工作的实际操作者;输入变量为影响关键质量特性的各种因素(一般是主要因素);试验的过程是进行各种业务操作的过程;工作的面向对象或称为流程成果的接受者即为顾客;顾客需求产品或服务的关键质量特性为流程的输出变量。
六西格玛管理的核心是以客户为中心,以使客户满意为其宗旨;而在内部管理中则是以影响客户满意度的关键质量特性(CQT,即Critiaclotqualiyt)为其核心,六西格玛流程管理的各个阶段始终围绕CTQ进行。其主要任务是找出影响关键质量特性的主要因素的最优值,并对其进行控制,以使流程一直处于一个稳定的状态。其实施过程大致可分为五个步骤,如下:
一、定义阶段,即D阶段
主要任务是确定影响顾客满意度的CTQ。在这一阶段中,首先要了解顾客对产品的要求,并以函数的形式将这些要求对应于质量特性,通过顾客对产品要求的重要程度对质量特性进行打分,从而确定关键的质量特性,即CTQ。从对客户进行调查到确定CQT这一过程中,常用到如下工具:品质成本分析法、流程分析法、因果分析法、头脑风暴法等四种。
二、测量阶段(即M阶段)
该阶段的主要任务是收集产品或流程现状的数据。为保证数据的真实性和准确性,在收集数据之前,测量系统分析和合理的分组计划是必需的。
进行测量系统分析是为了更好地了解影响测量结果的变异来源及其基本信息,并确定相对于产品规格或过程误差,系统的侧量误差是否可以接受。在进行测量系统分析时常用的统计工具有两种,一种是不考虑因子交互作用的戈一R分析,通过计算得到%R&R(衡量系统误差的标准),一般情况下,如果%R&R<10%才会认为系统的误差可以接受;另一种是考虑因子交互作用的方差分析法,通过方差分析可以得到一个数值F(F统计量),然后把F与另一个固定的数值F1-α(可以查表)比较,如果F
三、分析阶段(即A阶段)
数据收集完成之后的一项很自然的工作即是对所得数据进行分析,该阶段的主要任务就是通过分析在测量阶段收集到的数据来确定一组按重要程度排列的影响质量的变量(流程的输入变量),即寻找质量特性与影响质量变化输入变量之间的关系,并判断输入变量的重要程度。分析过程中根据需要的不同常用到如下两类工具:图形分析工具和通用分析工具。其中通用分析工具主要包括:参数估计和置信区间分析、假设检验、方差分析、回归分析、试验设计分析(DOE)等。四、改进阶段(即I阶段)
分析阶段确定了一组按重要程度排列的影响质量特性的输入变量之后,改进阶段的主要任务是根据对质量特性的需求来确定这些输入变量的最优值,并将这组最优值与现有流程的实施值进行比较,如果现有实施值与最优值差别很大,则说明现有流程需要改进。而确定这些输入变量最优值最重要的手段就是试验。从节约成本、提高效率和结果更能真实反映实际情况的角度出发,统计中的试验设计(DOE)成为了必须选择。与传统的试验方式相比,试验设计的优势非常明显,传统的试验分析方法是在输入变量为多个时,即为多个单因子试验,也就是众多输入变量在同一时间只允许有一个变量变化,如下图所示:
五、控制阶段(C阶段)
改善阶段确定了变量的最优值,流程只需在最优状况下进行即可。为了使这种流程能稳定的持续下去,就需要对整个流程实施分析、监控,这是质量管理中统计质量控制的主要工作,因此其在生产和质检部门的实施己比较成熟。常用如下的统计工具:控制图和过程能力分析。
六、六西格玛管理中的工具限制
随着六西格玛管理的广泛应用,其实施方式越来越多样化,实施的范围越来越广,随之也带来一系列的问题,工具的限制即为其问题之一。
六西格玛管理是一种追求卓越的管理方式,对于每一个流程都要求达到最高的标准。在实施改进之后,流程达到了一个很高的水平,但这之后对流程实施制的方法仍然是传统的SPC技术,其中的休哈特控制图是实施控制的主要手段。目前在六西格玛管理的控制阶段也都是采用这种技术。
休哈特控制图对监测流程的运行情况具有非常好的作用,尤其是在流程出现较大波动的情况下,休哈特控制图的报警准确度和及时率都非常高,因此在统计过程控制中发挥了至关重要的作用。然而,休哈特控制图对流程的较小波动并不敏感,在流程出现小波动时的报警准确度较低。在六西格玛管理中,由于流程改进之后达到了一个较高的水平,因此出现较大波动的可能性远低于出现较小波动的可能性。此时用休哈特控制图对流程实施控制的效果就不能尽如人意。在统计学中,己经出现了CUSUM控制图和EWMA控制图等理论解决类似问题。
参考文献:
[1]彼得·潘德莱瑞·荷普著工金德等译:《六西格玛是什么》.中国财政经济出版社,2002年
[2]贾俊平何晓群金勇进:《统计学》.中国人民大学出版社,2000年
[3]南兆旭滕宝红:《让数字管理》.南方日报出版社,2003年
[4]邹依仁:《质最管理原理和方法》.机械工业出版社,1983年
统计分析论文篇4
领导的重视程度不够,或者说,一些领导干部在如何正确看待统计工作的问题上存在有一定的误区;统计工作,由于统计方法、手段等的不合理、不完善,造成了统计性误差的存在;统计数据的真伪,由于缺乏有效的监管措施,在一定程度上,存在着人为地虚报或瞒报的成份。
二、存在于统计工作中的“数据误差”产生的主要原因
第一,多年以来,我国存在着“GDP为王”的一股考核风。由于受到领导干部业绩考核指标的影响,许多基层干部出于无奈,不得不故意虚报统计数据,来为自己的“政绩”增光添彩。同时,其主管部门对此也处于无奈的窘境。第二,某些地区、部门、行业,出于对自身利益的考虑,故意瞒报统计数据,以达到少缴、甚至不缴国家规定必须缴的一些规费、税金,从而导致了国家的相关规费、税费的大量流失。而这些地区、部门、行业,却因此而得到了大量的不当收益。目前,最典型的就是企业在交纳社会统筹时,故意瞒报、少报本单位的人均工资总额,从而达到少缴社会统筹基金的目的。第三,虽然我国的统计工作已经与国际接轨,但由于我国正在建设有中国特色的社会主义市场经济,现阶段仍处于发展中国家的阶段。统计工作中的统计方法、手段,还需要进一步的规范和完善。
三、针对我国目前统计工作中存在的“数据误差”应对的策略
1、加大对统计工作的宣传力度。力争使每一位统计参与者,特别是党政领导干部都要了解统计工作对我国国民经济建设起着巨大的作用,错误的统计信息会给国家的经济工作带来深重的灾难,努力提高他们对统计工作的正确认识,得到他们对统计工作的支持。
2、对目前干部考核中一些片面强调GDP增长的业绩考核制度进行改革。长期以来,统计工作中存在着“以数字论英雄”的局面,从而出现了“官出数字、数字出官”的怪现象。有鉴于此,中纪委曾经严肃指出,要清查在政府官员业绩考核中出现的“统计数据的腐败现象”,一经查实,严肃处理。这在一定程度上,遏制了虚报现象的不正之风。
3、完善统计工作中的统计考核指标体系,以及与此相适应的统计方法,从而在源头上来遏制问题产生的基本动因。必须对我国统计工作现状进行深入的分析,总结出统计工作中的行之有效的方法。另外必须承认,我国和国际上的先进的统计工作、统计方法相比,差距仍然较大,因此,我们必须虚心向国外先进同行学习,取人之长,补己之短,才能在短时间内,获得较大的成效。比如,我们在采用统计工作中的普查的方法的同时,采用西方大量使用的抽样调查和重点调查等这样一些方法,来弥补在普查工作中容易受到地方政府干扰的部分所带来的“数据误差”。在现实工作中,政府也意识到了这个问题的重要性,并已经相应成立了国家统计局直属调查队,其隶属关系不在当地,因而可以免受许多人为因素的干扰,为我国宏观经济决策提供重要的参考依据。
4、加大《统计法》的宣处力度,努力做到有法必依,执法必严。目前,我国的现状是,知道《统计法》存在的人寥寥无几。究其原因,一是人们大多对统计工作漠不关心,这就必须加大统计工作的宣传力度,使统计意识深入人心。二是《统计法》出台后,并没有很好地得到贯彻实施。针对这个问题,首先,必须要开展声势浩大的普法宣传,使老百姓,特别是党政官员们感觉到统计工作是有法可依的。其次,必须要组织定期或不定期的执法检查,对查出的问题,一定要依据《统计法》的要求认真处理,从而来形成一种氛围,使那些心中有“妄想”的官员们不敢再有所图。再辅以科学的指标考核体系,综合考虑每个党政官员们所处的工作环境、自然资源等多种因素,真实、公正地评价每一个人,这样,才能在真正意义上遏制住不正之风的存在,根除“数据误差”。5、努力提高我们统计从业工作者的自身素质。统计工作者自身素质的提高,是做好统计工作的首要的、基本的条件。试想,如果一个统计工作者对统计工作不太了解,我国统计工作的质量的提高又从何谈起?
四、结论
必须还要强调“以人为本”,以人的全面发展来带动统计工作的正确发展;并通过统计工作的正确发展,反过来推进人的全面发展。此外,充分运用现有的科技成果,使政府各职能部门,包括工商、税务、财政、审计、人事等各相应单位的数据共享,使得上面所述的虚报、瞒报者无处藏身。与此同时,还可以利用网络资源,在查出虚报、瞒报的同时,去引起、带动职能部门对其进行专项调查,从而使得统计工作真正地服务于国家建设,同时服务于党风廉政建设,服务于人民的需要。但这是一个漫长的过程,需要一步一步地去努力。最终,统计工作会随着大家的共同努力而不断提高。
【摘要】统计工作的精准对我国国民经济发展的影响至关重要,但是在实际的统计工作中却存在着这样那样的问题,文章分析了我国统计工作存在的不足及其原因,并针对这些缺陷提出了相应的对策。
【关键词】统计工作数据误差原因策略
【参考文献】
[1]符华敏:我国的统计现状分析[J].统计学杂志,2003(3).
统计分析论文篇5
目前,很多研究人员对影像资料分析方法的学习和理解存在一定困难,尤其初学者对繁杂的概念、复杂的计算公式、数据资料性质判断以及如何选择合适统计学方法等问题难以深刻理解。针对这些问题,王良等[1]建议采用以下模式:判断资料类型、根据研究目的选择分析方法、其他适宜方法。
1.1根据资料类型初步确定方法
临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。
1.2根据研究目的选择方法
1.2.1差异性研究
差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。
1.2.2相关性分析
相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。
1.2.3影响性分析
由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。
2其他适用方法
2.1ROC曲线
ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。
2.2Kappa检验
Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。
2.3Levene检验
统计分析论文篇6
[中图分类号]G203
[文献标识码]A
[文章编号]1673-5595(2015)05-0092-04
科技期刊载文信息包括期刊刊载论文中包含的信息及刊载论文在传播过程中衍生出的一些相关信息。[12]对于期刊编辑和办刊单位来说,统计分析载文信息可以为改进编辑工作、评估期刊现状和制定期刊发展规划等提供重要的参考和依据。[36]科技期刊编辑是办刊单位的骨干力量,日常工作中接触的是载文信息的第一手资料,应该有意识地肩负起统计分析载文信息的重任,为编辑工作的改进和期刊的发展建言献策。
一、科技期刊载文相关的一些重要信息
(一)载文量信息
载文量包括期刊的总载文量和期刊下属各学术性栏目的载文量等。总载文量在一定程度上反映了期刊在某时期内吸纳和传递学术信息的能力,是衡量某期刊在同类期刊中地位的重要指标之一。[7]各学术性栏目的载文量在一定程度上既反映了期刊的学术方向,也反映了某时期内的学术动态和热点。载文量的变化则反映了期刊稿源和编辑出版工作的稳定性。因此,通过统计分析期刊的载文量信息,既可以了解期刊在同类期刊中的水平和地位,又可以了解某行业的学术动态,为期刊的准确定位和发展规划的制定提供依据。
(二)作者群信息
作者群是期刊刊载学术论文的作者的集合体,是期刊的“衣食父母群”。通过对作者群的统计分析可以了解作者群的特点,为采取合理的措施吸纳更多优质的稿源提供参考。期刊的作者群同时也是期刊的读者群,所以对作者群的统计分析也可以为期刊的出版发行和宣传工作提供一些有价值的信息。
1.作者群分布
作者群分布包括作者群的地域分布、所属单位分布、年龄分布和职称分布等。[8]科学研究通常与地域和研究群体有重要的联系,所以作者群的地域和所属单位分布可以反映某项研究的热点区域。作者群的年龄和职称分布可以反映从事某项研究的主力群体,职称分布在一定程度上反映了论文的权威性和影响力。
2.核心作者群统计分析
核心作者群是指在某期刊中发表学术论文数量较多且具有一定影响力的作者群体。核心作者群通常具有较好的研究基础,能够对某个研究方向进行持续深入的研究,研究成果的取得具有较好的连续性,发表的学术论文在行业内具有较大的影响力和关注度。核心作者群可以相对稳定地为期刊持续提供高质量的稿源,是期刊正常出版和期刊影响力的保证。所以,统计分析期刊的核心作者群及其特点可以为维持和扩大核心作者群提供参考。
(三)合著信息
合著论文是指作者有两位或多位的论文,论文合著率是指合著论文占期刊总论文量的比例。[9]论文的合著率可以从侧面反映研究的复杂程度和研究是否需要多学科的专业知识。一般来说,论文合著率越高,研究的复杂程度越高,涉及到的学科专业越多,科学研究过程中的合作越密切。
(四)基金项目资助信息
论文基金项目资助信息在一定程度上反映了研究成果及论文的质量。一般情况下,受到基金项目资助的研究,其研究内容、研究方法及技术路线都经历过同行专家的严格论证和把关,其所取得的研究成果具有较好的理论价值或应用价值,而且基金项目资助的级别越高,研究成果及论文的学术水平往往也越高。所以,基金项目资助下的研究成果转化成的论文一般具有较高的质量和影响力,基金项目资助情况已成为当前评估论文学术水平的一个重要指标。[10]
(五)关键词信息
关键词是从文章题名、摘要和正文中抽取的能够简洁、直接反映论文主题内容的词或词组,是科技论文不可或缺的组成部分。[11]对关键词的统计分析是文献计量学的重要组成部分,其可以揭示学科的研究特点、结构及内在相关性,反映学科的研究热点和发展方向,对期刊的定位和发展也有重要的参考价值。[12]
1.关键词数量
科技期刊刊载的论文一般都要求有关键词,不同期刊对关键词的数量要求也不太一致。论文关键词个数的多少虽不能直接反映论文水平的高低,但不能过少或过多。对于科技期刊来说,论文的平均关键词数量的稳定性侧面反映了期刊编辑和出版的规范程度。通过对关键词数量的统计分析可以为规范编辑工作提供参考。
2.关键词出现频次
关键词出现的频次越多,说明该领域内的研究成果越多,该领域是研究的热点领域。关键词出现的频次越少则可能有两方面的原因:一方面可能该方向或领域较为冷门,从事这方面研究的较少,成果和论文较少;另一方面可能是该方向的研究具有前瞻性,所以从事该方向研究的较少,取得的成果也较少。对于出现较少频次的关键词要注意统计分析,这对于办刊单位和编辑及时把握学术动态和调整期刊学术栏目是非常有参考意义的。
(六)引文信息
科技论文中引用以前发表的文献既是对前人成果的继承,又是对所引用文献作者的尊重。引文信息包括引文来源、引文类型、平均引用文献数量和引文语种等。通过对引文信息的统计分析可以了解论文作者更注重从哪些途径获取文献、更侧重于参考哪一类文献、对国内外研究进展的把握等。一般来说,刊载论文的引文来源和类型越丰富、引用文献数量越多、引文语种越多,说明论文作者对已有研究成果的把握越全面。
(七)审稿专家信息
审稿专家为论文的学术性和先进性把关,审稿环节的质量直接影响着论文的学术质量。科技期刊编辑应注重对审稿专家信息的统计分析:一方面,编辑要统计审稿专家的联系信息;另一方面,对于一个大的学科来说,通常又分为许多细小的研究方向,编辑还要统计分析审稿专家的研究方向,提高送审的准确性和效率。除此之外,编辑还可以统计分析审稿专家的审稿效率、审稿态度,筛选优秀的审稿专家;统计分析审稿专家的性格特点,便于工作过程中更好地与之进行交流与沟通。
(八)载文收录信息
载文收录是指科技期刊论文的摘要或全文被国内、国际权威数据库收录的情况。目前,国内的数据库主要包括中国知网、维普和万方等商业数据库,国外的主要有SCI、EI和ISTP三大检索系统,以及其他行业内的数据库等。[13]论文部分或全文被数据库收录后,读者能够通过这些数据库检索和下载论文摘要或全文。所以,对论文收录情况的统计分析可以了解期刊及论文的受认可程度及影响力,为评估期刊的网络传播情况和影响力提供参考。
(九)载文被引信息
载文被引是指科技期刊论文被其他期刊、书籍等出版物引用的情况。期刊论文被引用的次数越多,说明期刊的受关注度越高,期刊的影响力越大。[14]衡量论文被引情况的指标包括被引频次、被引率、篇均被引次数、高被引频次论文分布、被引论文年份分布、被引论文作者分布、施引期刊分布等量化数据。因此,统计分析期刊的被引信息可以为评估期刊的受关注度和影响力情况提供参考。
二、统计分析科技期刊载文信息的重要性
(一)有助于做好稿源吸引工作
科技期刊的稿源一般可分为三种:一是作者的自由投稿,这是期刊主要的稿源;二是开辟专栏时对专栏所属领域专家的约稿;三是对行业权威专家的约稿。做好这三方面稿源吸引和邀约是确保载文质量和学术水平的关键。
为了更好地吸引作者自由投稿,科技期刊编辑要了解作者的特点和兴趣,关注学术动态,有针对性地做好期刊的宣传工作及与作者的沟通工作。此外,无论是开辟专栏时对专家的约稿,还是对行业权威专家的约稿,编辑都要首先了解这些专家的研究方向和特色研究领域,了解专家的联系方式和性格特点,这样才能有针对性地进行约稿。所以,在吸引稿源和约稿过程中,了解作者的信息、学术动态和专家的研究方向等信息是非常重要的一环,而通过对以往载文信息的统计分析恰恰可以获取这些信息。
(二)有助于提高送审准确性和审稿效率
审稿环节的把关直接关系到论文的学术质量,是论文编辑和出版过程中非常重要的一环。同时,审稿环节涉及论文的送审、与审稿专家的沟通和审稿意见的反馈及整理等,也是非常繁琐的一个环节,审稿环节工作效率的高低直接影响到稿件的出版周期。
在审稿环节中,合理地利用载文信息的统计分析数据可以为审稿工作提供很大的便利。在送审时,利用载文信息统计分析数据有助于更加准确地找到“小同行”审稿专家,提高送审的准确性。在选择审稿专家时,根据对以往审稿周期的统计分析数据,可以选择审稿效率高的审稿专家。由于通过统计分析掌握了审稿专家的相关信息,在遇到问题时可以更方便地与审稿专家进行沟通。所以,载文信息的统计与分析数据可以有效地提高审稿工作的准确性和审稿效率。
对于编辑工作者来说,利用载文信息的统计分析数据有助于更好地开展编辑工作。基于统计分析获取的学术热点和动态信息可为编辑对稿件的审读提供参考;获取的专业术语可为编辑加工和修改稿件提供参考;根据关键词统计分析结果,编辑可以更好地对论文关键词进行把握,提出意见,以提高检索率和扩大期刊的影响力;根据对摘要内容及结构的统计和分析,有助于编辑对论文的摘要进行修改和加工,提高所刊论文的规范性。
(四)有助于改进期刊出版发行和网络传播工作
在当今信息化的社会,做好期刊出版发行和网络传播工作是期刊持续发展和影响力不断扩大的保证。通过利用载文信息的统计分析数据可以了解期刊的读者群信息、载文的网络传播情况,对当前的读者群和载文传播情况进行评估。通过统计分析载文信息还可以了解不同传播途径的载文传播情况,了解不同传播途径的传播效果,获取载文传播的新途径和发展动态,为期刊出版发行和网络传播策略的调整和规划提供参考。
(五)有助于进行期刊的定位及发展规划
期刊的定位是期刊的创办者根据市场调查情况,对期刊的办刊宗旨、读者对象、主要栏目、主要内容、发行方式等诸方面内容的确定。在市场调查过程中,将本期刊与同行业、同类科技期刊载文信息的统计分析数据进行比较是非常重要的一个环节。通过对本刊载文信息的统计分析可以分析期刊的运行情况,找出自身的不足,为进一步改善办刊水平提供参考;通过将本刊的统计分析数据与其他期刊的统计分析数据进行比较,可以找出自己的优点和缺点,判断本刊的水平和位置,为下一步的发展和定位提供依据。
三、统计分析科技期刊载文信息的途径
(一)基于商业化数据库的载文信息统计分析
目前,国内外许多公司或出版集团都建立了商业化的科技论文全文或摘要数据库,例如国内的中国知网、万方和维普等数据库,国外的爱思唯尔(Elsevier)出版集团旗下的ScienceDirect数据库、ThomsonScientific公司ISIWebofKnowledge检索平台下的三大引文库(SCI、SSCI和A&HCI)等。这些数据库的出现为载文信息的统计与分析提供了方便。
利用这些商业化数据库,可通过两种方法来进行载文信息的统计与分析:
1.许多大型的且覆盖范围比较广的数据库都提供部分载文信息的统计和分析功能,可以利用商业化数据库自带的这些功能来统计分析载文信息。商业化数据库提供的统计分析功能一般是普适性的,可以对部分载文信息实现横向和纵向比较,利用起来比较简单,但不同的商业化数据库提供的统计分析功能不尽相同,所以编辑需要事先了解不同的商业化数据库分别提供了哪些统计和分析功能,以及如何应用这些功能。
2.对于部分载文信息,商业化数据库没有提供统计分析功能,此时就需要编辑根据自己的需求,利用商业化数据库的检索功能来检索相关的载文信息,然后再利用相关软件和方法来统计分析这些载文信息。这种方法的定向性很强,可以满足不同情况下的特殊需求,但操作起来比较繁琐,工作量比较大,需要编辑具备一定的文献检索功底和掌握一些数据统计分析软件及方法。
(二)基于编辑个人掌握信息的载文信息统计分析
除了商业化数据库中收录的出版论文中的信息,每个编辑在吸引稿件、组织审稿和进行稿件的编辑加工等环节也会掌握一些重要的载文信息,例如作者的研究“小方向”信息和审稿专家的单位、地域、研究方向、联系方式等信息。这些信息是与作者和审稿专家相关的第一手、最准确的信息,也是商业化数据库无法获得的信息,更是非常有利用价值的信息。因此,编辑对所掌握的这些载文相关信息进行统计分析是非常重要且非常有必要的。编辑统计分析载文信息可以借助于不同的工具或软件,例如可以利用office软件中的Excel表格进行简单的分类统计、分析和查询,也可以利用专用的数据统计分析软件进一步对数据信息进行专门的统计分析。总之,科技期刊编辑可以根据自己的实际情况,利用自己较为熟悉的软件,选择性地统计分析自己需要的载文信息,改善工作方法。
[参考文献]
[1]王强,杨忠民,许建礼,等.《西安科技大学学报》(自然科学版)创刊30年刊载论文统计分析研究[J].西安科技大学学报:自然科学版,2013,33(1):122126.
[2]孙凡.《西南大学学报》(自然科学版)影响力及网络传播趋势分析[J].西南大学学报:自然科学版,2014,36(8):211216.
[3]田美娥.基于中国知网的《西安石油大学学报(自然科学版)》网络传播统计分析[J].西安石油大学学报:自然科学版,2010,25(6):9699.
[4]胡竹萍,龚雪,王曙明,等.《暖通空调》杂志文献统计数据对分析受众群体需求的启示及思考[J].编辑学报,2011,23(增刊):6972.
[5]胡小洋,游俊,赵燕.文献计量分析:专业编辑的可选学术研究方向――以江汉大学1980年以来三大索引收录论文的统计分析为例[J].江汉大学学报:自然科学版,2012,40(4):5458.
[6]史丽文.SCI引用《水土保持学报》论文的统计与分析[J].水土保持学报,2014,28(4):334336.
[7]陈亦强.《高等教育研究》2000―2002年载文统计分析[J].高等教育研究,2003,24(6):101105.
[8]金伟.《编辑学报》1995―2004年载文作者群统计分析[J].编辑学报,2006,18(1):7880.
[9]杨光,纪淑文,王宪.《太阳能学报》创刊以来载文及作者群的分析[J].太阳能学报,2001,22(3):246249.
[10]冯向春.《化工学报》1998―2002年论文作者统计分析[J].化工学报,2004,55(11):19251927.
[11]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:440446.
[12]安秀芬,黄晓鹂.《中国科技期刊研究》论文关键词的统计分析[J].中国科技期刊研究,2004,15(6):661663.
[13]张诗乐,刘雪立,盖双双.我国编辑出版类期刊在WoS数据库被引情况统计分析[J].中国科技期刊研究,2014,25(8):990993.
[14]潘志萍.《环境昆虫学报》2001―2010年载文被引统计分析[J].环境昆虫学报,2012,34(2):259263.
TheStatisticandAnalysisofPaperInformationinTechnicalJournals
LIJuan
(PeriodicalPress,ChinaUniversityofPetroleum,Qingdao,Shandong266580,China)