数学建模具体步骤范例(12篇)
数学建模具体步骤范文篇1
Abstract:theanalysisofweatherconditionisrelatedtomanyfactors,itcannotgetsatisfactoryconclusionfromsinglefactor,soitmustconsidermanyfactorssynthetically。ComprehensivelyconsideringtheaffectoffactorsinvolvedwithweatherconditionanalysescityofwithFuzzyClusterAnalysis。
关键词:模糊聚类分析天气状况景德镇市
Keywords:fuzzyclusteranalysisweatherconditionJingdezhen
一、聚类分析
聚类分析是对事物按一定要求进行分类的数学方法,它有广泛的实际应用。实际的分类问题常伴有模糊性,因此,聚类问题用模糊数学的方法解决更确切。在实际的模糊聚类问题中,主要有用模糊等价关系进行的聚类分析和基于模糊拟序关系的聚类分析。【1】对天气之类的伴有模糊性的聚类问题,用模糊数学语言来表达更为自然.
二、模糊聚类分析的步骤[2]
步骤一:建立模糊相似关系。设为待分类的全体.其中每一待分类对象由一组数据表征如下:,现在的问题是如何建立之间的相似关系,本文采用算术平均最小法,其表达式为:。
步骤二:改造相似关系为等价关系
步骤三:聚类
三、景德镇市天气状况的模糊聚类分析
本文选用1998年-2007年各年的天气形势为对象,对象个数为10个,每个对象对应6个数据,包括平均气压、平均气温、平均相对湿度、降水量、平均风速、日照时数6个数据,天气的状况由这6个数据综合评定。数据为景德镇市的1998年-2007年各年的相应气象数据。数据来源为中国气象局中国地面国际交换站气候资料年值数据集.
具体的数据如下表所示:
3.1建立相似矩阵
根据上面的算法建立的模糊相似矩阵R为:
3.2用平方法求传递闭包
由第一步得到的矩阵R一般只满足自反性和对称性,即R是相似矩阵,需将它改造成模糊等价矩阵,用平方法求出R的传递闭包,便是模糊等价矩阵,通过便可对U进行分类。
由R4=R8,所以R4是传递闭包,也就是所求的等价矩阵.
3.3:聚类
根据所求的等价矩阵进行聚类
四、结论
由于本文所用每个年份的数据差别各有不同,且差别大小也不同,所得的等价矩阵中的数据较多,在聚类时根据的取值分类也较多。
参考文献:
数学建模具体步骤范文篇2
[关键词]层次分析法;模糊综合评价;工程硕士;学位论文质量;评估
[中图分类号]G643.8[文献标识码]A[文章编号]1005-6432(2011)9-0125-03
1引言
我国工程硕士专业学位教育从1984年试点工程类型研究生开始,已经从9个培养单位、10个工程领域、年招生1千多人,发展到2010年的241个培养单位、40个工程领域、年招生8万多人、在校生21万余人。在这种趋势下,如何保证我国工程硕士的培养质量是至关重要的。学位论文是工程硕士培养的重要组成部分,是体现工程硕士综合素质和培养质量的重要标志。通过对工程硕士学位论文质量评估的研究,能够在一定程度上反映工程硕士培养质量的水平,这不仅有利于工程硕士培养质量的提高,而且也有利于工程硕士专业学位教育的长远发展。
对于工程硕士学位论文质量的评估,国内外学者进行了相关的探索研究,其中张士峰探讨了工程硕士培养过程中学位论文选题及论文指导中出现的问题,提出应建立一套完备的评价准则和责任体系来评价工程硕士论文合格与否。王庆金等构建了工程硕士教育质量评价指标体系,并对工程硕士教育质量进行了评价。黄秋萍对影响工程硕士论文质量的因数进行了分析,提出需明确工程硕士学位论文评审标准,完善评价体系。李庚建立了学位与研究生教育质量评估体系。肖立山研究指出端正态度,制定科学标准,精确评分,公正评比,以评促进,加强监督,确保长效是工程硕士研究生培养质量评估工作实践的经验,是工程硕士研究生培养质量评估工作必须注重的环节。令人遗憾的是,目前学者关于工程硕士学位论文质量评估方面的研究成果主要集中于理论探讨与指标体系建立两方面,而在对工程硕士学位论文质量评估的定量分析却为罕见。鉴于学者对工程硕士学位论文质量的评估大多是定性评价的方式,专家评阅标准各不一致,导致论文评估时的主观性很强,论文的质量优劣难辨,缺少一定的客观性和可靠性。同时,评审专家在评阅论文时存在一定的模糊性。下文选择层次分析法(AHP)与模糊综合评价对工程硕士学位论文质量进行评估。
层次分析法(AnalyticHierarchyProcess,AHP),是一种解决多目标复杂问题定性与定量相结合的决策分析方法,该方法能够有效地分析目标准则体系层次间的非序列关系,有效地综合测度决策者的判断和比较。模糊综合评价是一种基于模糊数学的综合评价方法,该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象作出一个总体的评价,具有结果清晰、系统性强的特点,能较好地解决模糊的、难以量化的问题,适合各种非确定性问题的解决。基于层次分析法和模糊综合评价的工程硕士学位论文质量评估,能够使评估更合理,更符合客观实际,从而提高工程硕士学位论文评判结果的准确性。本文在全国工程硕士学位教育指导委员会论文评审参考标准的基础上,通过运用层次分析法(AHP)确定工程硕士学位论文质量评估体系中各指标的权重,然后利用模糊综合评价对工程硕士学位论文质量评估体系的各指标进行定量化分析,最后通过实例分析解决工程硕士学位论文质量评估的问题。
2基于AHP与模糊综合评价模型的构造
工程硕士学位论文质量评估模型的构建是基于AHP以及模糊综合评价理论。先运用层次分析法确定评估体系中各指标的权重,再通过模糊综合评价对该体系进行综合评价,最后根据最大隶属度原理得出最终结果,具体步骤如下:
步骤1:建立评价指标集
据全国工程硕士学位教育指导委员会论文评审参考标准,建立工程硕士学位论文质量评估体系。按照模糊综合评价理论,在工程硕士学位论文质量评估体系的基础上建立评价指标集:
步骤2:确定评估体系中各指标的权重
评估体系中各指标的权重可以通过AHP来确定。首先,构造判断矩阵。利用1~9比例标度,对在同一准则的元素进行两两比较评分,在xi与xj之间比较赋值,其中xij代表i指标对j指标的重要性。其次,计算各指标的权重。通过比较赋值,可以得到若干个两两比较的判断矩阵,专家将其转化成一个综合判断矩阵,通过特征向量法来计算判断矩阵的排序向量,从而可以得到各指标的权重。如果构建的判断矩阵为A如下,求得矩阵的最大特征根λmax,并对这个特征向量进行归一化。
最后,对判断矩阵进行一致性检验。由于各人偏好以及知识水平的差异,难以确保评价者对多因素评判的思想逻辑的一致性,因此为了保证层次单排序的可信性,需在得到λmax后,对判断矩阵进行一致性检验,即计算随机一致性比率:
其中RI为平均随机一致性指标。当CR
步骤3:确立一个评价等级集
根据实际情况及计算量大小,将指标评语分为若干个级别,建立评语等级:
步骤4:明确隶属关系并建立模糊矩阵
通过采用德尔斐法对各评估指标所隶属的评语等级进行考察,从第i个指标对第j个评语等级vj的隶属度rij,由此得出第i个因素u1的单因素评判集ri=(ri1,rr2,…,rin),那么m个单因素的评判集就构造出一个总的评价矩阵R:
3实例分析
本文通过AHP和模糊综合评价对工程硕士学位论文(研究类论文)质量进行评估,具体步骤如下:
步骤1:建立评价指标集
在全国工程硕士学位教育指导委员会论文评审参考标准(研究类论文)的基础上,本文从以下八个方面建立工程硕士学位论文质量评估体系,如下图所示。评价指标集U用向量形式表示为:
步骤2:确定工程硕士学位论文质量评估体系中各指标的权重
本文中,作者邀请了多位工程硕士领域专家与教育专家给工程硕士学位论文质量评估体系中各指标的重要性进行两两比较评分。然后,利用加权算数平均综合向量法确定工程硕士学位论文质量评估体系中各指标的权重,如表1所示。
步骤3:确立一个评价等级集
依实际情况及计算量大小,本模型将待评价的工程硕士学位论文质量评价等级分为5个级别,建立评语等级:
步骤4:明确隶属关系并建立模糊矩阵
文中以某篇工程硕士学位论文为例,采用比值法确定单因素的隶属度,即每一级所占的数目与该指标所有评价项目总数之比为该评价指标的隶属度,详细的评价情况如表2所示。由下可得到指标的隶属度为:
因此,我们可以得出上述工程硕士学位论文质量属于(优,良,中,较差,差)的模糊隶属度为(0.1349,0.5044,0.3607,0,0),根据模糊综合评价求解的最大隶属原则,我们可以确定工程硕士论文质量评估的结论为良。
4结论
针对工程硕士学位论文质量评估的问题,本文提出AHP和模糊综合评价的论文质量评估模型,该模型具有一定的科学性和可操作性。通过对工程硕士学位论文质量评估体系中各指标的量化,能够在一定程度上杜绝评审专家在学位论文质量评估中的片面性。同时,本文充分考虑了评估系统的模糊性,运用模糊评价对论文质量进行评估,能够真实的反映工程硕士学位论文的质量水平,使工程硕士学位论文质量评估更加科学客观。该评估模型在实际运用中,可实现软件化,即用计算机编程对数据进行统一处理,从而达到简化操作,提高使用效率的目的,具有一定的可操作性。此外,该评估模型在其余类型的论文质量评估中也具有一定的参考价值。
参考文献:
[1]张士峰.工程硕士培养存在的问题与思考[J].高等教育研究学报,2008,31(1):81-82.
[2]王庆金,王炬香,孔燕,等.基于灰色系统的工程硕士教育质量综合模糊评价[J].青岛大学学报(自然科学版),2009,21(4):99-103.
[3]黄秋萍.工程硕士学位论文质量的影响因素及解决途径[J].理工高教研究,2008,27(4):72-74.
[4]李庚.对教育硕士专业学位研究生培养质量评估标准的思考[J].中国校外教育,2009(8):344-345.
[5]肖立山.对工程硕士专业学位评估的几点认识[J].石油教育(双月刊),2009,22(3):73-75.
数学建模具体步骤范文1篇3
【关键词】IP化网络文本文本分类文本聚类组织框架
一、引言
随着移动运营商网络IP化改造日益深入,运营商内部积累了大量跟IP化网络相关的文本,而如果移动IP化网络文本无法快速、准确地进行分类,将会直接造成网络维护工作无章可循,进而影响到网络的安全性。现有处理移动IP化网络文本的方法一般是采用人工分类归档的方式,这种手工的方法有很多不尽如人意的地方,因此,迫切需要人们研究出相关工具以对大规模的文本信息进行有效的过滤并进行自动分类组织。
本文在基于文本分类[1][3]、聚类算法的基础上实现了一种建立移动IP化网络文本组织框架的方法,提出了一套完备且可完善的文本组织框架:采用人工聚类与机器聚类相结合的方式得到了一套科学合理的文本组织方法;采用重复分类训练学习过程及定期重复框架聚类过程的方式实现了该套文本组织框架的动态完善;将移动IP化网络文本进行系统化管理,网管人员可随时根据需要从文本库中搜索和查询所需要的文本,获取相关知识。对文本分类聚类模型进行测试,结果显示,多聚类算法得出的第二文本框架与专家分类框架具有很大区分特征[8-11],文本分类的正确率达到了70%以上,基于内容的索引搜索效率很高,提高了文本管理人员查找文本的效率。系统的部署与应用,改变了中国移动在开展IP化过程中缺乏智能化分析系统的现状,提高了网络维护的针对性、主动性和前瞻性。
二、文本分类聚类技术模型设计
2.1现有文本处理方式存在的问题
现有处理移动IP化网络文本的方法一般是采用人工分类归档的方式,网管人员通过查看一定数量的移动IP化网络文本的全部内容、摘要或关键字根据个人的工作经验、理解预先建立移动IP化网络文本组织框架,然后根据建立的移动IP化网络文本组织框架以及新的移动IP化网络文本中包含的相关内容,对该新文本进行手工分类归档,并通过不定期的检查和整理的方式维护分类归档的移动IP化网络文本。当需要查询IP化网络相关文本时,输入相关搜索特征词,系统从移动IP化网络文本组织框架的相应分类中查询特征词对应的文本,并输出给查询人员。
有上述可见,现有移动IP化网络文本(以下简称为文本)处理方式存在以下缺点:(1)文本组织框架缺乏科学性及一致性。现有的文本处理方式属于粗放式的文档管理方式,文本组织框架以及文档的整理分类完全取决于网管人员的专业知识水平、业务能力及工作态度,分类的方式受个人主观因素影响较大,不同的人有不同的看法,在这样的方式下,很难保证各个网管人员构建的文本组织框架采用统一客观的分类标准,缺乏科学合理性。(2)效率较低,准确率不能保证。人工归档的方式需要消耗较多的时间,尤其在文本数量较大的情况下,不能实现较高的处理效率;并且这种人工归档的分类方式还会受到一些个人因素的影响,如专业知识水平、人为判断的失误等的影响,使得分类准确率不高[2]。(3)不利于网管人员的检索、利用现有文本知识。采用现有的处理方式处理移动IP化网络文本,即网管人员按照自身已经建立的文本组织框架以及阅读文本后的理解来对文本分类,使得不同专业人员的分类方式存在偏差。由于未能采用统一客观的分类标准,从而使得相应的网管人员对该文本的搜索、查询与利用变得十分困难,致使文本知识的利用率低下,而且,检索得到的文本出现重复,也增加了检索所需的时间,浪费了系统资源。
2.2文本分类聚类模型的设计思路
该模型的主要理论基础是文件聚类和文本分类算法,前者的基础是先把文本进行分词[4]和向量化表示[5][6],即预处理过程,之后根据一定的聚类算法把具有相似性质的文本归为一类,以此为基础可形成文本组织框架;分类的过程则是在已有文本框架的基础上进行数据的训练过程,形成一定的分类器模型,当有新文本进来时可以自动根据文本内容进行文本分类。具体过程如图1所示。
为了改变目前IP化网络文本管理过程中的不足,本文在对文本挖掘进行较为广泛的探索与研究的基础上,结合人工分类及基于统计方法的文本聚类与文本分类方法,设计了一种面向IP化网络文本挖掘算法模型。该模型充分利用了IP化网络中专业术语较多的特点,通过总结归纳这些术语,形成分词库,抽取文本的特征词[8-11],计算文本特征向量[8-11],实现文本聚类及文本分类算法的应用。
2.3文本分类聚类模型
对文本数据的建模和处理思路如图2所示。
(1)模型数据源
IP承载网建设与维护相关OA文、维护管理办法、建设文档等。核心网VOIP改造相关OA文、维护管理办法、建设文档等。
(2)模型大致流程
首先为保证所形成的文本组织框架的质量,需要选择精度高、适应性强的聚类算法作为聚类工具,在流程的开始阶段需要进行小样本的数据实验,对K-means[7]、模糊C、蚁群以及层次聚类算法所形成的文本框架进行比较,并结合人工分类框架进行评估,最后选出蚁群算法这种最适合IP化网络安全文本的聚类算法作为后续流程的主要聚类算法。
在选出最优的聚类算法之后开始使用该算法对全部的文本集进行聚类,形成初步的文本组织框架;该框架作为分类的先验知识进行分类的训练形成分类器,训练方法有很多,本文采用了支撑向量机(SVM[6])和KNN[7]两种方法进行训练,通过比较发现前者较优。
分类器形成之后,当有新的文本进来时,分类器会自动根据文本内容对其进行分类,并将文本归入相应的文件夹下。每周一段时间可以结合专家知识对误判率进行计算和评估,如果误判率高于临界值,就说明原来的文本框架已经不再适用于新的文本集,需要对现有的全部文本集进行重新聚类形成新的文本分类框架,这样就实现了文本组织框架的更新和完善过程。基于所形成的文本框架,网络安全维护人员可以进行方便快捷的检索和学习。
(3)模型预期效果
①可优选一种与人工分类结果较为接近的文本聚类算法,可实现大数据量文本的准确聚类;②可对新增文本进行较为准确的分类,减轻网管人员进行文本管理的压力;③可实现对文本的多为搜索,帮忙网管人员更为精确地找到所需要的文本。
三、文本分类聚类技术模型的实现
3.1文本分类聚类技术模型实现概述
所述的数据输入模块用于采集IP化网络安全文本数据;所述的数据分析模型用于接收数据输入模块传递来的数据,并且对接收到的数据进行挖掘分析,形成四个数据分析子模块;所述的分析结果输出模块用于把数据分析模块分析的结果结合输出要求呈现给输出端;在模型中,所述的移动IP化网络文本数据包括设备指标文本、IP承载网文本、交换设备文本、全网业务文本及安全管理与网管支撑文本;所述的数据分析模块中的四个数据分析子模块分别是:专家处理子模块、多聚类算法子模块、文本分类及文本框架完善子模块和文本组织框架合成模块。具体如图3所示。
本文同时提供上述文本数据分析模型的实现方法,具体步骤如图4所示。
下面结合实例给予说明:
1.数据输入步骤:通过数据输入模块导入IP化网络文本数据,IP化网络文本数据包括集团公司、省公司、地市公司的很多发文、管理办法和不同地方网络维护案例文本及不同部门交流文本数据。
2.数据分析步骤:
A.专家处理子模块步骤:本文的方法以IP化网络文本数据为基础,先通过专家处理子模块让专家对现有小样本的文本数据进行整理,得出IP化网络文本数据的分类框架。比如框架第一层氛围分为指标类材料、IP承载网类材料、交换设备类材料、全网业务材料、安全管理与网管支撑材料五大类,每一大类都又分为不同子类。如表1所示。
B.多聚类算法处理子模块:通过聚类算法子模块采用不同的聚类算法对小样本的IP化网络文本数据进行分析,得出不同的分类结果;比如通过k-means聚类算法、模糊c均值聚类算法、蚁群聚类算法、层次聚类算法等不同聚类方法进行聚类计算,并输出聚类结果。通过对小数据样本聚类得出的结果作为评价来选出适合IP化网络文本的聚类算法,当遇到大的数据样本时,应用已经选出的聚类算法进行挖掘。比如小样本中蚁群聚类算法结果最为贴近专家分类结果,后面的聚类方法就都采用蚁群聚类算法来进行挖掘。
C.文本组织框架合成模块:把聚类算法子模块输出的分类结果和专家分类结果比对,采用专家分类结果作为文本数据分类的框架,将小样本的专家分类结果作为指导,将和专家分类结果最相近的聚类算法的聚类结果填入专家分类结果中,实现全部文本数据的合理分类。
D.文本分类及文本框架完善子模块:新的文本进来,文本分类及文本框架完善模块会依据现有合理的文本组织通过文本分类算法对新进入的文本进行分类,专家判断错误率到达了多少,如果错误率高于阈值,就会记录为误判,把所有的数据用在阶段最优的算法重新进行聚类计算,然后通过文本组织框架合成模块合成新的文本组织框架;具体的逻辑框架图如图5所示。
3.分析结果输出步骤:在数据分析结果输出模块,用户可以根据自己的需求通过树形框架结构找到自己想要的文本,也可以通过关键词搜索,得到最相关的搜索结果。大大提高对公司现有文本资源的利用效率。
3.2文本分类聚类技术模型的具体实现
本模型是一种建立移动IP化网络文本组织框架的方法。该方法根据预先设定的样本量建立第一文本组织框架,应用多聚类算法对所述预先设定的样本量进行聚类,选定与所述建立的第一文本组织框架最为相似的聚类算法建立的第二文本组织框架,根据所述第一文本组织框架和所述第二文本组织框架建立文本组织框架。本模型在实现过程中具体流程如图6所示。
步骤1:根据预先设定的样本量建立第一文本组织框架。本步骤中,预先设定的样本量为一定数量的IP化网络文本,本实验中,预先设定的样本量为小样本量,IP化网络领域内的专业技术人员根据已有的专业技术框架、自身的工作过程中积累的经验及对文本的理解来实现IP化网络文本组织框架的制定,比如,根据各文本的文本特征向量[8-11],建立五大类的IP化网络文本组织框架,即文本组织框架包括:指标类材料、IP承载网类材料、交换设备类材料、全网业务材料及安全管理与网管支撑材料,并计算每类对应的分类文本特征向量[8-11]。当然,实际应用中,也可以根据实际的需要,按照文本特征向量[8-11]构造其他类型的IP化网络文本组织框架,比如,将IP化网络文本按照集团公司、省公司、地市公司的发文、管理办法、不同地方网络维护案例文本及不同部门交流文本数据进行划分,构造相应类别的IP化网络文本组织框架。
在模型实现过程中,对于IP化网络文本组织框架下的每个大类,又可以分为不同的子类并设置每个子类对应的子分类文本特征向量[8-11],比如,将IP化承载网类材料分为五大子类,分别为:设备建设方案、日常维护管理办法、安全评估与巡检、省际IP承载网相关文件、网络改造与调整;交换设备类材料分为工程建设方案及管理办法、专项提升活动等子类;全网业务材料分为网络运行维护实施、应急处理与重大故障等子类;安全管理与网管支撑材料分为账号与口令安全管理办法、其他安全管理办法及文件等子类。请参见表2所示的IP化网络文本组织框架示例。
本步骤中,由于专业技术人员具有良好的专业技术水平及丰富的经验,对文本的理解较为全面、准确,使得对文本进行分类的准确性高,描述各个分类的文本特征向量[8-11]恰当、准确性高。从而使得建立的文本组织框架科学性强、可信度高,可作为优选聚类算法的主要依据;同时,由于预先设定的样本数量不会太多,分类、归档所需的时间较少,属于在人工可处理的范围内。
步骤2:应用多聚类算法对预先设定的样本量进行聚类,选定与所述建立的第一文本组织框架最为相似的聚类算法作为优选聚类算法。
该优选聚类算法将在第一文本组织框架已无法进行准确分类的情况下,启动计算,得出第二文本组织框架,用于文本分类。
本步骤中,多聚类算法(文本挖掘算法)包括:k-means[7]聚类算法(k-meansClusteringAlgorithm)、模糊c均值聚类算法(FuzzyC-meansClusteringAlgorithm)、蚁群聚类算法(AntColonyOptimizationAlgorithm)、层次聚类算法(HierarchicalClusteringAlgorithm)等。各算法及对文本的聚类流程属于现有技术,其详细描述请参见相关技术文献,在此不再累赘。
实际应用中,由于不同的聚类算法对相同数量的样本进行聚类时,其聚类结果可能存在较大的差别,且各聚类算法的聚类结果真实可靠性也无从评估,因而,采用不同的聚类算法将对聚类结果产生实质性的影响。本示例中,通过选用不同的聚类算法对预先设定的相同数量的样本进行聚类,对聚类结果(文本组织框架)与第一步中建立的IP化网络文本组织框架进行比较,选取与人工分类结果的相近程度最好的聚类算法结果对应的聚类算法,作为优选聚类算法。
步骤3:以第一为文本组织框架作为文本分类依据。本步骤中,在得到第一文本组织框架及优选的聚类算法的基础。
步骤4:根据所述文本组织框架,对新文本进行分类。本步骤中,导入IP化网络文本数据后,按照每个样本包含的内容,抽取文本中的关键词,构造各文本的文本特征向量[8-11],以文本组织框架为依据,将新文本的文本特征值与文本组织框架中各类包含的文本特征值进行匹配,将该新文本分类至文本组织框架中相应的类别中。
被分类的样本经过预处理,抽取文本中的特征词[8-11],获取各文本的文本特征向量,与文本组织框架中各子类包含的文本特征向量进行匹配,将各文本分类到文本组织框架中相应的子类;于此同时,抽取新增的部分文本进行人工分类,比较人工分类与自动分类的误差,当误差超过阈值时,启动已选出的优选聚类算法建立的第二文本组织将文本分类,比如,上述示例第二步中,假设蚁群聚类算法对预先设定的样本的算法结果(第二文本组织框架)最为贴近建立的第一文本框架。当误差超过阈值时,重新启动蚁群聚类算法计算第二文本组织框架。
本模型实现过程中,还可以利用文本分类结果,对所建立的文本组织框架进行调整,参见步骤5。
步骤5:从新的文本中,选取一定数量的文本,根据第一文本组织框架进行人工分类;本步骤中,选取的这一定数量的文本,在步骤4中已进行了自动分类,将自动分类结果与人工分类结果进行比较。
步骤6:将自动分类结果与人工分类结果进行比较,如果自动分类结果误差大于预先设定的阈值,启动优选聚类算法,计算新文本组织框架,作为第二文本组织框架,代替第一文本组织框架。本步骤中,预先设定的阈值可以是自动分类结果与人工分类结果中包含的相异的文本个数与人工分类结果包含的文本个数之比。如果没有超出该阈值,表明当前建立的文本组织框架运行良好,可靠性高;如果超出该阈值,需要按照人工分类结果调整文本组织框架中各大类相应子类对应的文本特征向量[8-11],或者重新应用前述优选的聚类算法对所有文本(新旧文本)进行聚类,得到新的文本组织框架,用该新的文本组织框架代替原有的文本组织框架,当自动分类结果误差大于预先设定的阈值时,重新启动优选的聚类算法进行聚类得到新的文本组织框架。
实际应用中,上述对所建立的文本组织框架进行调整,主要是在利用第一文本组织框架对新文本分类时,由于建立的第一文本组织框架是基于有限的样本量,因而,在大样本量的情况下,可能存在一定的分类误差,而且随着样本量的不断增大,其误差可能也越来越大,因而,通过人工评估,当误差超出预先设定的阈值时,可以用前述的优选文本聚类算法结合人工评估结果重新生成文本组织框架,以替换该第一文本组织框架。
当然,在建立文本组织框架后,网管人员就可以利用该文本组织框架进行搜索和查询,获取所需的文本,例如,网管人员可以输入搜索特征词,文本组织框架查询关键词对应的文本特征值[8-11],将该文本特征值所属的搜索结果(文本概述等信息以及文本所属的大类及子类)输出给网管人员,这样,与传统的关键词的搜索方式不同,由于可根据文本特征值进行搜索,搜索情况更接近文本的内容,每个文本可供搜索的内容更多,使用文本搜索更贴近文本内容。
四、测试与分析
通过模块层次图和数据流图的进一步设计,基于VC编程环境,本研究将设计的模型进一步在机器上实现,开发出IP化文本分类组织框架和基于文本内容的搜索。测试结果表明多聚类算法得出的第二文本组织框架与专家分类框架具有很大区分特征[8-11],文本分类的正确率达到了70%以上,基于内容的索引搜索效率很高,提高了文本管理人员查找文本的效率。
4.1测试系统
对于中国运营商来说,3G的日益临近,网络IP化成为一种不可逆转的趋势。通过对现有网络进行IP化的改造来实现多网融合最终完成3G网络的建设已经成为国内外各大运营商的共识,IP化网络在核心网的比重越来越大。目前,对计算机IP网络的评估已经有一些研究成果及应用系统。但是,针对运营商中IP化网络具体特点,建立科学、可行的安全评估模型但成了摆在中国运营商面前的一个重要的问题,同时也是在地市公司在从事具体维护工作中不得不去思考的一个问题。
目前,对于IP网络的评估方法一般需要一些先验知识,如威胁出现的概率、无形资产赋值等,而准备获得这些数据是存在困难的,为此,已有的模糊、神经网络等方法建立的安全估计模型只能对于局部系统进行评价,且多局限的理论的说明,未能有一些全面的,可行的安全评估模型及可投入使用的评估系统的产生。因此,本产品希望从移动运营商IP化网络的运营实际出发,从技术、管理、安全意识等更加宏观的层面来审视安全评估问题,并依托省网管已经建立的“网络运营支撑平台”,建立基于粗糙集的IP化网络安全评估系统。
对于地市公司公司来说,随着公司网络集中化建设的进行,地市公司对IP网络的维护权限多停留在设备的维护方面,维护行为也多以被动实施为主,往往缺乏对自身网络安全性的科学及客观的把握。为此,该系统所采用的模型也从地市公司IP化网络的具体建设及维护实践出发,采用粗糙集的理论来建立网络的安全模型、采用粗糙集理论来分析网络各项安全因素的轻重关系,输出决策规则,建立IP网络下客户感知及网络质量的共同提升模型,从而建立起一套科学完善的IP网络评估算法,从而为地市公司从事IP化网络的建设和维护提供指导,变被动为主动,全面提升IP化网络建设与维护的有效性。
本文设计的文本挖掘模块作为该系统中重要的一个组成部分,对于IP化安全文的深入挖掘,实现IP化网络的安全保障起着重要的作用。对于粗糙集实现网络安全评估方面因为不是论文的主要内容。因此不作主要描述。本文重点描述了一种面向IP化网络文本挖掘模型在系统中的具体实现。
文本模块从文本导入、文本框架导入、聚类方法选择、文本聚类、文本分类、文本搜索和浏览等方面把模型中的主要功能分别在不同模块中实施。其中聚类方法选择模块中集成了K-means聚类算法、模糊C聚类算法、分层聚类算法和蚁群聚类算法,是模块中的核心部分。系统的模块层次如图7所示。
在系统的模型层次图的基础上,进一步设计研究了系统的数据流图,从数据输入层、数据预处理层、核心算法层、用户使用层等层面围绕文本组织框架为核心全面铺开。找出系统输入、处理、输出过程中的关键数据存储和逻辑处理,理清了内部逻辑的相互关系。系统的数据流图如图8所示。
4.2系统相关模块的功能说明
在系统实现过程中,主要实现了如下几个模块:IP化网络安全文本数据导入模块、第一文本组织框架处理模块、多聚类算法模块、聚类结果匹配模块、以及文本组织框架生成模块,各模型具体功能如下:(1)IP化网络安全文本数据导入模块:用于导入IP化网络安全文本数据,分别输出至第一文本组织框架处理模块和多聚类算法模块;(2)第一文本组织框架处理模块:用于对接收的文本进行分类整理,建立第一移动IP化网络文本组织框架,并将建立的第一移动IP化网络文本组织框架信息分别输出至聚类结果匹配模块及文本组织框架生成模块;(3)多聚类算法模块:用于根据预先设置的多聚类算法对接收的文本进行聚类,向聚类结果匹配模块输出聚类结果;(4)聚类结果匹配模块:用于根据接收的第一移动IP化网络文本组织框架信息匹配来自多聚类算法模块的聚类结果,将与第一文本组织框架最为相似的聚类算法的聚类结果信息输出至文本组织框架生成模块;(5)文本组织框架生成模块:用于根据接收的第一移动IP化网络文本组织框架信息以及聚类结果信息建立文本组织框架。
IP化网络安全文本数据导入模块、第一文本组织框架处理模块、多聚类算法模块、聚类结果匹配模块、以及文本组织框架生成模块等5模块具体逻辑关系如图9所示。
在实现过程中,该模块可以进一步包括如下可扩展模块:(1)文本分类模块,用于依据文本组织框架生成模块中存储的文本组织框架信息,对来自IP化网络文本数据导入模块的文本进行自动分类。(2)文本组织框架调整模块,用于接收来自文本分类模块的自动分类结果、以及来自第一文本组织框架处理模块对同批量文本的人工分类结果并进行比较,如果自动分类结果误差大于预先设定的阈值,按照人工分类结果调整文本组织框架生成模块存储的文本组织框架信息。(3)搜索和查询模块,用于接收来自外部的搜索关键词,发送至文本组织框架生成模块,将文本组织框架生成模块根据存储的文本组织框架信息查询得到的关键词对应的文本信息进行输出。
系统中各模块相互协同共同完成模型所要求的功能,流程如下:(1)IP化网络文本数据导入模块、第一文本组织框架处理模块、多聚类算法模块、聚类结果匹配模块、以及文本组织框架生成模块,其中,IP化网络文本数据导入模块,用于导入IP化网络文本数据,分别输出至第一文本组织框架处理模块和多聚类算法模块;(2)第一文本组织框架处理模块,主要有领域专家来完成,领域专家通过人工的方式来获取接收的文本信息中包含的关键词,根据关键词构造各文本的文本特征向量[8-11],利用文本特征向量对所述预先设定的样本量的IP化网络文本进行分类整理,建立第一IP化网络文本组织框架,并将建立的第一IP化网络文本组织框架信息分别输出至聚类结果匹配模块及文本组织框架生成模块;(3)多聚类算法处理模块,用于根据预先设置的多聚类算法对接收的文本进行聚类,向聚类结果匹配模块输出聚类结果;聚类结果匹配模块,用于根据接收的第一IP化网络文本组织框架信息匹配来自多聚类算法模块的聚类结果,将与第一文本组织框架最为相似的聚类算法的聚类结果信息输出至文本组织框架生成模块;(4)文本组织框架生成模块,用于根据接收的第一IP化网络文本组织框架信息以及聚类结果信息建立文本组织框架。
4.3系统相关模块的功能说明
通过移动公司的IP化网络文本测试了本研究设计的功能模块,测试结果显示文本框架与专家分类框架具有很大区分特征,文本分类的正确率达到70%以上,基于内容的索引搜索效率很高,提高了文本管理人员查找文本的效率。
4.3.1文本聚类测试结果分析
该部分通过文本聚类实现文本框架的形成。系统提供四种聚类方法的实现:K-means[7]、模糊C聚类、层次聚类、蚁群聚类算法;每种聚类之后,都将在下方的显示框中展示聚类的结果,也即文本组织框架。之后通过比较不同聚类的聚类结果,选出最优的聚类算法。
K-means[7]聚类算法可以调整三个参数:聚类数目、最大迭代次数、文档向量维数。现有文本专家聚类分为3类:IP承载网、全网业务、安全管理与网管支撑。
模糊C均值聚类算法可以调整五个参数:聚类数目、误差限、参数m、最大迭代次数、文档向量维数。其中参数m的调整范围为1.5~2.5。如图10所示。
其中K-means[7]聚类算法将文本通过迭代1000次,采用100个特征词提取出文档向量,分出第一类的文本数量为67,第二类的文本数量为2,第三类文本数量为1。如图11所示。
4.3.2文本分类测试结果分析
该部分暂时无需选择路径,仅采用样本数据实现,因为专家分类文档没有经过聚类算法,提取不出特征值,无法作为分类;此环节耗时较长,可能需2-3分钟,各机器性能不一可能略有差别。
本部分工作的基础是使用上一步骤选取最优的聚类算法对所有文本进行聚类形成合理的文本组织框架并训练形成分类器。分类器形成后,就可以对新进入的文本进行分类,一般分类正确率在70%以上。
图12展示了对实验数据进行分类的结果,对34个文本进行分类,分类正确率达到80%。证明该文本框架所形成的分类器具有较好的分类能力。图中标红的文本本分到了错误的类别中了,其余是被正确分类的文本;分完后可以查看通过上面的选择查看单个文本分类情况,如图13。
4.3.3文本搜索测试结果分析
本部分是基于前述文本组织框架的文本搜索模块,目前系统可供使用的检索词包括发文单位(集团、省公司、使公司)、文本类别(通知、申请、报告、自查报告、紧急通知等)、文件名(输入要找的关键词,系统将使用该关键词在所有文本的文件名中进行检索)、发文时间等。系统正在实现的功能是基于特征词的检索,在文本分词阶段每一个文本都被分成若干特征词所表示的向量,输入特征词就可以实现基于内容的检索,大大提高了检索的效率和准确度。
其中基于内容的特征词的搜索是一个创新,通过文本训练,提取出所有搜索范围内的文本的特征词,通过特征词的频率来确定不同文本的区别,如100维特征词的训练结果就将不同文本通过挑选出来的100个文本特征词的频率来表示,实现文本的向量化,如果某一特征词在文本中没有出现,则向量这个点上的取值为0。训练后的文本集就形成了一张二维表,一个维度是文本,一个维度是特征词,这个二维表是基于文本内容训练出来的,通过此二维表的特征词来搜索文本比其他几个维度效率更好,效果更好。
如图14所示,搜索范围选择IP化安全管理系统文件夹中的clusters文件夹(因为要基于特征词搜索需要有能提供特征词的文件夹)。
查询得到的文本可直接在检索结果栏中打开阅读。如图15所示。
数学建模具体步骤范文篇4
关键词:钣金件模具;冲压进程;变形解析
中图分类号:TM7文献标识码:A文章编号:1673-1069(2016)20-114-2
0引言
钣金件冲压时,模具表现出必要的价值,是不可忽视的。然而,钣金件成形的各步骤都隐含了塑性变形的隐患。某些钣金件设定了较高精密性,加工配备的模具也应被重视。在模具冲压中,不可忽视细微的钣金件变形。对此,构建了有限元模型用于解析,仿真得出冲压进程的钣金模具变形状态[1]。解析结论表示:若没有设定较高层次的冲压要求,那么采纳刚体处理常见的流程即可;若设定了精密成形,则还需兼顾整体的钣金件变形。实际上,筛选的模具材质密切关系到细微的变形刚度。获得这种结论,可为后续设置模具或者拟定工艺流程提供必备的参照。
1变形解析的必要性
钣金件经过塑性加工,很难避免细微的形变。冲压的进程中,各类钣金件配备的模具都较容易变形,因而增添了后续加工的更大难度。钣金件在接受冲压时,总体受力及细微的局部荷载都将变更,这些作用力驱动了钣金件变形,属于塑性变形。相比于其他工艺,冲压工艺从根本上改进了原有的钣金件塑性,改善力学属性。与此同时,也提升了冲压进程的成效性。钣金件冲压时,优选合适的工艺流程还可节省耗费的钣金原材,制作出多样形态的钣金截面[2]。
从冲压成形角度来看,可归因于多样的影响要素。在这些要素中,不均衡的原材变形应被看作首要因素。从目前来看,模拟成形进程的新方式正被推广,用于各类钣金模具冲压。在数值模拟中,先要选取合适的解析对象。经过模拟之后,可选取有限元解析来获取结论。这样做,在最大范围内减低了冲压中的额外耗费,缩减了开发钣金件的总体时间。同时,也减低了耗费的冲压及制作经费。
2钣金件模具冲压变形的有限元分析
针对冲压进程,要依照有限元解析的根本理论予以详尽分析。构建运动方程,采纳了连续介质的解析理论。在这个步骤中,应能衡量系统刚度、加速度及位移、上侧的作用力。经过综合的探析,构建了刚度矩阵、质量及阻尼的矩阵。为了消除隐含的变形偏差,就要在最大范围内防控细微的线性偏差。
依照连续介质力学特定的原理,可以构建如下的运动方程:MA+KU+CV=f。在式子中,M代表质量矩阵,K代表刚度性的矩阵,C代表阻尼矩阵;A、V、U分别代表加速度、运动速度及位移。经过方程求解,可得f的总作用力。对于此,可选取平衡迭代的运算方式。
冲压的进程代表着弹塑性变形及有限的应变。描述这种流程,可选取拉格朗日法来修正某些参数。在构建方程时,还需辨析拉伸屈服性的应力、异性的厚向参数、剪切屈服应力这些数据[3]。此外,钣金件模具经过了冲压后,也会表现出某一摩擦作用。摩擦现象包含着复杂的成因,体现为表面性。通常来看,还需设定正压力及摩擦因数,得出切向摩擦力。针对于相对性的滑动速度,应当设定比值。
3构建分析模型
在构建模型时,可选杯形的对称性钣金件。在冲压进程中,设定了反向挤压。轴对称的典型模具构件依照于特定的成形经过,可化为轴对称的解析方式。对于此,只要选定某一模型用于解析即可。定义接触体时,可设定完整的冲头定义并且选取合适的坯料。在模具单元内,定义得到变形性的模具接触体。
接触体可以变形,对称轴设定为约束性的。在这种状态下,对称轴代表着零位移状态下的法线边界。两个变形体可接触于彼此,而后检验得到双边接触的受力特性。具体在检查时,还需细分主从这样两类的节点。相比于单边接触,双线接触设定了更多步骤的运算,也存储了较多数值。然而,这种运算得出的数值精度将会更高。在塑性变形下,钣金模具经过摩擦将会带来热能,解析了热耦合的初期数值,而后推导可得精确的解析模型[4]。此外,在变形解析时,还不可忽视加工冲压头时的硬化效应。经过后期的解析,描绘出明晰的硬化曲线。由此可以发现:挤压钣金件的进程中,塑性形变可达的最大范围也是有限定的。然而,相对状态下的形变总量是较大的。在不同时段内,挤压力也在相应变化。对于此,描绘了变化中的挤压力曲线。如果弯曲较大,那么表示冲压头超出了设定的硬度限度。
例如,在选取坯料过程中,设定了如下的坯料性能:每立方毫米300000N的杨氏模量、0.3的泊松比、每立方厘米6kg的密度。此外,设定了比热容及热传导率。构建有限元模型时,采纳了虚拟方式。对此可模拟某一刚性体,推动冲压头向下侧移动。
4归纳得出结论
针对钣金件模具,冲压进程中的细微变形都不可忽视。为解析这种变形,可设定数值模拟的步骤及方式。在经过解析后,得出如下结论:
在加大冲压头刚度之后,重设了原先的模拟方式。这样改进之后,相比来看获取了更精准的初期数值。最佳的设置为:缩减至0.5毫米或更低的塑性应变,以及0.1毫米的最大径向位移。
某些钣金件只要大致加工即可,对于这类模具,可比照刚体处理的流程。然而,若事先设定较高层次的成形精度,还需兼顾变形作用下的钣金件成形影响。加工成形状态下,不应忽视潜在的模具变形。这是因为,模具变形表现出较大的钣金件制作影响。为了防控变形,就要优选刚度最佳的钣金构件用于冲压。经过数值解析,模拟得出全方位的工件加工影响。这样做,更能便于设定最合适的工艺路径,指导设计并制作出优质的钣金件模具[5]。
5结语
对于塑性成形,若设定了常规的精度要求,则依照于常见流程予以处理。然而,若要精密成形,则不应忽视冲压步骤隐含的模具变形。实际上,若忽视了潜在的钣金模具变形,会影响到较大范围内的钣金件质量,造成多样的干扰。在选择材质时,还需解析全方位的模具成形影响。模拟冲压成形,解析了各步骤内的精确数值。这样做,模拟得出全面的冲压模具变形。后期在选取冲压路径及制作模具时,都可参照变形解析得出的数值及信息。
参考文献
[1]李捷,董洪全,殷玉枫.钣金件模具在冲压过程中的变形分析[J].现代制造工程,2012(08):56-58+97.
[2]韩志仁,刘跃专.钣金成形毛坯展开方法研究进展[J].塑性工程学报,2012(01):6-11.
[3],刘海鹏,柳玉起.厚钣金件压弯翻边与回弹的数值研究[J].固体力学学报,2012(01):72-80.
数学建模具体步骤范文篇5
关键词:关联规则算法;英语教学
1引言
近年来,随着中国社会经济的飞速发展,市场经济体制的不断完善,特别是加入WTO后,使中国企业有更多的机会在全球发达的市场中展示实力和发展自己的事业,实现了跨国经营。国际大学英语人才在社会经济发展中的作用也因此越来越受到各类企事业单位的重视。可是,市场对大学英语人才的需求是多元化的,它不仅需要传统意义上的“学术型”人才,更需要“技术型”,“技能型”应用人才。为此,我们必须探讨符合时展要求的人才培养模式,否则高职大学英语就不能形成自己的特色,就无法建立起有别于普通高职“大学英语”的课程模式。“从而不会具有很强的生命力,也就没有它发展的空间,甚至失去它作为一种高等教育类型存在的意义。”
本文研究的重点是探讨具有高职大学英语课程教学中关于数据挖掘算法在应用课程目标、课程内容,师资队伍、教学方法、教学评价中所做的工作,这些是体现高职大学英语课程特色的关键所在。
2关联规则挖掘的建构
关联规则挖掘是寻找数据项中的有趣联系,决定哪些事情将一起发生。关联规则挖掘研究是近几年研究较多的数据挖掘方法,在数据挖掘各种方法中应用的也最广泛关联规则的发现可以分成两个步骤:首先发现所有频繁项集,然后用这些频繁项集生成强关联规则。Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用,它的基本思想是利用一个层次顺序搜索的迭代方法来生成频繁项集,即利用K-项集来生成(K+1)-项集,用候选项集Ck找频繁项集Lk。这个方法要求多次扫描可能非常大的交易数据库。而用于关联规则挖掘的事物数据库的规模通常是非常大的,这样一来,开销就非常大。而在有限的内存容量下,系统I/O负载相当大,每次扫描数据库的时间就会很长,这样,其效率就非常低。
关联规则挖掘的任务就是在事务数据库D中找出具有用户给定的最小支持度和最小置信度的强关联规则。强关联规则对应的项集必定是频繁项集,而频繁项集导出的关联规则的置信度又可由频繁项集和的支持率计算。于是,可以将关联规则挖掘分解为以下两个步骤:
步骤一:根据最小支持度找出D中所有的频繁项集。
步骤二:根据频繁项目集和最小置信度产生强关联规则。
在上述两个步骤中,步骤一的任务是迅速高效地找出D中全部的频繁项集,关联规则挖掘的整体性能由该步骤决定。因此,目前所有的关联规则挖掘算法都集中在步骤一的研究上。步骤二是比较容易实现的,首先对于每个频繁项集l,产生l的所有非空子集。然后对于每个l的非空子集s,如果,则输出规则“s=>(l-s)”。
关联算法如下:
输入:交易数据库D;最小支持度min_sup
输出:交易数据库D的频繁项集L
1)L1={频繁1项集};
2)for(k=2;Lk-1≠;k++){
3)Ck=Apriori-gen(Lk-1,min_sup);//新的候选项目集
4)for所有事务t∈D{
5)Ct=subset(Ck,t);//t中所包含的候选
6)for所有候选c∈Ct
7)c.count++;
8)}
9)Lk={c∈Ck│c.count≥minsup}
10)}
11)returnL=∪kLk
3挖掘结果
下表1是学院2007级学生入学以来三次大学英语的成绩,在数据挖掘阶段,先用前述的算法扫描数据库,得到最小支持度阈值min_sup的全体频繁项集,再由频繁项集导出规则知识,最后,对挖掘结果加以解释并转换成易于理解的显式知识。
表1学生英语成绩样本xh
k1
k2
k3
100072351
86
85
75
100072352
88
82
69
100072353
81
86
79
100072354
84
85
77
100072355
78
85
83
100072356
82
87
84
100072357
65
83
89
实例的运行结果与分析:假定取事务数为10。要对表中的优秀课程进行关联规则挖掘,需要给出支持度和置信度。假定最小支持度为30%,置信度为50%。由上述分析得知,计算最终频繁项集的各非空子集的置信度,删除小于最小置信度阈值的记录,最终产生关联规则:
(1)k1,k2同时优秀时,k3有大于67%的优秀的可能;
(2)k1,k3同时优秀时,k2有大于100%的优秀的可能;
(3)k2,k3同时优秀时,k1有大于100%的优秀的可能;
(4)k1优秀时,k2,k3有大于67%同时优秀的可能;
(5)k3优秀时,k1,k2有大于80%同时优秀的可能。
参考文献:
[1]邵峰晶、于忠清著.数据挖掘原理与算法[M].中国水利水电出版社,2008.8
数学建模具体步骤范文篇6
关键词:高职教育;数字化教学资源;资源设计
中图分类号:G434文献标识码:A论文编号:1674-2117(2015)23-0127-04
探究高职教育数字化资源设计模式,可从最一般、最有普遍意义的教学设计模式的研究入手。在分析高职教育数字化资源建设和应用现状,研究教学设计理论、课程开发理论和学习理论,深入实际了解高职教育理论和规律的基础上,本文尝试进行高职教育数字化资源设计模式的构建。该模式共包含九个模块,即确定与分析资源建设目标、高职学习者分析、学习资源内容分析、资源环境分析、教学策略设计、多媒体学习信息设计、形成性评价、修改、总结性评价。前三个模块,模式中将其置于一个椭圆形中,意指这三个模块在实际的资源设计中常常不分彼此,交叉进行。
确定与分析资源建设目标
资源设计活动中最首要的工作就是确定学习资源的建设目标。分析高职教育数字化资源建设的目标,有助于在资源设计活动中选择合适的教学策略,开发合适的评估工具,进行资源应用结果的评估。1.确定资源建设目标在高职教育数字化资源设计中,通过相关的绩效分析不难发现,提升高职教育的信息化和现代化的解决方法包括:提升高职校教育技术环境、加强高职校教师培训,以及建设高职教育数字化资源等。一般说来,在教学设计领域,确定教学目标有四种基本的方法[1]:学科专家法、内容纲要法、行政命令法以及绩效技术法。表1为确定资源建设目标的样表。2.分析具体资源的教学目标加涅把学习结果分为五类[2]:智慧技能、认知策略、言语信息、动作技能和态度。在高职教育数字化资源设计活动中,对某一具体资源的目标进行分析,有助于精确地确定高职学习者通过该资源的学习能够有什么具体的行为表现。表2为分析资源建设目标样表。
高职学习者分析
资源设计中的学习者分析,主要是考虑与学习效果相关的学习者特征。通过文献调研与实践分析,笔者在下页表3样表具体的“学习者分析”步骤中提炼出了几个有意义的因素。但需要说明的是,在实际的资源设计实践活动中,这些因素不必全部包括进去,笔者只是提供了一种较为全面而有效的参考而已。该说明同样适用于本文后面的其他样表。
学习资源内容分析
具体资源的内容分析是高职教育数字化资源设计中的关键步骤,之后的教学策略设计、媒体设计、平台选择、评价都要以此为依据进行。内容分析阶段的主要目的是帮助教学设计师更好地把握内容的定位和要求,在此阶段不会也不要进行任何具体的教学内容设计。[3]高职教育数字化资源设计活动中,内容分析的目的在于帮助资源设计者更好地了解不熟悉的学习者(高职生)的学习内容,从而确保资源设计的质量。一般说来,确定学习内容有三种方法[4]:主题分析、程序分析和关键动因分析。具体来说,在高职教育数字化资源设计中,可以这样对某个具体资源建设的内容进行分析:通过主题分析,明确该资源的内容及组成要素的结构,分析的具体程度应视高职学习者在该领域的知识水平而灵活掌握;通过程序分析,明确高职学习者完成该资源的教学内容所需要的步骤,以及步骤间转换的线索;通过关键动因分析,获取与高职教育资源相关的人际技能与态度。表4为资源内容分析样表。
资源环境分析
资源环境分析包括两部分:传输教学的环境和所学知识的应用环境,也就是学习环境与绩效环境。高职生学习环境与绩效环境的差异性,是资源设计者应该十分重视的设计制约因素。表5为环境分析样表。下面着重考虑真实的社会作为资源设计的绩效环境的若干特征:①绩效环境对高职生的导向。这里要考虑的因素是真实的社会对高职生运用所学知识的组织支持,扩展一点说是社会对高职生的关心与重视程度。②绩效环境与高职生所学新知识的关联。这是分析高职生所学新知识在真实社会中是否有用武之地,以及是否存在哪方面的物理或环境限制。这一方面要求资源设计者多为高职生设计与真实社会相关的新知识与技能;另一方面,也凸显了社会支持系统在高职生绩效环境中的重要性。学习环境中一般考虑以下因素:①高职校教学环境的客观情况。获取高职校教学环境的客观信息,目的是考察它对于数字化学习的适合程度,具体内容包括有多少间多媒体教室、是否已建成校园网、师机比、生机比等客观信息。②高职校教学环境对真实社会的适应性。这里主要是考虑高职生在高职校获取的知识,在真实社会中是否有用,是否具有兼容性。如果有差距,在高职校的教学环境中可以做哪些改变和调整,以增强知识的可迁移性。③高职校影响数字化学习的限制条件。笔者要进行高职教育数字化资源设计,应该在进行策略设计和信息设计前考虑学习环境中的若干限制条件,如基础设施、师资、资金、现有资源及应用状况等。
资源的教学策略设计
关于教学策略的研究理论成果颇多,经过比较和甄别,笔者拟在研究时间较早、较具权威性的加涅的相关学术思想指导下进行这部分内容的分析。需要强调的是,虽然以加涅的教学事件作为策略设计的起点,但是最终的学习资源策略设计应该尽最大可能兼顾到ARCS(吸引注意力,建立认知关联,保持自信心,维持满意感)模型的理念。上页表6为教学策略设计样表。
多媒体学习信息设计
完成了教学策略设计之后,就可以进行学习信息的设计。关于学习信息设计,有多种不同的论述,这里援引王永锋的观点[4]:所谓信息设计就是将各种多媒体元素看作待加工的信息元素,思索在计算机界面中如何有效组织设计这些元素,以利于学习者有意义学习。一般来说,多媒体元素包括五大类:文本、图形(图像)、音频、视频、动画。多媒体学习生成理论[5]是理查德•迈耶和其合作者结合认知心理学对人类信息加工的研究以及自己十多年实验的基础上总结出来的一系列指导多媒体学习与多媒体学习材料设计的定律。在进行高职教育数字化资源设计中,可将理查德•迈耶的多媒体学习理论作为重要的设计参考因素。上页表7为多媒体学习信息设计样表。
形成性评价
资源设计中引入形成性评价,可以从学习者那里收集到与教学材料的使用及教学效果有关的数据,从而资源可以在正式使用前修改得更能促进学习。形成性评价的步骤一般包括一对一评价、小组评价、现场试验。[6]关于在每个步骤中具体需要考量哪些内容,笔者建议在高职教育数字化资源设计的“形成性评价设计”的每个步骤中,将形成性评价之前的几个教学设计步骤都作为考量内容,换句话说,将资源设计进行到现在所形成的“成果”都作为形成性评价的内容。上页表8为形成性评价设计样表。
修改
形成性评价的目的是为了修改教学。在高职教育数字化资源设计中,这一步骤与上一步骤紧紧相连且紧密对应,是根据上一步骤获得的信息来对每个考量因素做出相应的调整,修改教学样表如上页表9所示。
总结性评价
在资源设计活动中,总结性评价是收集数据和信息的过程,其目的是做出决策,确定是否继续使用当前的学习资源。总结性评价的核心评价者一般不是教学(资源)设计者。总结性评价往往更需要不熟悉资源设计详细过程的外部评价者,以便更公正客观地看待资源的优点与缺点。
参考文献:
[1][6]W.迪克,L.凯瑞,J.凯瑞.系统化教学设计(第六版)[M].庞维国等,译.上海:华东师范大学出版社,2007:314.
[2]SusanElizabethCrichton,GailKopp编,汪琼等修订.多媒体教学资源开发手册[M].北京:中央广播电视大学出版社,2007.
[3]GaryR.Morrison,StevenM.Ross,JerroldE.Kemp著,严玉萍译.设计有效教学(第四版)(DesigningEffectiveInstruction,FourthEdition)[M].北京:中国轻工业出版社,2007.85.
[4]王永锋.基于认知的多媒体学习信息设计研究[D].长春:东北师范大学,2006.
数学建模具体步骤范文
虚拟特性的仿真软件,用于三维造型、数控关联的模拟加工、其他范畴的实践步骤,获取优良成效。
1技术特有的实用属性
虚拟架构内的仿真技术,搭配着某规格特有的软件。高职实践授课,采纳这一范畴的软件,能化解真实态势下的若干疑难。虚拟仿真软件,规避了实训特有的设备缺失弊病,拟定了虚拟特性的多重项目。经过实训锻炼,缩减真正操作之中的多样误差。
虚拟仿真范畴之中的成套软件,便利师生互动。实践授课之时,同学依托拟定好的这类软件,彼此切磋技艺,探究多层级的操作疑问。这样做,提升了实践层级之内的真实水准。这种新颖运用,变更了旧式特性的被动认知,调动同学兴趣。
同学自主去探究,提升综合架构下的操作技能,增添课堂以内的授课成效。
2技术运用的范畴
2.1产品设计特有的实践
虚拟仿真架构内的软件,搭配着高端特性的转换模块,可把原初的数据,予以格式变更。通过这类优化,采纳快捷的路径,把3D这一初始的格式,变更成EON。仿真虚拟范畴的配套软件,支持自动特性的校正步骤、关键帧及惯用的顶点缝合、平面框架之内的几何缩减。它能建构清晰的纹理,调节组合架构之中的各类贴图。
例如:机械专业特有的设计课,包含实践框架内的实体建模、对应着的特性建模、拟定形状必备的建模。依托虚拟特性的这类软件,可以建构二维模型、更高层级的三维模型。此外这类软件,还能辨识多层级的真实操作,例如倒角命令、圆柱及圆锥关涉的操作步骤。采纳点网格,拟定最优的曲面。在这之后,即可建构拟合特性的精准模型。修正关涉的曲线参数,采纳数控特有的编辑模型。
2.2设定多样模具
采纳虚拟仿真,可协助高职同学,设定出复杂层级内的注塑模具、带有冷冲模特性的精准模具。根据拟定好的设定向导,辨识操作界面。熟识带有数字化特性的装配路径。复杂等级被设定成中等的建模,整合着添加进来的模架、滑块及镶块、电极衔接着的浇注、冷却必备体系。采纳标准件,来建构这类模型。
后续加工之中,软件可以判别细分出来的加工类别、各类别的特性。例如:UG特有的软件,适宜铣削关涉的加工流程。自动编程拟定好的常见步骤、惯用的若干指令、细节的根本操作,都应熟练掌控。自动编程接续的加工之中,采纳UG这一规格的软件,予以仿真处理。慎重查验设定好的优化步骤,辨识它的适宜性。这样做,机床加工原有的实效、模具加工得来的真实质量,都会予以提升。
2.3实践装配环节
虚拟仿真建构的实训室,包含虚拟特性的模具拆卸、后续的组装。辨识设定出来的装配步骤,包含初始时段的建模步骤、采纳的装配思路、设定的次序、零配件特有的运动解析。例如:模具特有的构架拆卸、成型时段之内的运动仿真,都紧密关联着虚拟软件。仿真软件的协同下,设定了典型特性的装配环节。
3未来进展趋向
虚拟仿真必备软件,提升实践架构之中的授课实效。对于高职同学,是激发潜藏兴趣的最优时机。未来时段的软件仿真、真实运用环节,应凸显差异个性。这是因为,现今时段的授课理念,注重培育独有的兴趣个性,尊重个性差别。虚拟仿真特有的建构软件,调动了深层级的认知热情。通过直观体悟、亲手去操作等,吸引同学注意。未来软件进展,应能融汇多层级的科目知识,整合课余时段的配套实践,提升个性化。
此外,应着力开发带有独立特性的实践体系,凸显本校亮点。建构自主产权,建构可行特性的虚拟实训空间。基础层级内的支撑平台,把储备着的实物、仿真授课体系,妥善予以集成。这样做,能添加固有的容量,建构多样层级之内的实践中心。
数学建模具体步骤范文篇8
【关键词】图像处理偏微分方程模型构建处理步骤
一、图像处理的基本方式
(一)信号分析处理
信号处理的方式是利用空间变化的思路,空间变换的方法就是从早期的频域变换发展而来形成了小波变换。小波变换在时域同时有良好的的局部分析特征,可以实现在多个尺寸上的多分辨特性。小波变换在图像压缩中获得了较好的效果。
(二)随机建模的处理
数字图像在形成的过程中有随机性,所以二维的图形实际是一个随机的场。所及建模的方式是按照随机场对图像域建模,以此描述图像域邻域像素的分布情况,从而完成对图形的描述。通常采用的随机建模方式有高斯混合模型等。随机场模型可以对图形的纹理进行细致描述。
(三)偏微分处理
偏微分方程是一种数学方式,对数字影像进行处理,利用空间域内的像素灰度值进行微分处理,利用二阶方程表征图形中区域边界的特征。微分方程具有各项异性的扩展特征,在不同的图像特征上显示的扩展性能也就不同,所以利用方程迭代处理图形可最大限度的保持边缘特征,同时获得重建的平滑区域。
二、偏微分方程和图像处理的应用
当前利用物理学和力学的变分和偏分方程方法的图像处理技术在计算机图形处理领域已经开辟了新的领域,基于偏分方程的图形处理方式已经获得了重视和良好的效果。其基本的思路就是在一个偏微分方程模型中发展一个图形,一条曲线、一个曲面等,利用求解这个偏微分方程来获得图形处理的期望值。变分和偏微分方程使得数字图像处理进入了一个新的领域。
(一)偏微分方程处理的主要领域
对图形进行去噪处理:图形去噪的典型分析与计算方法是高斯低通滤波器,也即是热扩散方程,因为高斯滤波器在去找的过程中不能保持良好的边缘特征,所以多数研究都是对该特征进行改进,其中较为有效的方式就是由Perona和Malik提出的P-M方程,公式如下:
公式中,迭代步长dt,It是迭代项,ΔI则是拉普拉斯算子,c则代表传导系数。其中div是散度算子,代表梯度算子,Δ是拉普拉斯斯算子。在实际的应用中为了保证模型的收敛性,通常利用经验值,取迭代步长dt值为0.25。在此基础上,PDE去噪的基本思路如下:1)在图像相同质量特征的区域内进行减弱噪声扩散的处理;2)控制区域边界未知不扩散,并保持边缘的基本特征。因为P-M是一个病态问题,所以有研究提出对梯度值正则化处理,然后获得相对稳定的P-M方程。有人提出直接使用扩散张量作为扩散项,从而实现张量偏微分的方程模型。这个模型可以在一个方向上获得快速扩散,而在正交的另一个方向缓慢扩散,由此获得边缘去噪的效果。
图形的放大处理:对图像进行插值放大,获得超分辨率的分析。偏微分方程可以按照图像边缘、水平曲线等几何特征实现插值放大。所以偏微分方程可以最大限度的保持边缘的细节特征,同时可以减弱噪声的影响。在研究中提出基于偏微分方程拟合水平集曲线的图形像素重构。也就研究提出了一种复扩散偏微分方程被放大模式,在减弱锯齿效应的同时,可以锐化边缘的特征。
图形的分割处理:图形的分割也是图像处理的重要内容,计算机和图像处理按照使用的图像特征进行分类处理,可以分为基于边界的分割、基于区域的方法,以及混合分割的方法。如按照使用数学工具和模型,其主要的方法有:基于聚类的方法;基于统计学的方法;基于数学形态的方法;基于偏微分方程的方法,主要有蛇形模型等;基于Graphcut的方法。
(二)图像处理的偏微分模型
在图形处理中,偏微分方程模式有很多种,其中一种是在变分原理的基础上对函数进行优化,这个方式首先对一个特定的图形处理模式,通过变分原理实现对能量函数模型的优化,这样就可得到偏微分方程,通过对偏微分方程数值求解由此完成图形的处理任务。如:整体变分能量泛函
利用此模式就可完成对函数的优化。
三、基于偏微分方程的图形处理的步骤
作为图像处理的一个重要工具,在变分和偏微分方程的图像处理的基本框架和基本步骤如下:1)明确实际问题的出现和处理思路建立,因为不同的应用问题有不同的处理思路和特征,因此采用的处理方式也就不同,所以在处理图像问题时应先掌握问题的关键。2)构建相关数学模型,这一步骤是处理图像的重要步骤,其影响的是处理的过程和结果,数学模型构建将直接影响处理的效果,对微分方程、变分方法、微分几何等进行合理选择与组合,以此获得较好的处理结果,提高处理的有效性。3)模型分析:主要是对模型的适应性进行分析,了解模型解是否存在、解是否唯一、方法是否稳定等,4)分析计算:利用数学模式进行求解,进行微分方程的数值分析,利用有限差分、有限元、迭代法等进行计算,这一步骤会影响相关数学求解的收敛性、稳定性、计算量等。5)程序实现:这个步骤是解决问题的最终步骤,这一步骤的一些问题可以导致前面工作的重新修改,必须慎重操作。
四、结束语
偏微分方程是一种高效的数学处理工具,在图像处理中也获得了较好的效果。连续区域上建立模型,方便对实际问题的处理和数值计算。数学上丰富的偏微分方程处理理论和计算方式,对图形处理的理论分析和算法都给予了较大的帮助,同时不断完善的计算和处理方式将帮助偏微分方程提高图像处理的效果。
参考文献:
[1]李艳霞.基于变分偏微分方程的图像分解研究与应用[D].中国海洋大学学位论文,2009.
数学建模具体步骤范文篇9
关键词:电力客户价值;熵权法;改进的PCA聚类算法;数据挖掘
中图分类号:TN911.1?34文献标识码:A文章编号:1004?373X(2017)07?0183?04
Powerconsumervalueclassificationandapplicationbasedonentropyweightmethod
andimprovedPCAclusteringalgorithm
HUANGFUHancong,XIAOZhaodi,YUYongzhong
(FoshanPowerSupplyBureau,GuangdongPowerGridCo.,Ltd.,Foshan528000,China)
Abstract:Theanalysisofthepowerconsumervaluehelpsthepowerenterprisestounderstandtheirconsumerscomprehensively,providesthedifferentiatedservicesforpowerconsumers,andcanimprovetheconsumersatisfactiontobenefitbothofthepowersupplyenterprisesandconsumers.Thedataminingmethodisusedtoclassifythepowercustomervalue,andconstructtheevaluationindexsystemofthepowerconsumervalue.Theindexesinvolvetheconsumer′spowerconsumptionbehavior,payingbehavior,publicfeelingsandindustrialdevelopmentstatus.Theweightsoftheindexesarecalculatedwiththeentropyweightmethod.AnewimprovedPCAclusteringalgorithmisproposedtoclassifythepowerconsumervalue,whichprovidestheancillarysupportforthepowerenterprisestoformulatethedifferentiatedservicesstrategy.
Keywords:powerconsumervalue;entropyweightmethod;improvedPCAclusteringalgorithm;datamining
0引言
济的发展推动着我国电力事业的快速发展,随着电力市场化步伐的加快,供电企业面临着越来越激烈的竞争,电力客户不再完全是被动接受者,客户的作用越来越大,客户价值的影响也越来越大。然而,电力客户群体广泛,不同客户对于服务内容、方式、深度的需求存在巨大的差异。因此,供电企业迫切需要对客户进行科学的分析,根据客户的综合价值对其进行分类,针对不同的客户群体制定不同的营销策略,为客户提供精益化的服务。
迄今为止,客户价值评价分析的主要方法有模糊层次分析法[1]、结合利益细分法和K?均值的混合方法[2]、结合熵权法与区间数概率分布的混合方法[3]、支持向量机法[4]等。在有些情况下这些算法能取得不错的效果,然而依然存在一些不足之处,如模糊层次分析法包含较强的主观因素,支持向量机法不能确定数据中哪些知识是冗余的,K?均值因随机选取初始中心点会导致结果不稳定。
鉴于上述算法的不足,本文构建了电力客户价值评价的指标体系。提出一种对电力客户价值分类的新方法,即基于熵权法和改进的PCA聚类算法的混合方法,熵权法用于计算各个指标的权重,改进的PCA聚类算法用于电力客户价值分类。
1电力客户价值评价指标体系
在遵循完整性、可比性、易获取性、非重叠性等原则的基础上,结合电力行业的现状和客户价值理论[5?6],从电力客户的收入贡献、风险性、成长性等三个方面选取了11个指标,这11个指标从不同角度反映电力客户的价值,并初步构成了电力客户价值评价指标体系,如表1所示,各指标计算说明见表2。
2权重和聚类方法
2.1权重的计算方法
权重的计算方法有专家评分法、层次分析法[7]、主成分分析法、熵权法等。专家评分法主观性强;层次分析法具有多层次、多指标、定量定性相结合的特点,但它要求同层次指标间相互独立以及跨层次指标间不具备支配关系[5]。主成分分析法是一种客观性较强的方法,主要是依据指标数据的方差计算权重,不能真实反应指标对综合评价的贡献。鉴于以上方法的一些不足,本文采用熵权法计算指标权重,熵权法精度较高且客观性较强,适用于任何需要确定权重的地方。
熵权法的计算方法如下:
步骤1:将各个指标的数据进行标准化处理。
假设给定了[k]个指标[X1,X2,…,Xk,]其中[Xi=x1,x2,…,xn]。假设对各指标数据标准化后的值为[Y1,Y2,…,Yk。]
步骤2:求各指标的信息熵。
计算各个指标的信息熵[Ej=-1lnni=1npijlnpij]。其中[pij=Yiji=1nYij,]如果[pij=0,]则定义[limpij0pijlnpij=0]。
步骤3:确定各指标权重。
根据各指标的信息熵计算各指标的权重[Wi=1-Eik-Ei,i=1,2,…,k]。
2.2聚类算法
聚类分析指的是根据不同数据对象之间的差异,将数据集合分组成为由类似的对象组成的多个类或簇的分析过程。聚类算法主要有层次聚类算法和划分类的聚类算法等。层次聚类算法是将所有样本点自底向上合并成一棵树或者自顶向下分裂成一棵树的过程,但是层次聚类算法有一个缺点就是一旦一个凝聚或是分割形成,这个操作永远不会被改变了,且层次聚类算法计算复杂。划分的聚类算法中最经典的是K?means聚类算法,计算简单高效,但是,它对初始聚类中心敏感。此外,随机选取初始聚类中心会导致聚类结果不稳定。因此,学者们提出了许多改进的聚类算法。
初始聚类中心算法[8]的实现过程如下:
步骤1:数据集[X]有[n]个数据对象,聚类的类数为[k],计算其中最小的数据对象[min(X)];
步骤2:计算[X]中所有数据对象到[min(X)]的距离[Dis1,Dis2,…,Disn,]根据此距离升序排列所有数据对象;
步骤3:将第[1+(i-1)(n-2)(k-1),i=1,2,…,k]项数据对象设为对应类的初始成员;
步骤4:对尚未分配的数据对象,计算其与每个类中初始成员的距离,同时将数据对象归入到距离最小的类中;
步骤5:计算每个类中所有数据对象的平均值,即为初始中心点。
上述初始聚类中心算法避免了随机的步骤,使得聚类结果更加可靠,同时计算得出的初始聚类中心点分布均匀,更能代表原始数据的整体分布,可适当的减少迭代次数。结合改进的初始聚类中心算法和K?means的思想,得出了改进的K?means聚类算法,记为算法1,该算法的实现步骤如下:
步骤1:应用初始聚类中心算法选取[K]个初始聚类中心。
步骤2:计算所有数据对象与聚类中心的距离,同时将数据对象分配到最近的类中。
步骤3:重新计算每个聚类中所有数据对象的平均值,作为新的聚类中心。
步骤4:循环步骤2,步骤3,直到前后两次迭代得到的每个聚类中心点相同为止。
虽然改进的K?means聚类算法具有计算简单、高效,聚类结果稳定等优点,但是处理大规模高维度数据时相似度(距离)的计算需要耗费大量的时间,结合主成分分析[9]即PCA的思想与算法1,本文提出了改进的PCA聚类算法,算法步骤如下:
步骤1:设原始数据矩阵为[X∈Rn×d;]
步骤2:令[B∈Rd×d,]且[B=XX;]
步骤3:计算矩阵[B]的特征值和特征向量,并取出最大特征值对应的特征向量[V;]
步骤4:令[C=X?V,]则[C∈Rn×1;]
步骤5:应用算法1对1维列向量[C]进行聚类,然后再对应到原始数据,得出原始数据的聚类结果,即原始数据对象[Xi]被划分到第[j]类中,当且仅当向量[C]的第[i]行被划分到第[j]类。
该算法既具有PCA主成分分析降维的特点,又避免了K?means算法聚类结果不稳定的缺点,同时又具有K?means算法的高效性与简洁性等优点,因此该算法适合处理大规模高维度数据。
3模型应用
为了说明本文所提出的改进PCA聚类算法的可行性,抽取了一些电力客户的样本数据,应用MatlabR2012b软件对其编程。
为确保样本选取的公平性,首先需保证指标体系中的各个指标都要对应选取一定量的样本,其次,随机抽取样本。根据此样本数据选取方法抽取8个样本客户,分别记为客户1、客户2、…、客户8,客户指标数据如表3所示。
指标数据标准化处理说明:
(1)指标[X1,X2,X3,X7]属于高优指标,即指标的值越大越好,这两个指标标准化处理的方法为:
[(原值-最小值)(最大值-最小值)×100](1)
(2)除去上述4个指标之外,其他指标均属于低优指标,即指标的值越小越好,这些指标标准化处理的方法为:
[(最大值-原值)(最大值-最小值)×100](2)
根据2.1节中权重的计算方法,得出各指标的权重如表4所示。对客户指标数据标准化处理,结合表4中的各个指标的权重,加权求和得出每个客户的综合得分,应用改进的PCA聚类算法对客户进行分类,如表5所示。根据综合得分和改进的PCA聚类算法的分类结果可知本文所提算法的可行性。
为了说明改进的PCA聚类算法的有效性,在相同数据集的情况下,把它同算法1进行比较。其中改进的PCA聚类算法的运行时间是0.010158s,算法1的运行时间是0.022612s,改进的PCA聚类算法在运行效率上要优于算法1,运行结果相同。
4结论
电力客户综合价值评价体系的建立为供电企业制定营销策略提供依据,是客户关系管理的基础。首先,结合客户价值理论和电力行业的特殊性建立电力客户价值评价指标体系,指标体系涵盖客户用电行为、缴费行为、舆情和行业发展动态;其次,提出了一种行之有效的对电力客户价值评价的混合方法,即结合熵喾ê透慕的PCA聚类算法,该算法能够根据数据自身的特征计算各指标的权重并科学的确定分类标准。熵权法是一种精度较高,客观性较强的计算权重的方法。改进的PCA聚类算法既具有主成分分析降维的优点,同时避免了因随机选取初始中心点导致的聚类结果不稳定这一缺陷,也具有K?means聚类算法简洁高效等优点,因此该算法适合处理大规模高维度数据;最后,通过实例验证了该方法的有效性,且该技术在某供电企业得到了深入应用,并取得了良好效果。
参考文献
[1]王松涛.市场条件下的电力客户价值分析体系[J].电网技术,2010,34(2):155?158.
[2]曾鸣,杨素萍,杨鹏举,等.社会节能环境下电力客户价值评估研究[J].华东电力,2008,36(6):15?19.
[3]李金超,李金颖,牛东晓,等.考虑区间数概率分布的电力客户价值综合评价[J].华北电力大学学报,2005,32(4):56?58.
[4]李俊飞.集成粗糙集和支持向量机的电力客户价值评价[D].保定:华北电力大学,2007.
[5]赵晓波.供电企业大客户管理的研究[D].南京:南京理工大学,2005.
[6]靳方明.基于客户价值分析的电力客户服务管理研究[D].北京:华北电力大学,2007.
[7]沈利香,曹国.基于网络层次分析法的商业银行网络安全评估模型[J].计算机应用,2012,32(2):480?484.
数学建模具体步骤范文
[摘要]这种模型是基于某些已完工程资料的特征、用模糊数学理论进行聚分析确定类别。为了预测新项目的造价,首先建立隶属函数,然
>>工程造价预结算的审核步骤及审核方法探究浅析工程造价预结算的审核步骤及审核方法用模糊ISODATA聚类分析划分沙棘苗木等级的试验研究建筑工程造价的模糊确定分析分析工程造价及降低工程造价的方法工程造价及降低工程造价的方法基于模糊聚类分析的多属性决策方法的研究应用融合微分算子和模糊聚类分析的图像边缘检测混合方法研究简析工程造价预结算审核步骤及审核方法工程造价预算的模糊算法浅谈工程造价预结算审核的方法与步骤基于模糊聚类分析的环境绩效评价研究工程造价控制方法的研究公路工程造价快速估算的模糊神经网络方法应用基于案例模糊推理的土木工程造价估算方法探讨基于Weblog的模糊聚类分析分析工程造价预结算审核及加强方法基于模糊聚类分析的云计算负载平衡策略新农村信息化现状模糊聚类分析方法与对策研究模糊层次分析法在工程造价管理中的应用常见问题解答当前所在位置:中国>艺术>用模糊聚类分析计算工程造价的方法及步骤研究用模糊聚类分析计算工程造价的方法及步骤研究杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠!document.write("作者:未知如您是作者,请告知我们")
申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。[摘要]这种模型是基于某些已完工程资料的特征、用模糊数学理论进行聚分析确定类别。为了预测新项目的造价,首先建立隶属函数,然后根据隶属函数及新建项目的特征对待侧工程项目进行归类,再选取同类已完工程中与其最相似的三个工程作为估价样本,建立工程项目估价数学模型,并结合当前建筑材料价格及其质量、市场等作以适当的调整。其具体分为四个步骤:已完工程项目分类;待测工程项目归类;工程造价模糊测算;对工程数据进行分析测算。[关键词]工程造价;模糊理论;分部工程;分项工程;施工质量;概预算;聚类分析[中图分类号]TU715[文献标识码]B[文章编号]1727-5123(2011)03-105-02
数学建模具体步骤范文1篇11
关键词:本体构建;领域本体;概念抽取;关系抽取;数字图书馆现状
中图分类号:TN911?34;G250.76文献标识码:A文章编号:1004?373X(2016)15?0090?05
Abstract:Toimprovethetime?consumingandstrenuoussituationsexistinginthetraditionalontologyconstruction,adomainontologysemi?automaticconstructionmethodbasedonWebwasdesigned,andthedomainontologyconceptextractionalgorithmbasedonword2vecisputforward.Inthispaper,themethodbasedonChinese?Englishdictionaryisusedtoextractthesynonymousrelation,andthehyponymyextractionalgorithmbasedonfeaturevectorisstudied.Thedomainontologysemi?automaticconstructionmethodbasedonWebwasappliedtotheclimatechangefieldofthedigitallibrary.Thepracticeresultsshowthatthemethodcanshortentheontologyconstructionperiodgreatly,andreducethemanpowerparticipation.
Keywords:ontologyconstruction;domainontology;conceptextraction;relationshipextraction;digitallibrarysituation
0引言
本体构建是本体应用的基础,随着本体的理论研究逐步深入和在工程实践中的广泛应用,形成了许多的构建方法和构建工具。但本体的构建过程仍需要通过人工的参与,人们凭借一定专业领域知识,依据自己的知识和理解主观地判断概念之间的关系。这种依靠人的经验和知识积累的本体构建方式非常费时费力,成为领域本体发展的一个瓶颈。因此,为了减轻人工工作量,缩短本体构建的周期,人们期望可以自动半自动地构建本体,提高本体构建的效率和自动化程度,于是本体学习的概念就被提了出来。
本文对领域概念的抽取和领域概念间关系的抽取等关键技术进行了深入研究;采用了基于word2vec的领域本体概念自动抽取算法,并采用迭代算法,扩充领域概念的候选词集;同时,对领域概念间关系自动抽取的方法也进行了一定研究;最后,将基于Web的领域本体半自动构建方法应用于气候变化领域构建气候变化领域本体。
1基于Web的领域本体半自动构建方法
本文基于本体学习技术,设计了一种基于Web的领域本体半自动构建方法,该方法包括领域信息采集、领域词典构建、本体学习、本体编辑和本体评价五大模块。其中,本体学习模块是构建领域本体的重点和难点,该模块主要采用机器学习技术、自然语言处理技术,结合语言学、统计学等知识,从大量领域数据中自动地抽取领域概念和概念间的关系。基于Web的领域本体半自动构建方法框图,如图1所示。
2基于word2vec的领域本体概念抽取
领域概念获取是构建领域本体的基础工作,领域概念自动抽取是指从一定规模的自由文本中抽取出能够反映某一特定领域特征或共性的词汇。本文在研究相关算法的基础上,采用了一种基于word2vec的领域本体概念抽取算法。该算法如图2所示,共包含三部分:中文分词、领域概念候选词抽取、领域概念候选词评价。
领域词典的构建是概念抽取的基础,在中文分词环节,领域词典为其提供领域词汇,将领域词典添加到原有的分词词典中,使更多的领域词汇可以被识别出来。在领域概念候选词抽取和评价环节,领域词典为其提供领域的种子概念,用于对候选词进行抽取和评价。
在中文分词环节,增加了新词发现模块。本文采用的是中科院计算所的ICTCLAS分词工具对中文原始语料进行分词,本文在中文分词环节增加了新词发现模块,将发现的新词词典和构建的领域词典都添加到了原有的分词词典中,从而组成了新的分词词典。
在领域概念候选词抽取环节,本文引入了深度学习的思想,它通过构建具有多隐层的机器学习模型从海量训练数据中学习更有用的特征,本文利用word2vec工具学习Web领域语料,训练词向量模型,通过计算向量间的相似度,得到两个词之间的相似度,由此将领域种子概念的相关词汇作为领域概念候选词。
领域概念候选词评价环节是指从领域概念候选词中筛选词汇作为领域概念,本文采用基于双序列比对的中文术语语义相似度计算方法计算这些候选词与种子概念的相似度,将与种子概念语义相似度高的候选词作为领域概念。
2.1中文分词
中文分词与词之间有明显分隔,因此分词是对中文进行自然语言处理的首要步骤,分词的好坏直接影响概念抽取的效果。分词结果的好坏取决于所采用的分词工具和分词方法。目前,分词词典中的大多数词条是通用领域的,对领域专业词汇的识别率较低,因此构建领域词典,并将领域词典添加到分词词典中是很有必要的。由此,本文在中文分词中加入新词发现模块,采用大规模语料新词发现技术,将得到新词词典和领域词典中的词汇加入到原有的词典中,构成新的分词词典。然后对原始的领域语料进行分词,得到分词后的领域语料为概念抽取做准备。
(1)新词发现
要从海量文本中发现新词,通常考虑三个因素:字符串在文本中出现的频率、字符串的内部聚集程度和边界划分能力。本文采用基于大规模语料的新词发现技术,并分别用互信息和信息熵衡量一个字符串的内部聚集程度和边界划分能力。给出判断该字符串能否作为一个新词的评价指标,公式如下所示:
[Walue=log(Mi+1)?log(min(leEntropy,riEntropy)+1)]
式中:Mi代表字符串的互信息;le_Entropy代表字符串左邻字集的信息熵;ri_Entropy代表字符串右临字集的信息熵。
(2)New分词词典
本文采用中国科学院计算技术研究所研制的汉语词法分析系统ICTCLAS分词工具,将领域词典、新词发现得到的新词词典和原有的分词词典组成新(New)分词词典,利用New分词词典对语料库进行分词。
2.2领域概念候选词抽取
采用基于word2vec的领域概念候选词抽取算法。word2vec是一个把词转变为向量的工具,可以通过两个向量之间的余弦值得到两个词的相似度。本文将与种子概念具有一定相似度的词汇作为领域概念候选词,具体步骤如图3所示。利用word2vec工具对分词后的原始语料进行训练得到词向量模型,将种子概念对输入词表进行初始化,利用该模型计算与输入词表具有一定相似度的词汇作为领域概念候选词。要扩大候选词数量,采取迭代的算法,将输入词表作为迭代变量,将输出词表与输入词表的差集作为输入变量,再次调用词向量模型抽取候选词,直至符合迭代结束条件停止。
使用word2vec工具训练词向量模型步骤如下:
(1)将文本语料进行分词,并以空格或Tab隔开。
(2)将分好词的训练语料进行训练,假定语料名称为test.txt且放入word2vec目录中。
(3)训练好模型之后,得到词向量模型文件vectors.bin。
得到词向量模型后,便可以通过计算两个向量的余弦值来计算两个词的相似度。本文提出利用word2vec工具训练得到的词向量模型抽取种子领域概念的相关词汇,将相似度大于某一阈值的相关词作为领域概念的候选词。要扩充候选词集,设计迭代算法,将得到的输出词表与输入词表的差集作为输入,再运行程序得到更多领域概念候选词。算法流程如下:
(1)程序初始化,将从领域词典中选取的种子概念对输入词表进行初始化;
(2)调用word2vec的词向量模型抽取输入词表中概念的相关词汇,并将这些相关词汇作为领域概念候选词;
(3)将抽取得到的候选词集合作为输出词表输出;
(4)根据结束条件判定程序是否结束,如果不符合结束条件,则计算输出词表与输入词表的差集[S,]将[S]作为输入词表,转步骤(2),符合结束条件,程序结束。
该算法采用迭代算法以期获取更多的领域概念候选词,从而扩充候选词集。由上述算法流程可见,该算法中的迭代变量为输入词表,输入词表经过word2vec训练的词向量模型得到一个输出词表,然后将输出词表与输入词表的差集赋值给输入词表,再次进行抽取,这就是迭代过程。迭代算法中迭代结束条件可以是程序循环次数、输出词表与输入词表差集中元素的个数小于某个阈值和抽取概念的个数达到一定的数量等几种情况,具体的结束条件可根据需求的本体规模来确定。
2.3领域概念候选词评价
采用迭代算法可抽取出大量的领域概念候选词,然而本体的概念应是精炼的,本体的规模也是确定的,应对这些基于word2vec得到的领域概念候选词进行过滤,进一步提取领域概念。本文以种子概念为基准,计算概念候选词与种子概念的语义相似度,认为候选词与种子概念在语义上越相近,该候选词与领域越相关,本文将语义相关度高的词语作为抽取的领域概念,具体流程如图4所示。
采取基于双序列对比的中文术语语义相似度计算方法进行语义相似度计算,该方法有效地利用《同义词词林2》对词语进行有效的语义相似度计算,并且对组合词语之间的相似度也进行了深入研究,效果较好。
3领域本体概念关系抽取
本体概念之间的关系主要包括同义关系、上下位关系、整体?部分关系等。其中,同义关系和上下位关系是基本的语义关系,构成了本体的基础框架。
3.1同义关系抽取
本文利用中英文词典抽取概念间的同义关系。假设概念C1翻译得到的英文单词或短语有[{w1,w2,…,wn},]概念C2翻译得到的为[{w′1,w′2,…,w′m},]如果两个集合有交集,即两个概念有相同的英文解释,就认为这两个概念具有同义关系。将一个概念与其相关概念组成的概念对集合作为关系解空间,从解空间中抽取同义关系。为了抽取更多的同义关系,需要扩大关系解空间。
3.2上下位关系抽取
本文提出了一种基于概念对的语义特征和语境特征的特征向量来抽取具有上下位关系的概念对,从概念对的构词、共现、特征词出现数量、概念对在句中位置的距离出发,构建概念对上下位关系的特征向量,并使用支持向量机(SVM)进行训练和预测,从而实现本体上下位关系的抽取。具体算法实现如下:
步骤1:初始化所有的概念对和特征词;
步骤2:判断一个待计算特征向量的概念对是否符合扩展的包含原理,是则该概念对的特征向量[T]为(1,0,0,0),否则该概念对的[T1]值标记为0,进行步骤3;
步骤3:利用百度搜索引擎,对概念对进行查询,保存查询结果的前10条,计算该概念对的特征向量[T;]
步骤4:判断是否所有的概念对处理完毕,否,则转步骤2,是则形成特征集[W(T);]
步骤5:调用LIBSVM工具,将[W(T)]导入到训练集中;
步骤6:设置SVM训练参数,分别选用4种核函数进行实验,选取分类效果最好的核函数;
步骤7:运行程序,从概念与其相关的概念组成的概念对中抽取上下位关系。
4数字图书馆气候变化领域本体半自动化构建
本文采用气候变化领域主题网络爬虫方法从Web上采集与气候变化领域有关的数据,共采集了1.5GB的Web领域数据,数据的来源主要有2个。其中,基于开放搜索引擎搜索和气候变化权威的领域内新闻共有198104篇,数据1.04GB,百度百科领域内数据105660篇,数据556MB。本文利用这些从Web上采集的领域数据作为初始学习语料,从中自动的抽取气候变化领域本体概念和概念之间的关系,形成初始本体,最后利用本体编辑器,由领域专家人工对初始领域本体进行审核和编辑,以得到更为完善的知识体系和更为精准的本体描述。
4.1基于word2vec的领域概念抽取实验
(1)中文分词
采用中科院计算所的ICTCLAS分词工具对原始语料进行分词,在分词前,首先对原始语料进行新词发现,再将新词发现的结果和构建的领域词典中的词添加到原有分词词典中,形成新的分词词典。
实验中采用基于互信息和信息熵的新词发现技术从采集的气候变化领域语料中发现新词,本文只抽取5个字和5个字以下的词语,实验过程中,首先对字符串进行频率过滤,设定频率阈值,如果大于该阈值,则再进行信息熵过滤,否则,直接将其排除。由于目前还没有统一的设定阈值的标准,本文中的阈值都是经过反复试验,选取使效果较佳的阈值。实验发现新词情况如表1所示。
利用原有分词词典和在原有分词词典的基础上加入新词词典和领域词典后,对语料进行分词的结果进行对比,其结果证明采用新的分词词典进行分词,分词的准确率大大地提高了。
(2)领域概念候选词抽取
首先对采集的气候变化领域语料利用原有的分词词典进行分词,利用word2vec工具对该分词文件进行训练,得到词向量模型文件vectors.bin。采用构建的领域词典作为初始输入词典,通过调用词向量模型文件vectors.bin,计算与种子概念距离近的词汇,得到领域概念的候选词。
(3)领域概念候选词评价
采用双序列比对的中文术语相似度计算方法,将获得的11032个领域概念候选词与领域词中的种子概念做语义相似度计算,本文将与种子概念相似度大于一定阈值的候选词选作领域概念。实验过程中,该阈值取0.7。利用构建的领域词典中的1080个词汇作为种子概念,采用两种方法做对比实验(将基于前后缀的中文领域术语抽取方法称为原有算法,将本文采用的基于word2vec的领域本体概念抽取算法称为改进算法),实验结果如表2所示。
由表2可见,改进的算法无论是在领域概念抽取词抽取环节还是领域概念候选词评价环节,不仅大大地增加了抽取词汇的数量,而且领域术语所占的比重也比之前提高了。
4.2概念关系抽取实验
(1)同义关系抽取。本文采用在线的有道词典进行约束,同义关系抽取结果如表3所示。由实验结果可知,得到的结果准确率较高但召回率比较低,由于使用词典约束以及关系解空间等因素影响了召回率,可通过对数据进行扩充,其中包括使用word2vec的训练语料和双语词典等改进方法来提高召回率。
(2)上下位关系抽取。本文从关系解空间中抽取上下位关系,从中选取并手工标记800对概念对,其中正例400对,反例400对。实验中,在800对正反例中各取大约3/4的向量作为训练集,剩余的1/4对作为测试集。将本文提出的基于特征向量的本体概念上下位关系验证与基于百科的术语关系抽取方法进行对比验证,对比结果如表4所示。
从实验结果可得:本文提出的基于特征向量的上下位关系验证方法具有更高的准确率、召回率和[F]值,而且采用本文提出的算法比基于百科的术语上下位关系抽取发现的具有上下位关系的概念对多。
4.3数字图书馆气候变化领域本体的应用
气候变化问题已经逐渐成为各界热议的焦点,世界各国的统计部门、气象部门等都已经积累了庞大的数据集,研究者很难从庞大而分散的数据集与观点成果中快速找到期望的信息,更难以在这些信息中寻找数据之间的关联与规律。基于以上问题,设计开发出了针对气候变化领域的RSS阅读器系统。新闻、数据文件等以本体的组织框架进行组织。点击某一知识节(领域概念),便可查看相关的新闻信息等,操作方便快捷。用户通过该阅读器系统能实现对气候变化领域内最新、最全新闻信息的实时获取,从而减少人工搜索和筛选的工作,提高了新闻信息搜索效率和信息推荐的准确度。
5结论
本文探讨了领域本体构建方法,设计了一种基于Web的领域本体半自动构建方法,对基于word2vec的数字图书馆本体构建技术进行研究,采用基于中英文词典的方法抽取同义关系,提出基于特征向量的上下位关系抽取算法。基于此,设计开发出了针对气候变化领域的RSS阅读器系统,通过实验及实际应用证明文中所提方法缩短了本体开发周期,节省了大量的人工参与,自动抽取本体质量较高。但领域概念抽取结果依赖于word2vec工具,具有一定的局限性,因此,可以考虑混合其他的概念抽取方法来获取领域概念。
参考文献
[1]顾英,柯平,李泽华.基于领域本体的数字图书馆及应用研究[J].图书馆工作与研究,2013(5):41?44.
[2]李志隆,王道平,关忠兴.基于领域本体的用户兴趣模型构建方法研究[J].情报科学,2015,33(11):69?73.
[3]陈卫.基于本体的数字图书馆个性化推荐模型构建研究[D].武汉:湖北工业大学,2015.
[4]李跃鹏,金翠,及俊川.基于word2vec的关键词提取算法[J].科研信息化技术与应用,2015(4):54?59.
[5]PUQ.ResearchonE?negotiationprocessmixedwithdomainontologyandreasoningtechnology[C]//Proceedingsof2013JointInternationalConference.VinadelMar:Springer,2013:471?475.
[6]LUOJ,WANGQ,LIY.Wordclusteringbasedonword2vecandsemanticsimilarity[C]//Proceedingsof201433thIEEEControlConference.Nanjing,China:IEEE,2014:517?521.
数学建模具体步骤范文篇12
一、实验室技术人员价值评估的意义
实验教学是高校教学的重要组成部分,实验教学水平的高低直接关系到学生的动手能力、独立思考能力、创新能力和事实求是的作风的培养。实验室师资队伍可以说既是实验教学的直接参与者,又是高校实验教学改革和创新的先导,同时,随着国家对高校实验室建设投入力度的加大,新设备和新技术的不断引入,对实验室人员快速掌握新技术和新设备并利用这些条件积极参与教学和科研活动也提出了更高的要求。
通过对实验室技术人员价值的评估,可以让管理者清楚的了解实验室技术人员队伍的真实水平,有利于实现现有的人力资源和设备的合理配置;有利于引导管理者调整、改善人力资源管理方法的行为;有利于针对性的建立健全人员激励与约束机制;有利于建立公正平等的内部竞争环境,最后实现实验室人员的最优配置,发挥最大的效用。
二、人力资源价值模糊综合评价模型的构建
(一)模型构建的理论依据
经典科学方法的中心思想就是度量精确化,这种方法对处理逻辑概念和命题清晰的问题很适用,但是一些社会科学研究的对象本身并没有一个明确的界定,其类属边界和性质状态都有不确定性,主要表现为非线性、非平衡、随机性、权变等特征。
1965年,美国控制理论专家扎德(L.Z.Zadeh)创立了模糊数学,并首次提出了“模糊性”和“模糊集合隶属函数”的概念,把被评价对象以及反映它的模糊观念作为一定的集合,建立适当的隶属函数,通过相关运算和变换,对模糊对象进行定量分析。本文对高校实验室人力资源的评价也是基于模糊理论,将人力资源要素特征用隶属函数来表示,通过模糊矩阵的变换,用隶属度来描述人力资源的相对价值。
模糊综合评价法就是以模糊数学为基础,应用模糊合成原理,对边界不清、没有明显分界线的评价因素实现量化,进行综合评价的一种方法。评价的结果是被评价对象对既定的各个登记的模糊子集的隶属度,形式上为一个模糊向量,而不是一个点值,因此包含了更多的信息,通过最大隶属度、加权平均原则或模糊向量单值化原则来确定被评对象的优劣等级。
(二)模糊评价模型的构建步骤
步骤1:建立评价指标集U。第一级因素集第二级因素集。
步骤2:确定评语集V。评语集是评价者对被评价对象做出的各种总的评价结果组成的集合,
步骤3:用层次分析法(AHP)求得相对应的权重向量,确定权重分配集第二层权重集
步骤4:进行单因素评价,构建判断隶属矩阵R。
步骤5:合成权重分配集A和隶属矩阵R得到被评价对象的模糊综合评价结果向量B,表示被评价对象从整体上看对等级模糊子集的隶属程度。本文合成A和R的算子为加权平均法。
步骤6:评价结果的单值化处理。将评语集中各因素赋予具体数值,得到最终评判结果。
三、高校实验室技术人员价值模糊综合评价模型的应用
(一)高校实验室技术人员价值模糊综合评价指标的选择
通过上述分析,参照实验室技术人员人员相关评价标准以及专家的讨论,遵循科学性与合理性、实用性与可比性、定性指标与定量指标相结合、全面性和重点性等原则,本文拟选取实验室技术人员基本情况、人员基本素质、培训和发展情况以及实验室工作绩效等四项要素指标作为模糊评价模型第一层次因素集,根据实际情况构建第二级因素集。实验室技术人员价值模糊综合评价指标体系用图1实验室技术人员价值模糊综合评价指标体系图1表示。
(二)高校实验室技术人员价值模糊评价模型的应用
1、确立权重分配集A
采用德尔非法,通过向学校相关领导、专家和实验室员工发放调查问卷,汇总分析后得到权重分配集。
2、建立评语集V
标准,对应的分值为4、3、2、1。
3、建立模糊评价矩阵R
通过问卷调查和查阅相关数据,获得具体的指标值,采用隶属函数和专家打分相结合对指标进行分析,构建评价矩阵。
4、多级模糊评价
一级模糊评价:
(I=1,2,3,4)已经经过了归一化处理。
二级模糊评价:
可以看出,在对实验室技术人员价值的模糊评价中,26.2%的人认为可以评优;有32.3%认为可以评良;26.8%认为可以评中;还有14.7%的人认为可以评差。
5、计算评价的分值T
根据前文对各个等级的赋值,最后得分:
2