DOE(Design of Experiment,试验设计)
什么是DOE
DOE(Design of Experiment)试验设计,一种安排实验和分析实验数据的数理统计方法;试验设计主要对试验进行合理安排,以较小的试验规模(试验次数)、较短的试验周期和较低的试验成本,获得理想的试验结果以及得出科学的结论。
试验设计源于1920年代研究育种的科学家Dr.Fisher的研究, Dr. Fisher是大家一致公认的此方法策略的创始者, 但后续努力集其大成, 而使DOE在工业界得以普及且发扬光大者, 则非Dr. Taguchi (田口玄一博士) 莫属。
为什么需要DOE
要为原料选择最合理的配方时(原料及其含量);
要对生产过程选择最合理的工艺参数时;
要解决那些久经未决的“顽固”品质问题时;
要缩短新产品之开发周期时;
要提高现有产品的产量和质量时;
要为新或现有生产设备或检测设备选择最合理的参数时等。
另一方面,过程通过数据表现出来的变异,实际上来源于二部分:一部分来源于过程本身的变异,一部分来源于测量过程中产生的变差,如何知道过程表现出来的变异有多接近过程本身真实的变异呢?这就需要进行MSA测量系统分析。
DOE的基本原理
试验设计的三个基本原理是重复,随机化,以及区组化。
所谓重复,意思是基本试验的重复进行。重复有两条重要的性质。第一,允许试验者得到试验误差的一个估计量。这个误差的估计量成为确定数据的观察差是否是统计上的试验差的基本度量单位。第二,如果样本均值用作为试验中一个因素的效应的估计量,则重复允许试验者求得这一效应的更为精确的估计量。如s2是数据的方差,而有n次重复,则样本均值的方差是\frac{s_2}{n}。这一点的实际含义是,如果n=1,如果2个处理的y1 = 145,和y2 = 147,这时我们可能不能作出2个处理之间有没有差异的推断,也就是说,观察差147-145=2可能是试验误差的结果。但如果n合理的大,试验误差足够小,则当我们观察得y1随机化是试验设计使用统计方法的基石。
所谓随机化,是指试验材料的分配和试验的各个试验进行的次序,都是随机地确定的。统计方法要求观察值(或误差)是独立分布的随机变量。随机化通常能使这一假定有效。把试验进行适当的随机化亦有助于“均匀”可能出现的外来因素的效应。
区组化是用来提高试验的精确度的一种方法。一个区组就是试验材料的一个部分,相比于试验材料全体它们本身的性质应该更为类似。区组化牵涉到在每个区组内部对感兴趣的试验条件进行比较。
DOE实验的基本策略
策略一:筛选主要因子(X型问题化成A型问题)
实验成功的标志:在ANOVA分析中出现了1~4个显着因子;这些显着因子的累积贡献率在70%以上。
策略二:找出最佳之生产条件(A型问题化成 T型问题)
实验成功的标志:在第二阶段的实验中主要的误差都是随机因素造成的。
因为各因子皆不显着,因此,每一因子之各项水准均可使用,在此情况下岂不是达到了成本低廉且又容易控制之目的。
策略三:证实最佳生产条件有再现性。
DOE的作用
在工业生产和工程设计中能发挥重要的作用,主要有:
1.提高产量;
2.减少质量的波动,提高产品质量水准;
3.大大缩短新产品试验周期;
4.降低成本;
5.试验设计延长产品寿命。
在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。
如果要最有效地进行科学试验,必须用科学方法来设计。所谓试验的统计设计,就是设计试验的过程,使得收集的数据适合于用统计方法分析,得出有效的和客观的结论。如果想从数据作出有意义的结论,用统计方法作试验设计是必要的。当问题涉及到受试验误差影响的数据时,只有统计方法才是客观的分析方法。这样一来,任一试验问题就存在两个方面:试验的设计和数据的统计分析。这两个是紧密相连的,因为分析方法直接依赖于所用的设计。
DOE的方法
常见的试验设计方法,可分为二类,一类是正交试验设计法,另一类是析因法。
(1)正交试验设计法
① 定义
正交试验设计法是研究与处理多因素试验的一种科学方法。它利用一种规格化的表格——正交表,挑选试验条件,安排试验计划和进行试验,并通过较少次数的试验,找出较好的生产条件,即最优或较优的试验方案。
② 用途
正交试验设计主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。
案例:[1]
当试验中只有一个变化的参数时,属于单因素试验问题。例如,需要确定液压作动器的活塞的面积,以使作动器达到最优性能。人们根据对现象的认识,可以估计出最优参数可能存在的区间。如果对它的认识比较清楚,这种估计比较精确,估计的区间较窄;相反,估计的区间就较宽。现在要通过一系列的试验使认识深化。如果逐步试验,要使估计区间缩小100倍就需要作100次试验。但是如果使用区间缩减法中的“黄金分割试验技术”,只要作11次试验就可以将区间缩小到百分之一,作14次试验就可以对区间的认识精度提高500倍。
在多因素试验中,往往需要分离出不同因素的影响。譬如要比较A、B、C3种种子的产量。如果只是单纯的种子产量问题,似乎只要在3块同面积的土地上分别用3种种子播种,然后比较产量就可以了。但是如果试验田的位置在南北方向上处于山地和河流之间,东西方向上处在肥料场和荒地之问,这时仍然任意取3块等面积的试验田作试验,就可能由于土壤的肥脊不同和灌溉的充分与否影响试验田的产量,而不单是种子一个因素的结果。要估计这些因素的影响,合理的方法是将试验区分为9块试验田(如下图),将3种不同的种子的每一种分播在3块不同的试验田里,将3块田的产量平均,就得到由于种子品种造成的差异(排除了土壤和灌溉的因素);而将靠肥料场的3块田的平均产量,与靠荒地的3块田的平均产量比较,就得到由于土地肥脊程度所造成的产量差异(排除了种子品种和灌溉条件因素);用靠山的3块田与傍水的3块田平均产量进行比较可以看出由于灌溉条件造成的差异(排除了种子品种和土壤条件的差异)。
(2)析因法
① 定义析
析因法又称析因试验设计、析因试验等。它是研究变动着的两个或多个因素效应的有效方法。许多试验要求考察两个或多个变动因素的效应。例如,若干因素:对产品质量的效应;对某种机器的效应;对某种材料的性能的效应;对某一过程燃烧消耗的效应等等。将所研究的因素按全部因素的所有水平(位级)的一切组合逐次进行试验,称为析因试验,或称完全析因试验,简称析因法。
② 用途
用于新产品开发、产品或过程的改进、以及安装服务,通过较少次数的试验,找到优质、高产、低耗的因素组合,达到改进的目的。
我们的服务流程