商业地产分析方法总结(精选)-范文网

商业地产分析方法总结

总结是在项目、工作、时期后，对整个过程进行反思，以分析出有参考作用的报告，用于为以后工作的实施，提供明确的参考。所以，编写一份总结十分重要，以下是小编整理的关于《商业地产分析方法总结》，仅供参考，大家一起来看看吧。

第一篇：商业地产分析方法总结

商业地产分析方法总结

房地产市场可以分为居住物业市场和非居住物业市场。非居住物业市场是广义上的商业房地产市场;商业房地产市场狭义上指购物中心。由于广义的商业房地产市场包含了：写字楼市场、工业物业市场、购物中心等，这几个子市场差异较大，分析方法也不同，所以本文主要讨论狭义的商业房地产市场——购物中心的市场机会研究方法。

在发达国家购物中心可分为以下几个大类：

区域购物中心(regional mall)：封闭式的建筑，拥有综合性的百货超市。以总租售面积(GLA)可以将区域中心划分为一般区域中心和超区域中心(4.7——18万㎡)，车位指数(PI)一般为5.5个/100㎡。业态上浓缩了中央商务区的功能，为顾客提供各种档次的商品;主导商主要为大型百货超市，此外还有各种附属商为顾客提供各种个性化服务。一般区域中心要求服务区内人口规模在15万以上，超区域中心在35万以上。

社区购物中心(community shopping center):采用开放式的建筑设计，GLA一般在1——4万㎡，车位指数一般为：5个/100㎡，业态上没有大型综合性百货超市，有初级百货超市，日用品超市，平价超市，专卖店等，市场服务区人口规模4——15万。

邻里购物中心(neighborhood shopping center):GLA一般在0.3——5万㎡之间，车位指数为：5个/100㎡，业态：包括食品、药品、日用杂货等日常生活相关的商品，银行、干洗店等;服务区要求的人口规模一般在2000——4万之间。

此外还有：特色专卖中心(specialty center)，直销中心(outlet center)，平价中心(off-price center)，休闲购物中心(urban entertainment center)，时尚中心(fashion center)，假日中心(festival center)，混合式商务中心(retail uses in mixed-use development)等

在商业房地产市场分析过程中，购物中心类型的选择会对整个分析过程产生较大影响。

一、经典市场研究方法

商业房地产市场分析的主要内容有：需求分析、供给分析。在进行这两项分析之前必须进行购物中心市场服务区(商圈)分析，界定购物中心未来可能覆盖的地理范围。市场服务区(trade area)指一个商业房地产所提供的商业服务(商品服务)的范围，如一个商场商品的主要销售范围。市场服务区的界定方法主要有：同心圆法、行车时间法、路线调查法。购物中心的市场服务区由该中心的类型、规模、业态、周围竞对手状况、人口密度、交通状况等因素所决定，它的边界不一定规则，理想状况是同心圆，实际上则不一定，许多自然地物、道路等都可能成为其边界。界定范围之后需要收集不同服务圈层里的人口规模、居民户数、平均家庭收入、人均收入等数据，这些数据是进行市场分析的基础。

1、市场需求分析主要方法

市场需求分析需要在市场服务区的界定完成的基础上进行，其主要方法有：

比率——人口相乘法：在一个城市区域内商品零售面积的人均需求量的经验值乘以服务区的总人口，从而得出市场需求总量。市场需求潜力 + 调查区现有零售面积 = 总需求量。

如果需求潜力大于零，即存在开发空间，开发可行。

单位零售房地产面积商品零售额比率比较法：首先统计商品服务区内的商品零售总额和零售房产总面积;然后对商品进行分类，统计不同类型商品(家电、汽车等)零售额、零售面积;最后将商品分类统计数据与商品零售总额和零售房产总面积进行比较，可以发现某类商品单位零售面积零售额是否存在不足现象，从而判断市场是否处于饱和状态。

马利兹亚城市商业房产需求预测法：该方法以“长期预测和短期预测都受就业增长直接影响，就业增长快预示商业房产有开发潜力”这一理论假设为前提。马利兹亚模型将众多市场的影响因素分为：经济增长因素(在短期预测中可促进经济增长的因素如：区位优势、就业人口比率等)和经济发展因素(能带动城市区域长远发展的因素如：教育水平、产业多样性等)，通过对以上因素的综合分析可以较为宏观的判断一个城市商业房产的开发前景。

房地产开发度指数(power ratio)法：一个大城市区域可以看成一个统一的市场可以进一步划分成若干个二级市场，二级市场间存在着投资竞争，通过对竞争的分析可以找出各个二级市场的商业房地产市场投资饱和状况，该状况决定了某个二级市场取是否有商业房产开发潜力。房地产开发度指数法通过对城市市场区零售房产总面积、单元区零售房产总面积、城市平均家庭收入、单元区平均家庭收入等数据的分析可以具体得出某一单元区的商业房产需求量。

2、经典研究方法的分析步骤

1)确定购物中心类型

2)研究购物中心商品服务范围(街道、城市、地区)

3)调查在服务区范围内现有该种类型购物中心的商业楼面，包括已经出租的楼面、控制楼面的总量;调查服务区范围内的人口统计，居民收入和消费状况及单位楼面的租(售)价格

4)研究人口统计数据和经济状况，分析商品服务区内可以支撑的总的商业楼面面积

5)比较服务区现有的商业楼面与该商品服务区可支撑的总的商业楼面之间的差异，从而发现商业房产的开发潜力

6)根据商品服务区外具体情况的研究对上述开发潜力作进一步修正

发达国家成熟的房地产市场信息较为全面，城市区域经济数据获得相对较容易，因此商业房地产市场分析的经典方法可以得到较好的运用。但是在界定购物中心的类型等环节时，市场研究人员的商业经验仍然有重要作用，在市场分析过程中市场分析人员的主观判断仍是不可缺少的。特别是在休闲娱乐中心的定位上市场分析过程更多的表现为一种艺术，而不是一种技术。此外在国内现阶段房地产市场不健全，宏观经济数据不准确、针对性不强，微观区域经济数据缺乏的情况下，我们必须结合现实条件创造性的应用商业房地产经典市场分析方法。

第二篇：青海省2016年下半年房地产估价师《案例与分析》：房地产抵押估价技术路线及估价方法考试题

青海省2016年下半年房地产估价师《案例与分析》：房地产抵押估价

技术路线及估价方法考试题

本卷共分为2大题50小题，作答时间为180分钟，总分100分，60分及格。

一、单项选择题(共25题，每题2分，每题的备选项中，只有1个事最符合题意)

1、下列不属于划拨土地使用权范围的是。 A：政府大楼建设用地 B：商品房建设用地

C：经济适用住房建设用地

D：国家重点扶持的水利项目用地 E：房地产估价机构必须加盖公章

2、下列不属于房地产商业物业市场的是。 A：写字楼市场 B：零售商场或店铺 C：休闲旅游设施市场 D：仓储用房市场 E：借款合同

3、按照《房地产开发企业资质管理规定》规定，w省A市房地产开发公司申报三级资质，应由部门决定审批部门。 A：A市人民政府

B：W省建设行政主管部门 C：W省人民政府

D：国务院建设行政主管部门 E：房地产估价机构必须加盖公章

4、收益法是根据估价对象的未来收益来求取估价对象()的方法。 A.利润 B.价格 C.价值

D.收益价格

5、房地产置业投资较一般投资，不具有的好处是__。 A.相对较高的收益水平 B.得到税收方面的益处 C.提高投资者的资信等级 D.良好的流动性

6、某企业拥有一办公楼，建成于1996年1月，1998年1月补办了土地出让使用权手续，出让年限为50年(自补办之日算起)。在2006年1月时，建筑物剩余尚可使用经济寿命为45年，则在计算建筑物折旧时，经济寿命应取为__年。 A.45 B.50 C.52 D.55

7、下列关于建筑物寿命和经过年数的说法中，正确的是。

A：建筑物的经济寿命短于自然寿命，有效经过年数也短于实际经过年数 B：建筑物的经济寿命长于自然寿命，有效经过年数也可能长于实际经过年数 C：建筑物的经济寿命与自然寿命相等，有效经过年数与实际经过年数也相等 D：建筑物的经济寿命短于自然寿命，有效经过年数可能短于也可能长于实际经过年数

E：工业用地的监测点评估价格

8、王某打算承租某写字楼的一个单元，在可出租面积的计算上与业主发生了分歧，后经测量得出以下数据：出租单元内使用面积为35㎡，外墙面积为7㎡，单元间分隔墙面积为10㎡，公摊面积为5㎡，那么，可出租面积应为㎡。 A：48.5 B：49 C：51 D：45.5 E：借款合同

9、从事市场营销工作最基本的一点就是要清楚地了解__的市场需求以及消费者或可能的买主的消费观念和偏好。 A.过去 B.潜在 C.相关 D.未来

10、在一国金融机构体系中居领导核心地位的是__。 A.政策性银行 B.商业银行 C.中央银行 D.人民银行

11、关于市场法的说法，错误的是。

A：测算结果容易被人们理解、认可、接受 B：测算结果有时并不一定是合理、真实的

C：需要估价师对当地房地产市场行情有足够的把握

D：每个影响因素对可比实例成交价格的影响程度都可采用定量分析予以量化 E：工业用地的监测点评估价格

12、某商铺建筑面积为500㎡，建筑物的剩余经济寿命和剩余土地使用年限为35年.市场上类似商铺按建筑面积计的月租金为120元/㎡，运营费用率为租金收入的25%.该类房地产的报酬率为10%，则该商铺的价值为.【2006年考题】

A：521万元 B：533万元 C：695万元 D：711万元

E：工业用地的监测点评估价格

13、新设立的房地产开发企业，应当自领取营业执照之日起日内，持有关文件到登记机关所在地的房地产开发主管部门备案。 A：7 B：15 C：30 D：60 E：执行层的组织协调

14、关于确定估价时点与得出评估价值先后次序的说法，正确的是。 A：确定估价时点在先，得出评估价值在后 B：得出评估价值在先，确定估价时点在后 C：确定估价时点与得出评估价值同时进行

D：确定估价时点与得出评估价值无先后表示，谁先谁后都可以 E：工业用地的监测点评估价格

15、在某宗房地产估价中，三个可比实例房地产对应的比准单价分别是6800元/m

2、6700元/m2和6300元/m2，根据可比性综合评估得到的三个可比实例对应的比准单价的权重分别是0.3、0.5和0.2。如果分别采用加权算术平均法和中位数法测算最终的比准单价，则前者与后者的差值是__元/m2。 A.-100 B.-50 C.50 D.100

16、人防工程的地下室面积建筑面积。 A：属不应分摊的共有 B：属分摊的共有 C：不属共有

D：属物业公司所有 E：执行层的组织协调

17、已知某房地产剩余使用年限为35年，在报酬率为10%的情况下，房地产价格为4500元/㎡.若报酬率为8%，剩余使用寿命延长至40年，该房地产的价格为。

A：4451元/㎡ B：4500元/㎡ C：4549元/㎡ D：5821元/㎡

E：工业用地的监测点评估价格

18、估价的通俗含义是估计的价格或价值。 A：现有物品 B：一般物品 C：经济物品 D：建筑物品

E：工业用地的监测点评估价格

19、房地产权利人转让房地产、房地产抵押权人依法拍卖房地产，应当向房屋所在地如实申报成交价格。 A：县级或县级以上人民政府

B：县级或县级以上人民政府房地产行政主管部门 C：县级以上人民政府

D：县级以上人民政府房地产行政主管部门 E：执行层的组织协调

20、某销售型住房市场年初的住房存量为100万套，其中空置待售住房5万套，本年新竣工住房13万套，销售住房8万套，则吸纳周期为()年。 A.0.63 B.1.63 C.2.25 D.12.50

21、下列表述中不正确的是.【2004年考题】

A：在实际估价中，不同的估价方法将影响估价结果 B：在实际估价中，不同的估价时点将影响估价结果 C：在实际估价中，不同的估价目的将影响估价结果 D：在实际估价中，不同的估价作业期将影响估价结果 E：工业用地的监测点评估价格

22、在某房地产开发项目建设过程中，如果不能如期取得政府的相关许可，则该房地产开发项目将面临。 A：政策风险 B：市场风险 C：财务风险 D：信用风险 E：借款合同

23、下列成本费用中，不属于土地储备开发成本的是__。 A.拆迁补偿费及有关税费 B.市政基础设施建设有关费用 C.贷款利息 D.建安费用

24、建设用地使用权出让，是土地级市场。 A：一 B：二 C：三 D：四

E：房地产估价机构必须加盖公章

25、公民参与合伙关系，__出资。 A.可以用劳务 B.必须用资金 C.必须用实物

D.必须用资金或实物

二、多项选择题(共25题，每题2分，每题的备选项中，有2个或2个以上符合题意，至少有1个错项。错选，本题不得分;少选，所选的每个选项得 0.5 分)

1、不可能引起房地产需求增加或减少的条件是。 A：消费者的自我需要 B：未来预期收益变化 C：政府税收政策 D：收入水平的变化 E：借款合同

2、房屋所有权初始登记是指原始取得所有权而进行的登记。 A：新建房屋申请人

B：原有但已进行过登记的房屋申请人 C：原有但未进行过登记的房屋申请人 D：转让所得房屋申请人 E：继承所得房屋申请人

3、王某拟购买一套面积为120㎡、单价为7800元/㎡的住房，首付款为30%，其余申请年贷款利率分别为4.8%和7.2%的公积金和商业组合，贷款期限为20年，按月等额还本付息。如果公积金贷款最高限额为20万元，则商业贷款的最低月还款额为__元。 A.1297.91 B.3584.01 C.4881.93 D.5158.71

4、房屋权利人法定名称改变时，应申请房屋权属__登记。 A.他项权利 B.转移

C.所有权初始 D.变更

5、商业银行发放个人住房抵押贷款可能面临的信用风险不包括。 A：开发商违法预售 B：借款人赖账不还 C：借款人拖延还款

D：房地产市场供需失衡 E：借款合同

6、__实际上是根据现有的一组数据来确定变量之间的定量关系，并且可以对所建立的关系式的可信程度进行统计检验，同时可以判断哪些变量对预测值的影响最为显著。 A.因子推演法 B.趋势平滑法 C.加权平均法 D.回归分析法

7、下列民事行为属于无效的有。 A：由完全民事行为能力人实施的

B：一方以欺诈、胁迫的手段或者乘人之危，使对方在违背真实意愿的情況下所为

C：限制民事行为能力人依法不能独立实施的

D：恶意串通，损害国家、集体或者第三人利益的 E：经济合同违反国家指令性计划的

8、房地产抵押担保的范围包括__。 A.主债权及利息 B.违约金 C.定金

D.损害赔偿金 E.实现抵押权的费用

9、某城市2000年和2005年普通商品房的平均价格分别是3500元/m2和4800元/m2，采用平均发展速度法预测2008年的价格最接近于()元/m2。 A.4800 B.5124 C.5800 D.7124

10、因取得收入而可能发生变化的会计要素有__。 A.负债 B.收入 C.费用 D.资产

E.所有者权益

11、某住宅小区附近新建了一座酿酒厂，由此引起的该住宅小区房地产价值贬损属于__。 A.物质折旧 B.功能折旧 C.经济折旧 D.会计折旧

12、通常房地产开发投资利润率的计算基数为__。 A.土地取得成本+开发成本

B.土地取得成本+开发成本+管理费用

C.土地取得成本+开发成本+管理费用+销售费用 D.开发完成后的房地产价值

13、开发一持有一出租一出售模式主要适用于写字楼、零售物业、高级公寓等收益性房地产项目和部分政策性租赁住宅、普通商品住宅。这种业务模式下的现金流出包括等。 A：土地成本 B：建造成本 C：运营成本 D：开发费用 E：购买税费

14、在房地产抵押价值评估时，须扣除在估价时点估价师所熟知的法定优先受偿款。法定优先受偿款包括()。 A.划拨土地应补交的出让金 B.已抵押担保的债权数额

C.发包人拖欠承包人的建设工程价款 D.强制执行费用 E.估价费用

15、因技术革新、设计优化等导致建筑物变得落伍陈旧而引起的减价，属于__。 A.自然折旧 B.物质折旧 C.功能折旧 D.经济折旧

16、在估价中，测算开发利润时应注意__。 A.开发利润是所得税后的

B.开发利润是在正常条件下房地产开发商所能获得的平均利润 C.直接成本利润率的计算基数为土地取得成本+开发成本

D.成本利润率的计算基数为土地取得成本+开发成本+管理费用+投资利息 E.销售利润率的计算基数为房地产开发完成后的价值

17、缴存职工在时，可以向管理中心申请住房公积金贷款。 A：购买自住住房 B：建造自住住房 C：翻建自住住房 D：大修自住住房 E：购买商业门市

18、房地产资产管理的目标是使房地产的价值最大化，具体管理模式包括。 A：物业管理 B：运营管理 C：设施管理 D：资产管理 E：组合投资管理

19、房地产保险对房地产估价的需要，主要是__。 A.投保时评估保险价值 B.投保时评估保险金额

C.事故发生后评估房屋所遭受的损失

D.事故发生后评估房屋的重建价格或重置价格 E.事故发生后评估的赔偿金额

20、零售商业物业的租金是以__为基础计算的。 A.每一个独立出租单元的总出租面积 B.每月每平方米

C.每平方米可出租面积

D.每平方米可出租面积按月或年支付的金额

21、造成成交价格偏离正常市场价格的因素有__等。 A.利害关系人之间的交易 B.供求不均衡

C.急于出售的交易

D.交易税费非正常负担的交易

E.交易双方或某一方对市场行情缺乏了解的交易

22、申领施工许可证时，建设工期不足一年的，到位资金原则上不得少于于工程项目合同价的__。 A.20% B.30% C.50% D.60%

23、假设某房地产投资项目的折现率分别取i1=15%、i2=16%、i3=17q%，i4=18%时，其对应的净现值分别为NPV1=300万元、NPV2=100万元、NPV3=-50万元、NPV4=-150万元，则依此测算的内部收益率精度最高的是__。 A.16.67% B.16.71% C.16.80% D.17.00%

24、房地产开发企业销售商品住宅时，应当根据《商品住宅实行质量保证书和住宅使用说明书制度的规定》，向买受人提供。 A：《住宅平面示意图》 B：《住宅立面示意图》 C：《住宅剖面示意图》 D：《住宅质量保证书》 E：《住宅使用说明书》

25、按照消费者对产品两种属性的重视程度进行划分，形成不同偏好的细分市场的模式是。(过时) A：同质偏好市场 B：分散偏好市场 C：个别偏好市场 D：集群偏好市场 E：弥隙市场

第三篇：回归分析方法总结全面

一、什么是回归分析

回归分析(Regression Analysis)是研究变量之间作用关系的一种统计分析方法，其基本组成是一个(或一组)自变量与一个(或一组)因变量。回归分析研究的目的是通过收集到的样本数据用一定的统计方法探讨自变量对因变量的影响关系，即原因对结果的影响程度。回归分析是指对具有高度相关关系的现象，根据其相关的形态，建立一个适当的数学模型(函数式)，来近似地反映变量之间关系的统计分析方法。利用这种方法建立的数学模型称为回归方程，它实际上是相关现象之间不确定、不规则的数量关系的一般化。

二、回归分析的种类 1.按涉及自变量的多少，可分为一元回归分析和多元回归分析一元回归分析是对一个因变量和一个自变量建立回归方程。多元回归分析是对一个因变量和两个或两个以上的自变量建立回归方程。

2.按回归方程的表现形式不同，可分为线性回归分析和非线性回归分析

若变量之间是线性相关关系，可通过建立直线方程来反映，这种分析叫线性回归分析。若变量之间是非线性相关关系，可通过建立非线性回归方程来反映，这种分析叫非线性回归分析。

三、回归分析的主要内容

1.建立相关关系的数学表达式。依据现象之间的相关形态，建立适当的数学模型，通过数学模型来反映现象之间的相关关系，从数量上近似地反映变量之间变动的一般规律。

2.依据回归方程进行回归预测。由于回归方程反映了变量之间的一般性关系，因此当自变量发生变化时，可依据回归方程估计出因变量可能发生相应变化的数值。因变量的回归估计值，虽然不是一个必然的对应值(他可能和系统真值存在比较大的差距)，但至少可以从一般性角度或平均意义角度反映因变量可能发生的数量变化。

3.计算估计标准误差。通过估计标准误差这一指标，可以分析回归估计值与实际值之间的差异程度以及估计值的准确性和代表性，还可利用估计标准误差对因变量估计值进行在一定把握程度条件下的区间估计。

四、一元线性回归分析

1.一元线性回归分析的特点

1)两个变量不是对等关系，必须明确自变量和因变量。

2)如果x和 y两个变量无明显因果关系，则存在着两个回归方程：一个是以x为自变量，y为因变量建立的回归方程;另一个是以y为自变量，x为因变量建立的回归方程。若绘出图形，则是两条斜率不同的回归直线。

3)直线回归方程中，回归系数b可以是正值，也可以是负值。若 0 b > ，表示直线上升，说明两个变量同方向变动;若 0 b < ，表示直线下降，说明两个变量是反方向变动。 2.建立一元线性回归方程的条件

任何一种数学模型的运用都是有前提条件的，配合一元线性回归方程应具备以下两个条件： 1)两个变量之间必须存在高度相关的关系。

两个变量之间只有存在着高度相关的关系，回归方程才有实际意义。 2)两个变量之间确实呈现直线相关关系。

两个变量之间只有存在直线相关关系，才能配合直线回归方程。 3.建立一元线性回归方程的方法

一元线性回归方程是用于分析两个变量(一个因变量和一个自变量)线性关系的数学表达式，一般形式为：yc=a+bx 式中：x代表自变量;

yc代表因变量y的估计值(又称理论值);

1 ab为回归方程参数。其中，a是直线在y轴上的截距，它表示当自变量x等于 0 时，因变量所达到的数值;b是直线的斜率,在回归方程中亦称为回归系数,它表示当自变量x每变动一个单位时，因变量y平均变动的数值。

一元线性回归方程应根据最小二乘法原理建立，因为只有用最小二乘法原理建立的回归方程才可以同时满足两个条件：

1)因变量的实际值与回归估计值的离差之和为零;

2)因变量的实际值与回归估计值的离差平方和为最小值。

只有满足这两个条件，建立的直线方程的误差才能最小，其代表性才能最强。

现在令要建立的一元线性回归方程的标准形式为yc=a+bx,依据最小二乘法原理，因变量实际值y与估计值yc的离差平方和为最小值,即Q=∑(y-yc)2取得最小值。为使Q=∑(y-yc)2=最小值

根据微积分中求极值的原理，需分别对a,b求偏导数，并令其为0，经过整理，可得到如下方程组： ∑y=an+b∑x ∑xy=a∑x+b∑x2

解此方程组，可求得a,b两个参数

4. 计算估计标准误差

回归方程只反映变量x和y之间大致的、平均的变化关系。因此，对每一个给定的x值，回归方程的估计值yc与因变量的实际观察值y之间总会有一定的离差，即估计标准误差。估计标准误差是因变量实际观察值 y与估计值yc离差平方和的平均数的平方根，它反映因变量实际值y与回归直线上各相应理论值yc之间离散程度的统计分析指标。估计标准误差：

式中：sy——估计标准误差;y——因变量实际观察值;yc——因变量估计值;n-2——自由度如何描述两个变量之间线性相关关系的强弱? 利用相关系数r来衡量

当r>0时，表示x与y为正相关; 当r<0时，表示x与y为负相关。 5.残差分析与残差图：

残差是指观测值与预测值(拟合值)之间的差，即是实际观察值与回归估计值的差

在研究两个变量间的关系时，

a) 要根据散点图来粗略判断它们是否线性相关;

b) 判断是否可以用回归模型来拟合数据;

c) 可以通过残差来判断模型拟合的效果，判断原始数据中是否存在可疑数据，这方面的分析工作就称为残差分析。 6.残差图的制作及作用。

坐标纵轴为残差变量，横轴可以有不同的选择;若模型选择的正确，残差图中的点应该分布

2 在以横轴为心的带状区域，带状区域的宽度越窄精度越高。对于远离横轴的点，要特别注意。

7.几点注解：

第一个样本点和第 6 个样本点的残差比较大，需要确认在采集过程中是否有人为的错误。如果数据采集有错误，就应该予以纠正，然后再重新利用线性回归模型拟合数据;如果数据采集没有错误，则需要寻找其他的原因。

另外，残差点比较均匀地落在水平的带状区域中，说明选用的模型计较合适，这样的带状区域的宽度越窄，说明模型拟合精度越高，回归方程的预报精度越高。还可以用判定系数r2来刻画回归的效果，该指标测度了回归直线对观测数据的拟合程度，其计算公式是：

其中：SSR -回归平方和;

SSE -残差平方和;

Sst=ssr+sse总离差平方和。

由公式知，R(相关指数)的值越大，说明残差平方和越小，也就是说模型拟合效果越好。在含有一个解释变量的线性模型中r2恰好等于相关系数r的平方，即R2=r2

在线性回归模型中，R2表示解释变量对预报变量变化的贡献率。R2越接近1，表示回归的效果越好(因为R2越接近1，表示解释变量和预报变量的线性相关性越强)。

如果某组数据可能采取几种不同回归方程进行回归分析，则可以通过比较R2的值来做出选择，即选取R2较大的模型作为这组数据的模型。

总的来说：相关指数R2是度量模型拟合效果的一种指标。在线性模型中，它代表自变量刻画预报变量的能力。

五、多元线性回归分析

在一元线性回归分析中，因变量y只受某一个因素的影响，即只由一个自变量x来估计。但对于复杂的自然界中的问题，影响因素往往很多，在这种情况下，因变量y要用多个自变量同时进行估计。例如，某种产品的总成本不仅受原材料价格的影响，而且也与产品产量、管理水平等因素有关;农作物产量的髙低受品种、气候、施肥量等多个因素的影响。描述因变量与两个或两个以上自变量之间的数量关系的回归分析方法称为多元线性回归分析。它是一元线性回归分析的推广，其分析过程相对复杂一些，但基本原理与一元线性回归分析类似。多元线性回归方程的一般表达式为：

3 为便于分析，当自变量较多时可选用两个主要的自变量x1和x2。其线性回归方程标准式为：

其中：yc为二元回归估计值;a为常数项;b1和b2分别为y对x1和x2的回归系数，b1表示当自变量x2为一定时，由于自变量x1变化一个单位而使y平均变动的数值，b2表示当自变量x1为一定时，由于自变量x2变化一个单位而使y平均变动的数值，因此，b1和b2称为偏回归系数。

要建立二元回归方程，关键问题是求出参数a，b1和b2的值，求解方法仍用最小二乘法，即分别对a，b1和b2求偏导数，并令函数的一阶导数等于零，可得如下方程组：

(二) 在回归分析中，通常称自变量为回归因子，一般用一般用表示。预测公式：

表示，而称因变量为指标，，称之为回归方程。回归

模型，按照各种原则可以分为各种模型：

1. 当n =1 时，称为一元(单因子)回归;当n ≥ 2时，称为多元(多因子)回归。

2. 当 f 为线性函数时，称为线性回归;当 f 为非线性函数时，称为非线性(曲线)回归。最小二乘准则：

假设待定的拟合函数为

，另据m个数据点，相当于求解以下规划问题：

即使得总离差平方和最小。具体在线性拟合的过程中，假设拟合函数为y=a+bx，a与b为待定系数，已知有m个数据点，分别为使：

，应用最小二乘法，就是要

达到最小值。

把S 看成自变量为a和b的连续函数，则根据连续函数达到及致电的必要条件，于是得到：

因此，当S 取得最小值时，有：

可得方程组为：

称这个方程组为正规方程组，解这个二元一次方程组，得到：

如果把已有数据描绘成散点图，而且从散点图中可以看出，各个数据点大致分布在一条直线附近，不妨设他们满足线性方程：

其中，x为自变量，y为因变量，a与b为待定系数;ε成为误差项或者扰动项。

这里要对数据点做线性回归分析，从而a和b就是待定的回归系数，ε为随机误差。不妨设得到的线性拟合曲线为：

这就是要分析的线性回归方程。一般情况下，得到这个方程以后，主要是描绘出

回归曲线，并且观测拟合效果和计算一些误差分析指标，例如最大点误差、总方差和标准差等。

这里最缺乏的就是一个统一的评价系统，以下说明从概率角度确立的关于线性回归的一套评价系统。

在实际的线性回归分析中，除了估计出线性回归系数a和b，还要计算y和x的相关程度，即相关性检验。相关性检验主要通过计算相关系数来分析，相关系数的计算公式为：

其中n为数据点的个数，

为原始数据点，r的值能够很好地反映出线性相关程度的高低，一般来说，存在以下一些标准：

1. 当 r →1 或者 r →− 1时，表示 y与x高度线性相关，于是由原始数据描绘出的散点图中所有数据点都分布在一条直线的附近，分别称为正相关和负相关;

2. 当 r →0 时，表示 y与x不相关，由原始数据描绘出的散点图的数据点一般呈无规律的特点四散分布;

5 3. 当−1

4. 如果r → 1，则y与x线性相关程度越高;反之，如果r →0 ，则y与x线性相关程度越低。

实际计算r值的过程中，长列表计算，即：

在实际问题中，一般要保证回归方程有最低程度的线性相关。因为许多实际问题中，两个变量之间并非线性的相关关系，或者说线性相关程度不高，此时硬给他建立线性回归方程，显然没有太大意义，也没有什么实用价值。一般来说，把这个最低限度的值记为临界值出r的值，并且满足

，称之为相关性检验标准。因此，如果计算

，则符合相关性要求，线性回归方程作用显著。反之，如果，则线性回归方程作用不显著，就尽量不要采用线性回归方程。临界值的数值表如下：

其中，自由度可以由原始数据点的个数减去相应的回归方程的变量个数，例如线性回归方程中有两个变量，而数据点的个数为n个，则自由度为n − 2.自由度一般记为 f ，但不要与一般的函数发生混淆。显著性水平一般取为 0.01,0.02,0.05等，利用它可以计算y与x之间相关关系的可信程度或者称为置信水平，计算公式为：

(这里取显著性水平为α =0.05 )

现在介绍置信区间的问题，由于实际误差的存在，由线性拟合得到的计算值跟实际值之间必然存在一定的差距，其差值就是计算误差。假设原始数据点为为

，计算得到的数据点，再给定附近的一个区间：

则实际值yi可能落在这个区间内，也可能落在这个区间外。如果所有的这些区间 (以为中心，长度为

)包含实际值的个数占总数的比例达到95%或者以上，则称这些区间的置信水平不少于95% 根据以上的分析，可以知道置信区间的概念，如果确定了置信水平为95%，从而可以找到相应的最小的Δt值，使得 95%以上的实际值落在区间

内，则称为预测值满足置信水平95%的置信区间。一般情况下，如果不做特别说明，置信区间的相应置信水平默认为95%，置信区间反映了回归方程的适用范围和精确度，特别的，当所有离散数据分布在回归曲线的附件，大致呈现为正态分布时，置信区间为：中S 为该回归模型的标准差，计算公式为：

其

或者为：

那么，如果回归方程为 y=a+bx，则有两条控制直线分别为，他们代表了置信区间的上限和下限，如下图所示：

和

那么，可以预料实际的数据点几乎全部(至少95%)落在上图两条虚线所夹的区域内。这里对回归方程的应用做一个总结：

1. 估计、预测指标值。对于因子x的一个给定值 x0 ，代入回归预测方程即可求出相应的指标值，称为指标y0的点估计，相应预测误差为

但是，真实指标y0 的值一般无法确知，预测精度只能根据回归误差来做估计。在回归预测中，预测的精度可以用均方差和标准差的比值来估计;

2. 估计指标值范围。估计指标值的范围，就是求给定x0 ，相应于某个给定的置信水平的置信区间。具体的求法，要应用到t分布;

3. 控制因子取值。在某些实际问题中，特别当因子值可以人为的控制、调解时，也可以根据所要达到的指标值，反过来推出因子的取值，这就是因子值的控制。

第四篇：统计分析方法学习总结

S201505158 陈丹妮

一、统计的描述

一般采用以下几种图形描述数据：

直方图：表示几个变量的数据，使人们能够看出这些数目的大体分布或“形状”; 盒形图：比直方图简单一些的是盒形图(boxplot，又称箱图、箱线图、盒子图);

茎叶图：既展示了数据的分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字，叶为较小位数的数字;

散点图：描述的数据有两对连续变量; 定型变量的图：定性变量(或属性变量，分类变量)不能点出直方图、散点图或茎叶图，但可以描绘出它们各类的比例，如：饼图、条形图。

二、汇总统计量

表示位置的汇总统计量：均值(mean)：样本值的算术平均值;中位数(median)：中间大小的数(一半样本点小于中位数);(第一或第三)(下、上)四分位数(点) (first quantile, third quantile )(分别有1/4或3/4的数目小于它们);k-百分位数(k-percentile);a分位数(a centile)： k-百分位数=k%分位数：有k%的数目小于它;众数(mode)：样本中出现最多的数。

表示尺度的汇总统计量：极差(range)：极端值之差;四分位间距(四分位极差) (interquantile range) 四分位数之差;标准差(standard deviation) 方差平方根;方差(variance) 各点到均值距离平方的平均。

三、相关的分布

相关的分布包括：离散分布、连续分布、抽样分布：我们能够利用样本统计量中的(描述样本的)信息, 比如样本均值和样本标准差中的信息，来对(描述总体的)总体参数(比如总体均值和总体标准差)进行推断(估计、检验等)。

大数定律：阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。其中又分为独立同分布大数定律(提供了用样本平均数估计总体平均数的理论依据)和贝努力大数定律(提供了频率代替概率的理论依据)。

中心极限定理：阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。独立同分布中心极限定理(不论总体服从何种分布，只要它的数学期望和方差存在，从中抽取容量为n的样本，当n充分大时，则这个样本的总和或平均数是服从正态分布的随机变量)和德莫佛-拉普拉斯中心极限定理(提供了用正态分布近似计算二项分布概率的方法)。均值的假设检验包括对于正态总体均值的检验、对于比例的检验

四、各种分析方法

1. 列联表分析

列联表变量中每个都有两个或更多的可能取值，称为水平，比如收入有三个水平，观点有两个水平，性别有两个水平等。列联表的中间各个变量不同水平的交汇处，就是这种水平组合出现的频数或计数(count)。二维的列联表又称为交叉表(cross table)。列联表可以有

很多维。维数多的叫做高维列联表。注意前面这个列联表的变量都是定性变量;但列联表也会带有定量变量作为协变量。

2. 方差分析

方差分析(analysis of variance，ANOVA)是分析各个自变量对因变量影响的一种方法。这里的自变量就是定性变量的因子及可能出现的称为协变量(covariate)的定量变量。分析结果是由一个方差分析表表示的。原理为：把因变量的值随着自变量的不同取值而得到的变化进行分解，使得每一个自变量都有一份贡献，最后剩下无法用已知的原因解释的则看成随机误差的贡献。然后用各自变量的贡献和随机误差的贡献进行比较(F检验)，以判断该自变量的不同水平是否对因变量的变化有显著贡献。输出就是F-值和检验的一些p-值。

3. 相关和回归分析

发现变量之间的统计关系，并且用此规律来帮助我们进行决策才是统计实践的最终目的。一般来说，统计可以根据目前所拥有的信息(数据)来建立人们所关心的变量和其他有关变量的关系。这种关系一般称为模型(model)。

假如用Y表示感兴趣的变量，用X表示其他可能与Y有关的变量(X也可能是若干变量组成的向量)。则所需要的是建立一个函数关系Y=f(X)。这里Y称为因变量或响应变量(dependent variable, response variable)，而X称为自变量，也称为解释变量或协变量(independent variable, explanatory variable, covariate)。建立这种关系的过程就叫做回归(regression)。

一旦建立了回归模型，除了对变量的关系有了进一步的定量理解之外，还可以利用该模型(函数)通过自变量对因变量做预测(prediction)。这里所说的预测，是用已知的自变量的值通过模型对未知的因变量值进行估计;它并不一定涉及时间先后。

4. 主成分分析和因子分析

主成分分析从原理上是寻找椭球的所有主轴。原先有几个变量，就有几个主成分。而因子分析是事先确定要找几个成分，这里叫因子(factor)(比如两个)，那就找两个。这使得在数学模型上，因子分析和主成分分析有不少区别。而且因子分析的计算也复杂得多。根据因子分析模型的特点，它还多一道工序：因子旋转(factor rotation);这个步骤可以使结果更好。对于计算机，因子分析并不费事。从输出的结果来看，因子分析也有因子载荷(factor loading)的概念，代表了因子和原先变量的相关系数。但是在因子分析公式中的因子载荷位置和主成分分析不同。因子分析也给出了二维图;其解释和主成分分析的载荷图类似。

可以看出，因子分析和主成分分析都依赖于原始变量，也只能反映原始变量的信息。所以原始变量的选择很重要。另外，如果原始变量都本质上独立，那么降维就可能失败，这是因为很难把很多独立变量用少数综合的变量概括。数据越相关，降维效果就越好。在得到分析的结果时，并不一定会都得到如我们例子那样清楚的结果。这与问题的性质，选取的原始变量以及数据的质量等都有关系。

5. 聚类分析

物以类聚、人以群分;但根据什么分类呢?如要想把中国的县分类，就有多种方法可以按照自然条件来分，比如考虑降水、土地、日照、湿度等，也可考虑收入、教育水准、医疗条件、基础设施等指标;既可以用某一项来分类，也可以同时考虑多项指标来分类。对一个数据，既可以对变量(指标)进行分类(相当于对数据中的列分类)，也可以对观测值(事件，样品)来分类(相当于对数据中的行分类)。当然，不一定事先假定有多少类，完全可以按照数据

本身的规律来分类。对变量的聚类称为R型聚类，而对观测值聚类称为Q型聚类。它们在数学上是无区别的。

k-均值聚类(k-means cluster，也叫快速聚类，quick cluster)却要求先说好要分多少类。然后，根据和这三个点的距离远近，把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来“种子”就没用了)，再重新按照距离分类。如此叠代下去，直到达到停止叠代的要求(比如，各类最后变化不大了，或者叠代次数太多了)。显然，前面的聚类种子的选择并不必太认真，它们很可能最后还会分到同一类中呢。另一种聚类称为分层聚类或系统聚类(hierarchical cluster)。开始时，有多少点就是多少类。它第一步先把最近的两类(点)合并成一类，然后再把剩下的最近的两类合并成一类;这样下去，每次都少一类，直到最后只有一大类为止。越是后来合并的类，距离就越远。

6. 判别分析

在聚类分析中，人们一般事先并不知道应该分成几类及哪几类，全根据数据确定。在判别分析中，至少有一个已经明确知道类别的“训练样本”，并利用该样本来建立判别准则，并通过预测变量来为未知类别的观测值进行判别了。训练样本中必须包含所有要判别的类型，分类必须清楚，不能有混杂。要选择好可能用于判别的预测变量。这是最重要的。当然，在应用中，选择余地不见得有多大。要注意数据是否有不寻常的点或者模式存在。还要看预测变量中是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证。判别分析是为了正确地分类，但同时也要注意使用尽可能少的预测变量来达到这个目的。使用较少的变量意味着节省资源和易于对结果作解释。在计算中需要看关于各个类的有关变量的均值是否显著不同的。

7. 典型相关分析

由于一组变量可以有无数种线性组合(线性组合由相应的系数确定)，因此必须找到既有意义又可以确定的线性组合。典型相关分析(canonical correlation analysis)就是要找到这两组变量线性组合的系数使得这两个由线性组合生成的变量(和其他线性组合相比)之间的相关系数最大。目的：研究多个变量之间的相关性。方法：利用主成分思想,可以把多个变量与多个变量之间的相关化为两个变量之间的相关. 即找一组系数(向量)l和m, 使新变量U=l`X(1)和V=m`X(2)有最大可能的相关关系。

8. 对应分析

在因子分析中，或者只对变量(列中的变量)进行分析，或者只对样品(观测值或行中的变量)进行分析;而且利用载荷图来描述各个变量之间的接近程度。典型相关分析也只研究列中两组变量之间的关系。然而，在很多情况下，所关心的不仅仅是行或列本身变量之间的关系，而是行变量和列变量的相互关系;对应分析方法被普遍认为是探索性数据分析的内容，处理列联表的问题仅仅是对应分析的一个特例。一般地，对应分析常规地处理连续变量的数据矩阵;这些数据具有如在主成分分析、因子分析、聚类分析等时所处理的数据形式。在对应分析中，根据各行变量的因子载荷和各列变量的因子载荷之间的关系，行因子载荷和列因子载荷之间可以两两配对。如果对每组变量选择前两列因子载荷，则两组变量就可画出两因子载荷的散点图。由于这两个图所表示的载荷可以配对，于是就可以把这两个因子载荷的两个散点图画到同一张图中，并以此来直观地显示各行变量和各列变量之间的关系。由于列联表数据形式和一般的连续变量的数据形式类似，所以也可以用对应分析的数学方法来研究行变量各个水平和列变量各个水平之间的关系。

9. 时间序列分析

人们对统计数据往往可以根据其特点从两个方面来切入，以简化分析过程。一个是研究所谓横截面(cross section)数据，也就是对大体上同时，或者和时间无关的不同对象的观测值组成的数据。另一个称为时间序列(time series)，也就是由对象在不同时间的观测值形成的数据。时间序列分析也是一种回归。回归分析的目的是建立因变量和自变量之间关系的模型;并且可以用自变量来对因变量进行预测。通常线性回归分析因变量的观测值假定是互相独立并且有同样分布。而时间序列的最大特点是观测值并不独立。时间序列的一个目的是用变量过去的观测值来预测同一变量的未来值。也就是说，时间序列的因变量为变量未来的可能值，而用来预测的自变量中就包含该变量的一系列历史观测值。当然时间序列的自变量也可能包含随着时间度量的独立变量。一个时间序列可能有趋势、季节、循环这三个成分中的某些或全部再加上随机成分。因此，如果要想对一个时间序列本身进行较深入的研究，把序列的这些成分分解出来、或者把它们过虑掉则会有很大的帮助。如果要进行预测，则最好把模型中的与这些成分有关的参数估计出来。

如果我们不仅仅满足于分解现有的时间序列，而且想要对未来进行预测，就需要建立模型。首先，这里介绍比较简单的指数平滑(exponential smoothing)。指数平滑只能用于纯粹时间序列的情况，而不能用于含有独立变量时间序列的因果关系的研究。指数平滑的原理为：当利用过去观测值的加权平均来预测未来的观测值时(这个过程称为平滑)，离得越近的观测值要给以更多的权。而“指数”意味着：按照已有观测值“老”的程度，其上的权数按指数速度递减。

第五篇：分析方法总结及优缺点

一、德尔菲法

优点：

1、能充分发挥各位专家的作用，集思广益，准确性高。

2、能把各位专家意见的分歧点表达出来，取各家之长，避各家之短。

3、权威人士的意见影响他人的意见;

4、有些专家碍于情面，不愿意发表与其他人不同的意见;

5、出于自尊心而不愿意修改自己原来不全面的意见。

缺点：

德尔菲法的主要缺点是过程比较复杂，花费时间较长。适用范围：项目规模宏大且环境条件复杂的预测情境。

二、类比法

优点：

1、它不涉及任何一般性原则，它不需要在“一般性原则”的基础上进行推理。它只是一种由具体情况到具体情况的推理方式，其优越性在于它所得出的结论可以在今后的超出原案例事实的情况下进行应用。

2、类比法比其他方法具有更高的精确性;

3、类比过程中的步骤可以文档化以便修改。

缺点： 1 严重依赖于历史数据的可用性;

2 能否找出一个或一组好的项目范例对最终估算结果的精确度有着决定性的影响;

3 对初始估算值进行调整依赖于专家判断。

适用范围：类比法是按同类事物或相似事物的发展规律相一致的原则，对预测目标事物加以对比分析，来推断预测目标事物未来发展趋向与可能水平的一种预测方法。类比法应用形式很多，如由点推算面、由局部类推整体、由类似产品类推新产品、由相似国外国际市场类推国内国际市场等等。类比法一般适用于预测潜在购买力和需求量、开拓新国际市场、预测新商品长期的销售变化规律等。类比法适合于中长期的预测。

三、回归分析法优点：

1、从收入动因的高度来判断收入变化的合理性，彻底抛弃了前述“无重大波动即为正常”的不合理假设。并且，回归分析不再只是简单的数据比较，而是以一整套科学的统计方法为基础。

、运用回归方法对销售收入进行分析性复核，可以考虑更多的影响因素作为解释变量，即使被审计单位熟悉了这种方法，其粉饰和操纵财务报表的成本也十分高昂。

缺点：需要掌握大量数据，

应用：社会经济现象之间的相关关系往往艰以用确定性的函数关系来描述，它们大多是随机性的，要通过统计观察才能找出其中规律。回归分桥是利用统计学原理描述随机变量间相关关系的一种重要方法。

四、时间序列分析法

优点：根据市场过去的变化趋势预测未来的发展，根据客观事物发展的这种连续规律性，运用过去的历史数据，通过统计分析，进一步推测市场未来的发展趋势。

缺点：运用时间序列分析进行量的预测，实际上将所有的影响因素归结到时间这一因素上，只承认所有影响因素的综合作用，并在未来对预测对象仍然起作用，并未去分析探讨预测对象和影响因素之间的因果关系。由于事物的发展不仅有连续性的特点，而且又是复杂多样的。。适用范围：中短期预测

五、弹性系数分析法

优点：简单易行，计算方便，计算成本低;需要的数据少，应用灵活广泛。缺点：

1、分析带有一定的局部性和片面性。只考虑两个变量间的关系，忽略了其他相关变量的影响;

2、结果比较粗糙，很多时候要根据弹性系数的变动趋势对弹性系数进行修正。

应用：应用利用弹性系数预测未来时期能源需求时，可以通过对未来产业结构变化趋势、技术节能潜力等因素的分析，以及参照世界大多数国家发展历程中所皇现的共同规律，给出未来年份能源消费弹性系数的变化趋势或构想方案，以预测未来的能源需求量。

六、灰色预测法

优点：灰色预测通过鉴别系统因素之间发展趋势的相异程度，即进行关联分析，并对原始数据进行生成处理来寻找系统变动的规律，生成有较强规律性的数据序列，然后建立相应的微分方程模型，从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型，预测未来某一时刻的特征量，或达到某一特征量的时间。

缺点：灰色系统的行为现象不准确，数据是杂乱的

适用范围：商业连锁企业随着门店的不断增加，总部对企业的管理将变得越发困难，尤其是对销售量的预测，这严重影响了决策层对企业的控制和管理，影响总部的决策水平，包括资金的调度和使用、大批量进货以降低成本、门店的发展速度等等。随着模糊数学的不断发展，灰色预测方法得到了广泛应用，它对于商业连锁企业的销售管理，有指导价值。

七、组合预测法：

优点：利用多种预测法有效地提高预测的精确度，结合了所组合的各种预测法的优点。能够较大限度地利用各种预测样本信息，比单个预测模型考虑问题更系统、更全面

缺点：需要运用多种预测法，复杂繁琐，对现实中的问题进行分析时，要确定其具有某种函数关系有很大的难度

适用范围：适用于需要高精确度的情况