當前位置: 首頁 > 所有學科 > 地理

地理加權回歸,地理加權回歸模型結果解讀

  • 地理
  • 2023-05-19
目錄
  • 地理加權回歸模型GWR
  • 地理加權回歸模型案例
  • 地理加權回歸模型結果解讀
  • 地理加權回歸用什么
  • 地理加權回歸是干嘛的

  • 地理加權回歸模型GWR

    需要。1、描述

    執行“地理加權回歸 (GWR)”,這是一種用于建模空間變化關系的線性回歸的局部形式。

    2、一圖讀懂GWR

    GWR 為局部回歸模型。系數可以變化。

    3、使用

    GWR 為數據集中的各要素構建了一個獨立的方程,用于將各目標要素的帶寬范圍內的要素的因變量和解釋變量進行合并。帶寬的形狀和范圍取決于用戶輸入的核類型、帶寬方法、距離以及相鄰要素數等參數,但也存在一條限制:如果相鄰要素的數目超過 1000,則僅將最相鄰的 1000 個要素合并到各個局部方程中。

    GWR 通常被要求用于處理包含數百個要素的數據集,以便獲得最佳結果, GWR 不適用于小型數據集。而且,此不能用于處理多點數據備廳。

    注:GWR 會生成各種輸出。右鍵單擊結果窗口中的消息條目,然后選擇視圖,將顯示 GWR 的執行匯總報告。

    此外,GWR 也會生成一個輸出要素類和一個包含了執行匯總報告診斷值的表。會自動將此仿蠢隱表以輸出要素類名加上 _supp 作為后綴的形式進行命名。輸出要素類會自動添加至內容列表中,并會對模型殘差應用熱/冷渲染方案。在解釋 GWR 結果中提供了有關各輸出的完整說明。_supp 文件的創建位置始終與輸出要素類相同,除非輸出要素類被創建在一個要素數據集內。當輸出要素類位于要素數據集內時,_supp 表則會創建在該要素數據集所在的地理數據庫中。

    建議您使用投影數據。這一點在距離成為分析的一部分時尤其重要,因為在您針對核類型選擇固定時,會對 GWR 使用投影數據。建議您使用投影坐標系(而非地理坐標系)對數據進行投影。

    由 GWR 執行的某些計算會利用多個 CPU 以提高性能,并會自動使用多達 8 條線程/CPU 進行處理。

    應該始終從普通最小二乘法 (OLS) 回歸開始回歸分析。首先獲得一個正確指定的 OLS 模型,然后使用同樣的解釋變量運行 GWR(不包括表示不同空間組織的任何“啞元”解釋變量)。

    因變量和解釋變量應該是包含各種值的數值型字段。線性回歸方法(如 GWR)不適于預測二進制結果(例如,因變量的所有值不是 1 就是 0)。

    如果在 GWR 模型中包含名目數據或分類數據,則需謹慎操作。在類別出現空間聚類的地方,存在局部多重共線性的風險。GWR 輸出中包含的條件數指明了局部共線性何時會導致問題(條件數小于零、大于 30 或設置為“空”)。存在局部多重共線性的結果是不穩定的。

    請勿使用人工解釋變量來表示 GWR 模型中的不同空間組織(例如,向城鎮中心外的人口普查區賦予值 1,而向其他區域賦予值 0)。由于 GWR 允許解釋變量系數發生變化,這些空間組織解釋變量并不必要,并且如果包含了這些變量,則會產生局部多重共線性問題。

    要更好地了解解釋變量系數當中的區域變化,請檢查由 GWR 創建的可選柵格系數表面。將在系數柵格工作空間中創建這些柵格表面。對于面數據,您可以對輸出要素類中的每個系數字段使用漸變色彩或由冷色到暖色的渲染以檢查整個研究區域的更改。

    通過提供預測位置要素類(通常,此要素類與輸入要素類相同)、預測解釋變量和輸出預測要素類,您可以使用 GWR 進行預測。在用來校正回歸模型的字段(解釋變量字段的輸入值)與用來預測的字段(預測解釋變量字段的輸入值)之間必須是一對一的對應關系。這些變量的順序必須相同。例如,假設您當前正針對交通事故構建一個有關速度限制、道路條件、車道數量以及汽車數量的函數。通過創建一個具有修正后的速度限制和道路條件的新變量,您可以預測更改速度限制或改善道路狀況可能對交通事故產生的影響。現有變量將用于校正回歸模型,并用作解釋變量的參數。修正的變量將用于預測,并可作為預測解釋變量。

    如果提供了預測位置要素類,但未指定預測解釋變量,則僅使用各位置的已計算系數創建輸出預測要素類(不進行任何預測)。

    如果回歸模型缺少關鍵解釋變量,則會導致回歸模型的指定錯誤。如果回歸殘差的空間自相關具有統計學上的顯著性,或者在一個或多個解釋變量的系數檔卜當中發生了非期望的空間變化,則表明錯誤指定了您的模型。您應該盡一切努力(例如,通過 OLS 殘差分析和 GWR 系數變化分析)來查找這些丟失的關鍵變量,以便在模型中包含這些變量。

    時刻關注解釋變量的不穩定性是否會出現問題。例如,假設您正將特殊植物種類的密度構建為若干變量(包括 ASPECT)的函數。如果發現在整個研究區域中 ASPECT 變量的系數發生了更改,則可能要查看是否有缺少關鍵解釋變量的跡象(例如,可能存在大量競爭植被)。應該盡一切努力將所有關鍵解釋變量包含到回歸模型中。

    為帶寬方法參數選擇 AICc(更正后的 Akaike 信息準則)或 CV(交叉驗證)時,GWR 將查找最佳距離(對于固定核)或最佳相鄰要素的數目(對于自適應核)。但是,局部多重共線性問題將會阻止 AICc 和 CV 帶寬方法解析最佳距離/相鄰要素的數目。如果出現表示模型設計存在嚴重問題的錯誤,則請嘗試指定特殊距離或相鄰要素的數目, 然后檢查輸出要素類中的條件數,以查看哪些要素與局部共線性問題相關聯。

    嚴重模型設計錯誤或用于表明局部方程未包含足夠多相鄰要素的錯誤,通常表示回歸存在全局或局部多重共線性問題。要確定出現問題的位置,請使用 OLS 運行模型,然后檢查每個解釋變量的 VIF 值。如果某些 VIF 值較大(例如,大于 7.5),則全局多重共線性會阻止 GWR 解決問題。但是,更有可能是局部多重共線性所導致的問題。請嘗試為各解釋變量創建一個專題地圖。如果在地圖上出現相同值的空間聚類,考慮將這些變量從模型中移除,或將這些變量與其他解釋變量合并以便加大值的變化性。例如,如果要對房屋價格進行建模且具有臥室和浴室兩個變量,則可能需要將其合并以加大值的變化性,或將其表示為浴室/臥室的建筑面積。在構造 GWR 模型時,要避免使用空間組織啞元變量、空間聚類名目或數值變量或者幾乎不可能具有值的變量。

    GWR 是一種線性模型,其前提條件與 OLS 相同。要確保正確指定您的 GWR 模型,請參閱回歸分析基礎知識中的回歸模型失效方式部分。

    地理加權回歸模型案例

    這和我們今天說的地理加權回歸 Geographical Weighted Regression (GWR)有什么關系呢?

    因為傳統的線伍型性回歸,是地理加權回歸的基礎——孩子她媽。

    什么?你問我孩子他爸是誰?

    “回歸”一詞對于數學不好的同學來說可能有點抽象,其實就是線性回歸最樸素的樣子——一條線去擬合一群點。

    “地理加權”四個大字,體現的是GWR算法與傳統線性亂蔽回歸的不一樣之處——考慮了空間關系對模型的影響。就好比如:

    家長:“能否把我的孩子放到第一排”

    比如:身高與體重的關系——這也是最經典的線性回歸例子。我們可以用最簡單的一元線性回歸進行分析。

    但是身高和體重之間,并不是完全的正相關(R方=1),還受到其他很多因素有關。比如:生活習慣、飲食、地區差異等。

    同時我們再思考一個問題,古人云“一方水土養一方人”,當我們的研究對象分布在不同的區域,能否只用一個回歸公式來揭示它們所有特征?

    模型沒有絕對的能或者不能,但這樣做可能難以滿足我們研究的要求。

    “一方水土養一方人”,其實也就是地理加權回歸的核心和出發點——考慮空間關系的影響。當我們在做回歸分析的時候,如果樣本分布在不同的區域,而不同區域之間某些對因變量產生影響的因素差異很大(稱之為:存在“空間異質性”),這個時候我們可能就需要考慮空間關系對模型的影響。引入地理加權回歸。

    看到這里也許有同學會問,那我將研究區域腔陪猜,劃分成多個不同的子區域,再分別對其中的子區域進行經典回歸分析不就好了嘛?

    這確實是一個解決的辦法。但事情沒有這么簡單。地理學的祖師爺Waldo Tobler告訴我們地理學第一定律:

    任何事物都是與其他事物相關的,只不過相近的事物關聯更緊密

    地理加權回歸模型結果解讀

    地理加權回歸和聚類分析的區別明顯。要對多遲搭賀個變量進行地理加權回歸的話,變量之間必須存在一點的關聯性,且不存在共線性問題。聚類分析的職能是建立一種分類方法,它是將一批樣品或變量,按照它們在枝碰性質上的親疏程度進行碼派分類。

    地理加權回歸用什么

    地理加權回歸是一種探索空間非平穩性的方法。空間非平穩性是指簡單的“全局”回歸模型不能充分解釋一個地理區域內某些變量之間的關系的一種情況。相反,模型的性質應該隨著空間的變化而改變,以反映數據中的結構。例如,在一個地理區域內,與風險因素相關的疾病風險是否保持不變,還是在該區域內的某些點這種關系更強。

    Brunsdon等人(1996)開發了地理加權回歸,試圖通過校準多元回歸模型來捕捉這種空間變化,該模型允許變量在空間的不同點之間存在不同的關系。

    簡介

    地理加權回歸的基本思想是,在數據中的每一點擬合一個回歸模型,根據距離這一點的函數加權所有觀測值。這與這樣一種觀點相一致,即在回歸集中的觀測點附近采樣的觀測結果比在更遠的觀測結果對該點的回歸參數有更大的影響。然后在定義的地理區域的每個點生成一組參數估計。然后可以使用GIS繪制這些參數估計數,以確定變量之間的關系在何處變化,從而提供一種有用的探索性分析形式。利用蒙特卡羅方法可以進行2個假設檢驗:

    可以用全局模型而不巖隱是非平穩模型來描述數據。

    個體回歸系數在地理空間上是否穩定。

    我將介紹如何使用ado文件gwr和gwrgrid在Stata中實現這種方法,這兩個文件都將地理加權回歸應用于包含地理參考點的數據集。這兩個ado文件之間的唯一區別是,gwrgrid在地理區域上放置一個網格,并在每個網賀纖格中心執行回歸,而gwr在數據的每個點上執行回歸。

    這些ado文件中的代碼是基于粗拍廳Brunsdon等人的論文和由Brunsdon等人編寫的FORTRAN程序,并且通過大量依賴Stata中現有的glm函數,已擴展到任何形式的廣義線性模型。

    案例:將以Brunsdon等人給出的例子為例進行演示——這是1991年英國人口普查中有關汽車擁有率、社會階層和英格蘭東北部泰恩威爾郡男性失業率的一個數據集。

    參考文獻:

    Brunsdon, C., A. S. Fotheringham, and M. E. Charlton. 1996.

    Geographically weighted regression: A method for exploring spatial nonstationarity. Geographical Analysis 28: 281–298.

    操作應用

    空間統計目前Stata進行地理加權回歸主要有命令spregxt以及gwr、gwrgrid等,本文主要簡介介紹 gwr、gwrgrid命令的基本應用。

    gwr語法格式為:

    Geographically weighted regression

    ----------------------------------

    gwr depvar [varlist] [ ifexp] [ inrange] , east(varname)

    north(varname) [options]

    選項包括

    saving(filename) dots reps( #) double eform family(familyname)

    link(linkname) [ln]offset(varname) testreplace noconstant

    nolog scale(x2|dev| #) disp(#) iterate(#) init(varname)

    outfile(filename) comma wide bandwidth( #) mcsave(filename)

    sample( #)

    其中

    familyname選項包括 gaussian | igaussian | binomial [varname| #] | poisson | nbinomial [#] | gamma,即核函數類型

    linkname 選項包括如下內容:identify | log| logit | probit | cloglog | opower # | power # | nbinomial

    test:要求測試帶寬的重要性。這測試了gwr模型對數據的描述是否明顯優于 全局的回歸模型。

    sample( #)指定在帶寬校準過程中使用的觀測值百分比,默認為100%。這是特別對于大型數據集很有用,可以減少校準帶寬所需的時間。如果指定了該選項,將隨機抽取#%的觀測數據并用于校準過程。

    bandwidth( #)允許用戶輸入帶寬值,并減少gwr運行所需的時間。

    nolog抑制帶寬優化迭代的顯示。

    iterate( #)指定在估計帶寬時允許的最大迭代次數。默認值為50。

    save (filename)創建一個Stata數據文件,其中包含從計算gwr的每個點估算的參數。

    outfile(filename)創建文本文件filename。

    replace表示save和/或outfile指定的文件可以 被覆蓋。它也適用于mcsave選項。

    reps( #)指定要執行的蒙特卡羅模擬的數量。默認值為1000。

    操作案例:

    gwr cars class unemp, east(easting) north(northing) test

    gwr flag class unemp, east(east) north(north) fam(binomial) link(logit)

    gwrgrid y x1, east(east) north(north) fam(b) link(l) square(10) samp(25)

    結果為:

    ?

    . gwr cars class unemp, east(easting) north(northing) test

    Global Model

    Source | SS df MS Number of obs = 120

    -------------+---------------------------------- F(2, 117) = 287.17

    Model | 4.51965851 2 2.25982925 Prob > F = 0.0000

    Residual | .920700696 117 .007869237 R-squared = 0.8308

    -------------+---------------------------------- Adj R-squared = 0.8279

    Total | 5.4403592 119 .045717304 Root MSE = .08871

    ------------------------------------------------------------------------------

    cars | Coef. Std. Err. t P>|t| [95% Conf. Interval]

    -------------+----------------------------------------------------------------

    class | .0188073 .0033449 5.62 0.000 .0121829 .0254316

    unemp | -.0182798 .0011238 -16.27 0.000 -.0205054 -.0160543

    _cons | .8847704 .0288569 30.66 0.000 .8276208 .94192

    地理加權回歸是干嘛的

    地理加權回歸,由英國Newcastle大學地理統計學家A.S Fortheringham及其同事基于空間變系數回歸模型并利用局部多項式光滑的思敗逗想察慶賣提出的模型。模型公式如下:

    其中(yi;xi1,xi2,…,xip)為在地理位置(ui,vi)處的因變量y和自變量x1,x2,…,xp的觀測值(i=1,2,…,n).βj(ui,vi)(j=0,1,…,p)為觀測點(ui,vi)處的未知參數,它是(ui,vi)的未知函,εi(i=1,2,…,n)為獨立同分布的隨機誤差,通常差褲假定其服從N(0,σ2).

    猜你喜歡

    主站蜘蛛池模板: 少妇伦子伦精品无码STYLES| 久久无码精品一区二区三区| 国产av无码专区亚洲av果冻传媒| 在线观看无码的免费网站| 无码h黄肉3d动漫在线观看| 波多野42部无码喷潮在线| 91精品久久久久久无码| 在线无码视频观看草草视频| 亚洲AV无码久久精品蜜桃| 67194成是人免费无码| 人禽无码视频在线观看| 中文字幕乱码人妻无码久久| 亚洲精品无码中文久久字幕| 永久免费av无码网站yy| 无遮掩无码h成人av动漫| 无码人妻品一区二区三区精99| 久久伊人中文无码| 中日精品无码一本二本三本| 亚洲av成本人无码网站| 无码Aⅴ在线观看| 尤物永久免费AV无码网站| 无码一区二区三区免费视频 | 人妻丰满熟妇av无码区不卡| 中文字幕精品无码亚洲字| 亚洲gv猛男gv无码男同短文| 亚洲国产成人精品无码区在线观看| 亚洲精品无码专区在线在线播放| 亚洲成A人片在线观看无码不卡| 无码少妇一区二区| 久久久久亚洲av成人无码电影 | 无码成人AAAAA毛片| r级无码视频在线观看| 台湾无码一区二区| 亚洲国产精品成人AV无码久久综合影院| 亚洲的天堂av无码| yy111111电影院少妇影院无码 | 免费无遮挡无码视频网站| 无码人妻精品一区二区三区在线| 色综合久久久无码网中文| 最新国产AV无码专区亚洲| 久久久无码精品午夜|