مدل سازی آماری داده های ناهمگن طبقه بندی شده فضایی

بهترین آموزش های کاربردی در شهرسازی

بهترین آموزش های کاربردی در شهرسازی را از Urbanity.ir بخواهید

آنتالیا؛ مقصد محبوب سفرهای تابستانی

ادامه ...

دیزل ژنراتور چیست؟ – انجمن شهرسازی ایران

ادامه ...

Friday, 19 April , 2024
امروز : جمعه, ۳۱ فروردین , ۱۴۰۳

آخرین اخبار »

شناسه خبر : 4623

ارسال

پرینتخانه » مقالات تاریخ انتشار : 07 فوریه 2024 - 12:20 | 1 بازدید | ارسال توسط : Jinfeng Wang

مدل سازی آماری داده های ناهمگن طبقه بندی شده فضایی

بالا مقاله کامل ارقام و داده ها منابع استناد معیارهای صدور مجوز چاپ مجدد و مجوزها PDF را مشاهده کنید PDF مشاهده EPUB EPUB نماد اشتراک گذاری بازگشت به بالا نمایش فرمول ها:?فرمول‌های ریاضی به صورت MathML کدگذاری شده‌اند و در این نسخه HTML با استفاده از MathJax نمایش داده می‌شوند تا نمایش آن‌ها بهبود […]

بالا

نمایش فرمول ها: $لوگوی MathJax$ ?فرمول‌های ریاضی به صورت MathML کدگذاری شده‌اند و در این نسخه HTML با استفاده از MathJax نمایش داده می‌شوند تا نمایش آن‌ها بهبود یابد. علامت کادر را بردارید تا MathJax خاموش شود. این ویژگی به جاوا اسکریپت نیاز دارد. برای بزرگنمایی روی یک فرمول کلیک کنید.

خلاصه

آمار مکانی یک روش مهم برای تجزیه و تحلیل داده های مکانی است. این برای مدیریت داده‌های همبسته مکانی و داده‌های ناهمگن از نظر مکانی (محلی) تکامل یافته است که به ترتیب قصد دارند قوانین اول و دوم جغرافیا را دریافت کنند. نمونه هایی از ناهمگونی طبقه بندی شده فضایی (SSH) شامل مناطق اقلیمی و انواع کاربری زمین است. روش‌ها برای چنین داده‌هایی در مقایسه با دو ویژگی اول نسبتاً توسعه نیافته‌اند. وجود SSH گواه این است که طبیعت قانونی و ساختار یافته است و نه تصادفی. این باعث ایجاد “لایه” دیگری از تغییرات زمینه ای علیت مشاهده شده در داده های جغرافیایی می شود. در این مقاله، ما فراتر از رویکردهای سنتی مبتنی بر خوشه می‌رویم و یک رویکرد واحد برای SSH پیشنهاد می‌کنیم که در آن معادله‌ای برای SSH ارائه می‌کنیم، نشان می‌دهیم که چگونه SSH منبع سوگیری در نمونه‌گیری فضایی و مخدوش‌کننده در مدل‌سازی فضایی است، تشخیص علیت تصادفی غیرخطی به ارث رسیده است. در توزیع SSH، برهمکنش عمومی شناسایی شده با همپوشانی دو توزیع SSH را کمی کنید، پیش‌بینی فضایی را بر اساس SSH انجام دهید، یک معیار جدید برای خوبی فضایی ایجاد کنید، و با ادغام آنها با آماره SSH q، مدل‌سازی جهانی را تقویت کنید. این تحقیق تئوری و روش‌های آماری را برای مقابله با داده‌های SSH پیشرفت می‌دهد و در نتیجه جعبه ابزار جدیدی برای تجزیه و تحلیل داده‌های مکانی ارائه می‌دهد.

ç©ºé—´ç»Ÿè®¡æ˜¯åœ°ç †ç©ºé—´æ•°æ ®åˆ†æž çš„é‡ è¦ æ–¹æ³•، èƒ½å¤Ÿå¤„ç †ç ºé—´è‡ªç›¸å…³æ•°æ ®å'Œç©ºé—´(å±€éƒ¨)å¼‚è´¨æ•°æ ®، ä»Žè€Œæ •æ ‰åœ° å¦ç¬¬ä¸€å®šå¾‹å'Œç¬¬äºŒå®šå¾‹ã€‚ç©ºé—´åˆ†å±‚å¼‚è´¨æ€§(SSH)çš„ä¾‹å åŒ…æ‹¬æ°”å€™å¸¦å'ŒåœŸåœ°åˆ©ç”¨ç±»åž‹ã€‚ä¸Žå‰ ä¸¤ä¸ªç‰¹æ€§ç›¸æ¯ », å¾ˆå°'æœ‰é'ˆå¯¹æ¤ç±»æ•°æ ®çš„æ–¹æ³•ã€‚SSHçš„å˜åœ¨, è¯ æ˜Žäº†è‡ªç„ ¯æœ‰è§„åˆ™çš„ã€ ç»“æž„åŒ–çš“, è€Œé žå®Œå…¨éš æœºçš„ã€‚è¿™å¼•å 'äº†åœ°ç †æ •°æ ®å·®å¼‚èƒŒå Žçš„â€œä¸€å±‚â € å› æžœå…³ç³»ã€‚æœ¬æ–‡è¶…è¶Šä¼ ç»Ÿçš„è šç±» æ–¹æ³•، æ å‡ºæ•´ä½“æ€§SSHæ–¹æ³•، æ ä¾›äº†SSHæ–¹ç¨‹، ±•ç¤ºäº†SSHå¦‚ä¼½ ©ºé—´é‡‡æ ·çš„å å·®å'Œç©ºé—´å»ºæ¨¡çšæ··æ·†، æ£€æµ‹äº†SSHåˆ†å¸ƒä¸çš «é žçº¿æ€§éš æœºå› æžœå…³ç³», Œäº†é‡ åŒ–، åŸºäºŽSSHè¿›è¡Œäº†ç©ºé—´é¢„æµ‹، å¼€å 'äº†æ–°çš„ç©ºé—´æŒŸå , å¹¶å°†å…¶ä¸ŽSSHçš„qç»Ÿè®¡ç›¸ç»“å ˆä»Žè€Œæ”¹è¿›äº†å…¨å±€å»ºæ¨¡ã€‚ è¯¥ç ”ç©¶ä¿ƒè¿›äº†SSHæ•°æ ®å¤„ç †çš„ç»Ÿè®¡å¦ç †è®ºå'Œæ–¹æ³•، ä¸ºç©ºé —´æ•°æ ®åˆ†æž æ ä¾›äº†æ–°æ–¹æ³•ã€‚

آمار مکانی یک روش ارزشمند برای تجزیه و تحلیل داده های مکانی است. این زمینه برای پرداختن به مدیریت داده‌های خودهمبسته مکانی و داده‌های ناهمگن مکانی (محلی) تکامل یافته است که به ترتیب به دنبال گرفتن قوانین اول و دوم جغرافیا هستند. نمونه هایی از ناهمگونی طبقه بندی شده فضایی (SSH) شامل مناطق آب و هوایی و انواع کاربری زمین است. روش‌های آن نوع داده در مقایسه با دو ویژگی اول نسبتاً توسعه نیافته است. وجود SSH گواه بر این است که طبیعت به جای تصادفی کاملاً قانونی و ساختارمند است. این “لایه” دیگری از علیت را القا می کند که بر تغییرات مشاهده شده در داده های جغرافیایی تأکید می کند. در این مقاله ما فراتر از رویکردهای سنتی مبتنی بر خوشه حرکت می کنیم و یک رویکرد واحد برای SSH پیشنهاد می کنیم که در آن معادله ای برای SSH ارائه می دهیم، نشان می دهد که چگونه SSH منبع سوگیری در نمونه گیری فضایی و سردرگمی در مدل سازی فضایی است، ما تصادفی غیر خطی را تشخیص می دهیم. علیت در توزیع SSH، ما تعامل کلی شناسایی شده از طریق برهم نهی دو توزیع SSH را کمی می کنیم، یک پیش بینی فضایی را بر اساس SSH فرموله می کنیم، یک معیار جدید برای خوبی فضایی ایجاد می کنیم و مدل سازی جهانی را با ادغام همه چیز با یک آمار q از SSH. این تحقیق به پیشرفت تئوری آماری و روش‌های مقابله با داده‌های SSH کمک می‌کند و در نتیجه جعبه ابزار جدیدی برای تجزیه و تحلیل داده‌های مکانی فراهم می‌کند.

کلید واژه ها:

å…³é”®è¯ :

کلید واژه ها:

نظریه آماری در ابتدا برای مشاهدات مستقل و یکسان توزیع شده (iid) از یک جمعیت (اغلب توسط یک سری آزمایش به دست می آید) توسعه یافت. با این حال، داده‌های مکانی، ناشی از متغیرهای مورد علاقه که در یک فضای جغرافیایی به یکدیگر نزدیک هستند، از نظر محلی مشابه هستند. در ادبیات به این ویژگی خودهمبستگی مکانی (SAC) گفته می شود. اگر تغییرات فضایی زیربنایی از جمعیت را بتوان با یک مدل آماری فضایی توصیف کرد، استنتاج آماری ممکن می شود (به عنوان مثال، کریستاکوس را ببینید نقل قول۱۹۹۲; گریفیث نقل قول۲۰۰۳; هاینینگ نقل قول۲۰۰۳). مدل‌سازی وابستگی فضایی، توسط نوعی مدل خودرگرسیون مکانی برای داده‌های شبکه، یا نیمه متغیره‌نگاری مجاز برای داده‌های زمین‌آماری، در قلب بسیاری از شاخه‌های آمار فضایی قرار دارد (Cliff and Ord). نقل قول۱۹۸۱; کرسی نقل قول۱۹۹۳; استین نقل قول۲۰۲۲).

توانایی مدل‌سازی وابستگی فضایی فرصت‌هایی را برای انجام بسیاری از اشکال تحلیل فضایی، مانند درون یابی فضایی (ماترون) باز می‌کند. نقل قول۱۹۶۳). اصل اساسی را می توان به عنوان یکی از قرض گرفتن مقادیر داده های نزدیک به وسیله وزن دهی معکوس فاصله به منظور تخمین مقادیر باقیمانده داده برای ساختن یک نقشه توصیف کرد. مدل‌های تغییرات مکانی نیز می‌توانند برای بهبود دقت تخمین پارامترهای ناحیه کوچک با فرآیندهای مشابه وام گرفتن اطلاعات از مناطق همسایه استفاده شوند. فرض اساسی که به این شکل از استقراض اطلاعات اجازه می دهد این است که مقادیر پارامترهای همسایه مشابه هستند به طوری که اطلاعات موجود در داده های مناطق همسایه را می توان برای تخمین پارامترهای ناشناخته “قرض گرفت” (ریپلی) نقل قول۱۹۸۱; فاثرینگهام، براندون و چارلتون نقل قول۲۰۰۰; رائو نقل قول۲۰۰۳; گلدشتاین نقل قول۲۰۱۱; هاینینگ و لی نقل قول۲۰۲۰).

این مقاله به توسعه روش‌هایی می‌پردازد که می‌توانند یکی دیگر از ویژگی‌های رایج داده‌های مکانی را بررسی کنند: ناهمگنی فضایی. ناهمگونی اصطلاحی است که در آمار به کار می رود تا نشان دهد که یک یا چند ویژگی آماری مورد علاقه در تمام زیرمجموعه های جامعه یکسان نیستند (اوریت و اسکوندال). نقل قول۲۰۱۰، ۲۰۴). وجود ناهمگونی فضایی قسمت دوم فرض iid را نقض می کند – مشاهدات “به طور یکسان توزیع نشده اند.” به ویژه، اگر منطقه مورد مطالعه ما بزرگ و از نظر فیزیکی یا اجتماعی-اقتصادی متنوع باشد یا منطقه مورد مطالعه ما با وضوح فضایی بالا مشاهده شود، پس این فرض که همه زیرمجموعه های منطقه مورد مطالعه دارای ویژگی های آماری یکسانی هستند، احتمالاً نقض می شود. این فرض که برخی از زیر مجموعه‌های داده‌های ما دارای ویژگی‌های آماری متفاوتی هستند، ممکن است نقطه شروع مطمئن‌تری در تجزیه و تحلیل داده‌ها باشد. به عنوان مثال، دوتیلول (نقل قول۲۰۱۱، ۲۰ تا ۲۱) سه نوع ناهمگونی فضایی را که اغلب با آن مواجه می شوند توصیف کرد: ناهمگنی در میانگین (یا ناهمگونی مرتبه اول؛ به Stein، Hoogerwerf، و Bouma مراجعه کنید. نقل قول۱۹۸۸; فاثرینگهام، براندون و چارلتون نقل قول۲۰۰۰; لوید نقل قول۲۰۱۰; Ge و همکاران نقل قول۲۰۱۹; هاینینگ و لی نقل قول۲۰۲۰، فصل ۶)، ناهمگنی در واریانس (ناهمگنی یا ناهمگنی مرتبه دوم)، و ناهمگنی مرتبط با ساختار خودهمبستگی داده ها (به Getis و Ord مراجعه کنید. نقل قول۱۹۹۲; آنسلین نقل قول۱۹۹۵; کولدورف نقل قول۱۹۹۷).

شکل دیگری از ناهمگونی که در همه جا حاضر است، ناهمگنی طبقه بندی شده فضایی است (SSH؛ JF Wang، Zhang و Fu نقل قول۲۰۱۶). زمانی به وجود می آید که یک ناحیه شامل مجموعه ای از واحدهای فضایی به هم پیوسته را می توان به بخش های فضایی متمایز (طبقه) تقسیم کرد که در هر طبقه (که هر یک شامل تعدادی واحد فضایی است) میانگین یک متغیر یا ارتباط بین مشاهدات یکسان است. نشان می دهد که هر لایه فقط همگنی درون لایه را نشان می دهد. ویژگی های آماری ممکن است در مقایسه با سایر اقشار یکسان نباشد به طوری که اقشار ناهمگونی بین اقشار را به طور جمعی نشان می دهند. به نظر می رسد که این مشکل نسبت به سایر اشکال ناهمگونی فضایی که قبلاً توضیح داده شد توجه سیستماتیک کمتری را به خود جلب کرده است. بخشی از دلیل این امر ممکن است در چالش شناسایی مناطق همگن باشد. اشتاین، هوگرورف، و بوما (نقل قول۱۹۸۸) به نظر می رسد اولین مقاله ای باشد که به طبقه بندی فضایی می پردازد – موضوعی که در بخش های بعدی این مقاله به آن بازمی گردیم. اگر جمعیت SSH (پارادوکس سیمپسون) باشد، مدلسازی مخدوش خواهد شد. حتی اگر SSH تشخیص داده شود، ممکن است داده‌های کافی برای ارائه تخمین‌های مناسب از پارامترها در هر لایه با استفاده از روش‌های تخمین سنتی وجود نداشته باشد – که به عنوان مشکل پراکندگی داده‌ها یا مشکل نمونه بایاس در زمانی که همه اقشار نمونه‌گیری نشده‌اند، از آن یاد می‌شود (نگاه کنید به، به عنوان مثال، منگ نقل قول۲۰۱۸; جی وانگ و همکاران نقل قول۲۰۱۸; بردلی و همکاران نقل قول۲۰۲۱). علاوه بر چالش‌های ناشی از حضور SSH، نادیده گرفتن حضور SSH به این معنی است که برخی از اطلاعات موجود در داده‌ها که می‌توانند در تجزیه و تحلیل آن داده‌ها مفید باشند، مورد سوء استفاده قرار نمی‌گیرند.

هدف این مقاله از طریق تئوری و با استناد به مطالعات قبلی، ارتقای یک چارچوب سیستماتیک برای تحلیل و مدل‌سازی آماری SSH است. این مقاله به شرح زیر سازماندهی شده است. ما ابتدا چالش های آماری اصلی را در نظر می گیریم که هنگام کار با جمعیت های SSH بوجود می آیند. سپس معادله را برای جمعیت های SSH با هدف رسیدگی به چالش شناسایی مناطق SSH معرفی می کنیم. در مرحله بعد، نمونه هایی از استنتاج آماری برای جمعیت های SSH ارائه می دهیم. سپس توجه خواننده را به تعدادی از برنامه‌های کاربردی جلب می‌کنیم که در آنها SSH به دلیل ماهیت مشکل علمی یک مسئله کلیدی برای تجزیه و تحلیل داده‌ها است. ما در اینجا در مورد رابطه بین SSH و روش های این مقاله از یک سو و مسئله واحد منطقه ای قابل اصلاح (MAUP) از سوی دیگر نظر می دهیم. ما برخی از نتیجه‌گیری‌ها و دستورالعمل‌های نهایی را برای نتیجه‌گیری کار آینده می‌گیریم.

چالش های آماری هنگام کار با جمعیت های ناهمگن طبقه بندی شده فضایی

در این بخش، مشکلات آماری را نشان می‌دهیم که اگر SSH در فرآیند تجزیه و تحلیل آماری شناسایی نشود، ممکن است ایجاد شود.

نمونه های غیرنماینده و برآوردهای کیفیت ضعیف

یک نمونه غیر نماینده به این معنی که هیستوگرام نمونه به طور قابل توجهی با جمعیتی که از آن جمع آوری شده است متفاوت است. در این مورد، مقدار مورد انتظار میانگین نمونه با میانگین جامعه یکسان نخواهد بود. یعنی میانگین نمونه یک برآوردگر مغرضانه میانگین جامعه خواهد بود. اگر جامعه SSH باشد و حجم نمونه کوچک با تعداد کم یا بدون نقاط نمونه در برخی از اقشار باشد، این امر مشکل سوگیری برآوردگر را تشدید خواهد کرد. اگر نقاط نمونه کمی در یک لایه وجود داشته باشد، تخمین های بزرگی از واریانس های خطا ظاهر می شود.

یک مشکل نمونه گیری مغرضانه معروف را نشان می دهد: توزیع مناطق آب و هوایی در چین و توزیع ایستگاه های هواشناسی در چین در سال ۱۹۰۰٫ ناکافی بودن شبکه اولیه ایستگاه ها برای تجزیه و تحلیل آماری کل کشور آشکار است. اطلاعات تکمیلی، در صورت وجود، می‌تواند برای کاهش اثرات هر گونه سوگیری نمونه درون لایه‌ای مورد استفاده قرار گیرد (هکمن نقل قول۱۹۷۹; جی وانگ و همکاران نقل قول۲۰۱۸). اگر جمعیتی از نظر مکانی همگن باشد، با افزایش حجم نمونه مربوط به سطح معینی از همبستگی مکانی، میانگین مربعات خطا (MSE) برآوردگر کاهش می یابد (RodrÃguez-Iturbe and Mejaa). نقل قول۱۹۷۴; اوکانل و همکاران نقل قول۱۹۷۹).

شکل ۱٫ مناطق آب و هوایی در چین (ناهمگونی طبقه بندی شده فضایی [SSH] جمعیت) و ایستگاه های هواشناسی (نمونه) در سال ۱۹۰۰٫

روابط آشفته

وجود SSH استنباط‌های مبتنی بر آمارهای جهانی را تضعیف می‌کند که هر گونه ناهمگنی طبقه‌بندی شده در جمعیت را نادیده می‌گیرد (لیندلی و نویک). نقل قول۱۹۸۱; هوکس نقل قول۲۰۱۰، ۳). به عنوان مثال، L. Xu et al. (نقل قول۲۰۱۱) از رکوردهای طاعون بوبونیک و سوابق آب و هوایی برای دوره ۱۸۵۰ تا ۱۹۶۴ استفاده کرد تا نشان دهد که شدت طاعون در چین تا زمانی که داده ها به نیمه شمالی و جنوبی کشور تقسیم نشده است، هیچ مدرک واضحی از ارتباط با سطح رطوبت ارائه نمی دهد. نموداری را بر اساس یک مجموعه داده برای کل کشور نشان می دهد، در حالی که داده ها را به شمال چین و چین جنوبی تقسیم کنید. L. Xu et al. (نقل قول۲۰۱۱) دریافتند که جوامع جوندگان ناقل طاعون به سطوح بالاتر بارندگی در شمال چین خشک در مقایسه با جنوب چین مرطوب واکنش متفاوتی نشان می دهند.

شکل ۲٫ رابطه بین شدت طاعون و سطح رطوبت (الف) تمام چین؛ (ب) فقط شمال چین؛ (ج) فقط جنوب چین. منحنی های جامد انجمن های مدل افزایشی تعمیم یافته هستند. روند خطی آنها با خطوط قرمز نقطه چین نشان داده می شود. شدت طاعون به تعداد موارد طاعون (N) در سال اشاره دارد. منبع: با اجازه L. Xu et al. (نقل قول۲۰۱۱).

به طور مشابه، اگر جمعیت SSH بود، آنگاه هر مدل جهانی مبتنی بر ادغام مجموعه‌های داده، خطاهایی را در پیش‌بینی کل منطقه یا چند زیرحوزه ایجاد می‌کند بدون اینکه کاربر لزوماً بداند کدام زیرمجموعه هستند. در شماره ویژه ای از مجله منابع آب کاناداباتل و همکاران، بررسی اجمالی فرآیندهایی که باعث ایجاد سیل در کانادا می شوند. (نقل قول۲۰۱۶) گزارش کرد که یک مدل جهانی نمی تواند پیش بینی دقیق سیل را برای کل و مناطق مختلف کانادا که تحت رژیم های آب و هوایی مختلف قرار دارند ارائه دهد. فرآیندهای مختلف تولید سیل شامل سیل ناشی از ذوب برف، باران بر برف، و بارندگی و همچنین فرآیندهای سیلاب‌های زیرزمینی و سیل ناشی از موج‌های طوفان، تجمع یخ و سیل شهری است.

دو چالش اصلی سوگیری و سردرگمی در آمارهای فضایی که قبلاً ذکر شد را نمی‌توان به‌طور خودکار با داده‌های بزرگ و هوش مصنوعی حل کرد و در واقع می‌توان آن‌ها را به دلیل «پارادوکس کلان داده» بدتر کرد. نقل قول۲۰۱۸; لی و همکاران نقل قول۲۰۲۳). در واقع، اگر SSH قبل از مدل‌سازی شناسایی شده بود، می‌توان آن‌ها را ساده‌تر حل کرد. این اجازه می دهد تا آمار به صورت جداگانه در طبقات محاسبه شود تا از مخدوش نشدن یا با استفاده از Heckman (هکمن) جلوگیری شود. نقل قول۱۹۷۹) یا B-SHADE (JF Wang, Hu, et al. نقل قول۲۰۱۳; سی خو و همکاران. نقل قول۲۰۲۲) مواد و روش ها. اگر یک نظرسنجی ملی بزرگ انجام شود اما SSH در نظر گرفته نشود، اگر روابط در لایه‌ها یکنواخت باشد، می‌توان مشکلات فوق را با مدل‌های سلسله مراتبی بیزی (BHMs) بررسی کرد، که به روش «اطلاعات وام‌گیری» اجازه می‌دهد که قبلاً اشاره شد (نگاه کنید به). ریپلی نقل قول۱۹۸۱، ۱۹-۲۷; دان و هریسون نقل قول۱۹۹۳; هاینینگ و لی نقل قول۲۰۲۰، فصل ۷ و ۸).

معادله ناهمگنی طبقه بندی شده فضایی

در این بخش، ما SSH () که سپس به شکل معادله نشان داده می شود. این امر بررسی آماری را که تابعی از (L، پ)، جایی که L نشان دهنده تعداد اقشار و پ شکل پارتیشن به طبقات را نشان می دهد.

شکل ۳٫ نقشه های گویا که مقادیر متفاوتی از ناهمگنی طبقه بندی شده فضایی (به متن را ببینید) همراه با مقادیر متناظر q-آمار *p < 0.05. **پâ€‰<â€‰0.01.

طیف وسیعی از نقشه ها را نشان می دهد که مقادیر داده ها را با درجات مختلف ساختارهای فضایی نشان می دهد. نقشه ای را نشان می دهد که هیچ شواهدی از طبقه بندی را نشان نمی دهد. نقشه‌ای را با درجات کوچکی از ساختارهای فضایی (برخی خودهمبستگی فضایی بین مقادیر همسایه) نشان می‌دهد، اما هنوز هیچ شواهدی از هرگونه طبقه‌بندی نشان نمی‌دهد. نقشه ای را با دو لایه کاملاً مشخص نشان می دهد که همگنی قوی را در هر یک از لایه ها نشان می دهد (تغییرات درون لایه ای کم یا بدون تغییر). یک نقشه “ناهمگن طبقه بندی شده ناقص” را به تصویر می کشد که در آن مقادیر داده ها به خوبی در فضا با برخی تغییرات درون لایه و خطوط مرزی (به رنگ قرمز) بین سه لایه ساختار یافته اند. اینها تا حدودی مبهم هستند – به نظر می رسد سه رژیم فضایی باشند، اگرچه موقعیت خطوط مرزی می تواند مورد بحث باشد. در عمل، محتمل ترین سناریو را نشان می دهد. پیوست به هر نقشه در یک مقدار تصوری از آن چیزی است که به آن می گویند q-statistic که اندازه گیری مناسبی از SSH را ارائه می دهد. ما در این مورد بحث می کنیم q-آمار بعدی

معادله ای برای جمعیت SSH

یک جمعیت SSH (فوق العاده) از طبقات (ساعتâ€‰=â€‰۱، â€¦، L). ما فرض نمی کنیم که طبقه بندی شناخته شده است، به این معنی که این یک مشکل رگرسیونی نیست. بنابراین، ما همچنین نیاز به تخمین طبقه بندی در روش خود داریم. برای یک طبقه بندی معین، معادله SSH را می توان به صورت زیر بیان کرد:
(۱) $y = ایکس Î² + ه ، ه ¼ ن (۰ ، {Ïƒ}^{۲} من)$ (۱)

جایی که y = (y₁, , y_L)^تی و y_ساعت = (y_ساعت_۱, , $y_{ساعت ن_{ساعت}}$ )^تی. ایکس = دیاگ(۱_ن_۱، , ۱_NL) 1_Nh هست Nh-بردار ستون بعدی با تمام اجزای آن برابر با ۱، Î² = (م_۱، â€¦ م_L)^تی، و ه = (ه_۱, , ه_L)^تی با ه_ساعت = (ه_ساعت_۱, , $ه_{ساعت ن_{ساعت}}$ )^تی. ایکس داده ها را به پارتیشن بندی می کند L اقشار در کدام قشر ساعت اندازه است ن_ساعت و یک بردار عنصر y_ساعت و یک میانگین ‎_ساعت. اگر از رویکرد رگرسیون خطی استفاده شود (گجراتی و پورتر نقل قول۲۰۰۹، ۳۷)، سپس ایکس قابل تغییر نیست و به روز می شود. با این حال، در معادله SSH، اضافه کردن یا تغییر یک لایه نشان داده شده با ایکس مستلزم تغییر تعاریف برخی از اقشار است ایکس. ما داریم:
(۲a) $SST = SSB + SSW$ (2a)
(۲b) $SST = y^{تی} (من آ' ب) y$ (2b)
(۲c) $SSB = y^{تی} (آ آ' ب) y$ (2c)
(۲d) $SSW = y^{تی} (من آ' آ) y$ (2d)

جایی که Aâ€‰=â€‰X(ایکس^تیایکس)^âˆ'۱ایکس ^تی، بâ€‰=â€‰۱(۱^تی۱)^âˆ'۱۱^تی، و ۱ هست ن-بردار بعدی با تمام اجزاء برابر با ۱٫ داده شده است ایکس، SST، SSB، و SSW به ترتیب مجموع مجذورهای کل، مجموع مربعات بین طبقات و مجموع مربعات درون طبقات را نشان می دهد. توجه داشته باشید که آ â € ب یک ماتریس طرح ریزی متعامد است و tr(من â € آ) = ن â € L. معادلهمعادلات ۲b(2b) $SST = y^{تی} (من آ' ب) y$ (2b) ، معادله۲c(2c) $SSB = y^{تی} (آ آ' ب) y$ (2c) ، و معادله۲d(2d) $SSW = y^{تی} (من آ' آ) y$ (2d) فقط بر اساس یک طبقه بندی مشخص می توان استخراج کرد. برای شناسایی طبقه بندی واقعی، باید آنها را با هم ترکیب کنیم. این به ما انگیزه می دهد تا یک تابع برای SSH پیشنهاد کنیم.

یک تابع برای SSH

اندازه گیری SSH (JF Wang، Zhang و Fu نقل قول۲۰۱۶) را می توان تعمیم داد و به عنوان تابعی از L و پ بر اساس فرم ماتریس:
(۳) $q (L ، پ) = ۱ â € \frac{y^{تی} (من آ' آ) y}{y^{تی} (من آ' ب) y}$ (3)

ما در اینجا به صراحت بیان می کنیم که q-آمار تابعی از تعداد اقشار است (L) و شکل پارتیشن خاص (پ) زیرا پارتیشن های زیادی وجود دارد که می توانند تولید کنند L اقشار. یک طبقه بندی بهینه را می توان با تعریف کرد
(۴) $O (L ، پ) = {argmax}_{(L ، پ)} {q (L ، پ)}$ (۴)

یک تفاوت اساسی دیگر بین آر^۲ برای رگرسیون خطی یا ضریب همبستگی بین طبقاتی (ICC) و ما q-تابع داده شده توسط معادلهمعادله ۳(۳) $q (L ، پ) = ۱ â € \frac{y^{تی} (من آ' آ) y}{y^{تی} (من آ' ب) y}$ (3) آن است آر^۲ یا ICC فرض می کند که پارتیشن داده شده است، اما در اینجا ما این فرض را نمی کنیم. نتیجه می شود که q-statistic یک غیر مرکزی دارد اف توزیع داده شده است ایکس (جی اف وانگ، ژانگ و فو نقل قول۲۰۱۶، در حالی که ICC از استاندارد مرکزی پیروی می کند اف توزیع (Snijders و Bosker نقل قول۲۰۱۱، ۴۶). را q تابع برای شناسایی SSH و برای تعیین اسناد برای SSH بدون نیاز به هیچ گونه فرض خطی استفاده می شود. این نیز با آر^۲ و ICC برای مدل سازی چند سطحی. که در ، ما را نشان می دهیم q-تابع. برای تاکید ما آن قشر را نشان دادیم ساعتâ€‰=â€‰۱ در دو منطقه جغرافیایی مجزا ظاهر می شود. برچسب لایه به خوشه بندی آن (مثلاً نوع کاربری زمین) اشاره دارد، نه موقعیت مکانی آن. طبقه بندی یک متغیر Y قابل پارتیشن بندی یا توسط Y خود یا توسط یک متغیر توضیحی مشکوک ایکس (بعداً بحث خواهد شد)، بسته به هدف مطالعه. این نتیجه برای سایر اشکال طبقه بندی مانند زمانی که مقادیر داده ها موقتی هستند، صادق است.

شکل ۴٫ به تصویر کشیدن q-تابع. ن و Ïƒ^۲ به ترتیب تعداد واحدها و واریانس یک منطقه هستند. زیرنویس ساعتâ€‰=â€‰۱، â€¦، L، هست ساعت-لایه SSH از یک جمعیت Y توسط خود هر دو پارتیشن بندی می شود Y یا متغیر توضیحی آن ایکس.

را qتابع، برای هر داده شده است L و پ، یک مقدار در بازه می گیرد [۰, ۱]، جایی که ۰ نشان دهنده عدم تجانس طبقه بندی شده است. این نشان می دهد که هر یک از L طبقات دارای همان درجه ناهمگنی (داخلی) هستند که در کل نقشه یافت می شود (). یک ارزش از qتابع برابر با ۱ نشان‌دهنده همگنی کامل درون لایه‌ای است (همه مقادیر داده‌ها در یک لایه یکسان هستند)، که به این معنی است که ناهمگونی مشاهده شده در کل نقشه به دلیل تفاوت‌های بین L لایه ها برای پارتیشن داده شده ().

ارزیابی طبقه بندی های مختلف

شناسایی مناطق در قلب جغرافیای منطقه‌ای سنتی و همچنین روش تحلیل داده‌های معاصر مربوط به تعیین مرزها قرار دارد (به عنوان مثال، وومبلینگ؛ به Womble مراجعه کنید. نقل قول۱۹۵۱و اشکال مختلف خوشه بندی منطقه ای یا “منطقه سازی” (Longley et al. نقل قول۲۰۰۵، ۱۳۵; دوتیل نقل قول۲۰۱۱، ۲۰ تا ۲۱). از آنجایی که طبقه بندی ناشناخته است، ما می خواهیم یک استراتژی طبقه بندی برای ارائه حداقل مقدار تغییرات درون گروهی به طور همزمان با حداکثر مقدار تغییرات بین گروهی پیدا کنیم. مرز بین لایه ها ممکن است از قبل وجود داشته باشد، مانند نقشه های زمین شناسی و مناطق آب و هوایی، اگرچه می توان آنها را مجددا ارزیابی و با ابزارهای جدید تجدید نظر کرد. یا می‌تواند از طریق جستجو با استفاده از الگوریتم‌های بهینه تعیین شود، یا طبق تنظیمات ArcGIS بر اساس فواصل مساوی تقسیم شود. انتخاب از بین رویکردها بر اساس زمینه مطالعه است. در مورد طبقه بندی کننده های فضایی (Haining نقل قول۲۰۰۳، ۲۰۱-۰۶)، تابع هدف در این روش ها معمولاً با ترکیب یک تابع همگن برای واریانس های درون گروهی و یک تابع فشردگی فضایی برای مکان های مختصات آنها ساخته می شود. را q-function را می توان به عنوان اولین این توابع در نظر گرفت. مزیت از q– آمار، همانطور که خواهیم دید، این است که می توان توزیع تهی را با یک توزیع استاندارد و شناخته شده متصل کرد، به طوری که بتوانیم به راحتی آن را استخراج کنیم. پ ارزش.

را q– آمار را می توان برای ارزیابی تجربی طبقه بندی های مختلف استفاده کرد (متفاوت L یا تغییر پارتیشن برای همان مقدار L) برای اینکه ببینید کدام یک بیشترین مقدار آمار را به دست می دهد. گرفتن موردی که در آن L ثابت است (ما در مورد تعداد لایه ها اطمینان داریم) و می خواهیم دو پارتیشن را با هم مقایسه کنیم P1 و P2 که بازده L لایه ها را محاسبه می کنیم:
(۵) $س (پ ۱ ، پ ۲) = q (L; پ ۱) â € q (L; پ ۲) .$ (۵)

اگر $س$ (P1، P2) > 0 (< 0) سپس P1 (P2) یک پارتیشن درون لایه ای همگن تر از P2 (P1). زیرا $س$ (P1، P2) = $\frac{SSB 1 آ' SSB 2}{SST}$ = $\frac{D (پ ۱ ، پ ۲)}{SST} ،$ اهمیت آماری تفاوت بین دو پارتیشن را می توان توسط D(P1، P2). اگر P1 طبقه بندی واقعی است، پس می توان نشان داد که:
(۶) $D (پ ۱ ، پ ۲) ¼^{تقریبی} ن (E (D) ، V (D))$ (6)

با
(۷) $E (D) = {Ïƒ}^{۲} tr (آ ۱ â € آ ۲) + {Î²}^{تی} {ایکس}_{۱}^{تی} (آ ۱ â € آ ۲) {ایکس}_{۱} Î²$ (۷)
(۸) $V (D) = 2 تریلیون {(آ ۱ â € آ ۲)}^{۲} + ۴ {Î²}^{تی} {ایکس}_{۱}^{تی} {(آ ۱ â € آ ۲)}^{۲} {ایکس}_{۱} Î²$ (۸)

جایی که E و V به ترتیب انتظارات و واریانس را نشان می دهند. آ۱ و آ۲ هستند آ برای P1 و P2، به ترتیب؛ و ایکس_۱ است ایکس برای یکی از پارتیشن ها P1، گفتن. اگرچه ممکن است پارتیشن های زیادی تولید شوند L طبقات، در عمل تعداد پارتیشن هایی که مقایسه را توجیه می کنند باید از نظر تعداد بسیار کمتر باشد.

عناصر فردی از q(L; پ)، SSW_ساعت، که مجموع مربع های درون لایه است ساعت و است L اصطلاحات در صورت کننده جمله دوم در تعریف q(L; پ) که در معادلهمعادله ۳(۳) $q (L ، پ) = ۱ â € \frac{y^{تی} (من آ' آ) y}{y^{تی} (من آ' ب) y}$ (3) را می توان مقایسه کرد تا ببینیم کدام یک از این اقشار بیشترین ناهمگونی (intrastratum) را نشان می دهند. اقشاری که بیشترین سهم را در شمارشگر دارند ممکن است کاندیدای پارتیشن بندی بیشتر باشند – یعنی افزایش L. با این حال، مقایسه پارتیشن‌هایی که شامل تعداد لایه‌های مختلف است، مشکل دیگری را ایجاد می‌کند. یعنی نیاز به گنجاندن جریمه برای جلوگیری از طبقه بندی بیش از حد. این آرگومان مشابه چیزی است که هنگام انتخاب متغیرهای مستقل در یک مدل رگرسیونی مشاهده می‌شود که در آن معیار اطلاعاتی Akaike (AIC) برای مقایسه مدل‌های مختلف استفاده می‌شود که امکان تفاوت در پیچیدگی مدل را فراهم می‌کند. یک مدل، A، با متغیرهای مستقل بیشتری نسبت به مدل دیگر، B، که در آن متغیرهای مستقل در B زیرمجموعه‌ای از متغیرهای A را تشکیل می‌دهند، بهتر با داده‌ها تناسب دارند اما پیچیده‌تر هستند و این باید برای زمانی که برازش‌های مدل مقایسه می‌شوند مجاز باشد. در این مورد دو طبقه بندی با تعداد اقشار متفاوت شناسایی می شود. تخمین جریمه‌شده AIC بر اساس اطلاعات کمینه‌سازی کول‌بک – لایبلر بین دو تابع چگالی احتمال (PDF؛ Akaike نقل قول۱۹۷۴) ممکن است مستقیماً برای مقایسه دو طبقه بندی که از نظر تفاوت با هم متفاوت هستند استفاده نشود L. نشان می دهد که آمار فضایی برای تشخیص ترتیبات فضایی مختلف که دارای PDF حاشیه ای یا هیستوگرام یکسانی هستند ضروری است. در نتیجه، SSH های مختلف (اعم از پارتیشن ها یا تعداد لایه ها یا هر دو) می توانند AIC یکسانی را به اشتراک بگذارند. علاوه بر این، دادن SSH جمعیت (الگوهای متشکل از پیکسل های آبی و سفید در ، اثرات هر انتخاب مرز (خطوط قرمز در )، MAUP، توسط اندازه گیری می شوند q-آمار

شکل ۵٫ مقایسه شماتیک بین آمار کلاسیک و آمار فضایی. سه توزیع فضایی با استفاده از آمار کلاسیک (مقدار میانگین). $\overset{آ}{y}$ و واریانس Ïƒ^۲، موران های همبستگی مکانی خود را من (موران نقل قول۱۹۵۰) و ناهمگونی طبقه بندی شده فضایی q-statistic (با اقشار تقسیم شده توسط خطوط قرمز). سه جعبه ۸ پیکسلی ۸ پیکسلی که تعداد پیکسل های آبی (مقدار ۱) و سفید (مقدار ۰) یکسان را نشان می دهند (ن_w = ن_ب = ۳۲). q₁ و q₂ رجوع به q مقادیر برای جمعیت طبقه بندی شده به ترتیب توسط خط ۱ و خط ۲، q_{1 و ۲} اشاره به q ارزش برای جمعیت طبقه بندی شده توسط خطوط ۱ و ۲٫ منبع: با تجدید نظرهای JF Wang، Zhang و Fu (نقل قول۲۰۱۶).

SSH مشخصه یک جمعیت است (پس زمینه خاکستری در و و لایه زیرین ) که ابتدا توسط یک محقق یا تیمی از محققین شناسایی می شود که یک طبقه بندی بر داده ها اعمال می کنند (طبقه بندی شده با خطوط قرمز در ) و سپس توسط اندازه گیری می شود q(L، پ) آمار. بهترین طبقه بندی، طبقه بندی است که به طور دقیق SSH جمعیت را منعکس کند. در عمل، صدها الگوریتم برای کمک به یافتن بهترین طبقه بندی توسعه داده شده است. نحوه انتشار اطلاعات SSH از جمعیت SSH را نشان می دهد (q₀ آ [۰, ۱]، ۰ اگر جمعیت iid باشد و ۱ برای SSH کامل) به طبقه بندی توسط محقق (Î¨ âˆˆ [۰, ۱]، ۰ اگر SSH جمعیت به طور کامل نادیده گرفته شود و ۱ به طور کامل محاسبه شود)، که سپس با اندازه گیری می شود q. در اصل، q = Î¨q₀. موردی که qâ€‰=â€‰۱ نشان می دهد که جمعیت SSH کامل را نشان می دهد (q₀ = 1)، که همچنین به طور کامل با طبقه بندی مشخص می شود (Î¨ = ۱; طبقه بندی شده توسط خط ۱)؛ موردی که qâ€‰=â€‰۰ نشان دهنده iid بودن جمعیت است ( و ) یا اینکه جمعیت SSH طبقه بندی ضعیفی داشته است ( طبقه بندی شده توسط خط ۲). موردی که q مقدار بین ۰ و ۱ قرار دارد که نشان دهنده یک SSH بین دو حد بالا است ( طبقه بندی شده توسط خط ۱ یا خط ۲ یا هر دو).

میز ۱٫ جمعیت ناهمگونی طبقه بندی شده فضایی (SSH) و نمایش آن توسط طبقه بندی

CSV را دانلود کنید جدول نمایش

یک جمعیت ممکن است از یک منظر SSH باشد اما از منظر دیگر نه. مثلا، SSH کامل را با دو لایه خاکستری و سفید نمایش می دهد، اما SSH را از منظر یک پهنه بندی جغرافیایی تقسیم شده توسط خط قرمز (qâ€‰=â€‰۰). گاهی اوقات، تفسیرپذیری یافته‌ها مهم‌تر از حداکثر کردن است q(L، پ). به عنوان مثال، در تجزیه و تحلیل تغییرات داده های اقتصادی، استانداردهای طبقه بندی (L، پ) مانند استاندارد سازمان ملل متحد برای سطوح تولید ناخالص داخلی سرانه، ممکن است برای انطباق با یک روش از قبل موجود انتخاب شود.

استنتاج تحت ناهمگونی طبقه بندی شده فضایی

در این بخش، نمونه هایی از تجزیه و تحلیل آماری زمانی که SSH در یک مجموعه داده وجود دارد، ارائه می دهیم.

آمار در لایه های همگن

هنگامی که یک پارتیشن به طبقات همگن تحت شرایطی که مشاهدات مستقل هستند ساخته شد، می‌توان آمارهای مرسوم را برای استنتاج در مورد ویژگی‌های درون لایه‌ای به کار برد، همانطور که مثال قبلی نشان می‌دهد (نگاه کنید به ). از سوی دیگر، اگر مشاهدات درون لایه‌ای SAC باشند، تکنیک‌های آماری فضایی برای استنتاج درباره ویژگی‌های درون لایه‌ای مورد نیاز است. زیرا بسیاری از این آمارها به مشخصات یک ماتریس وزن (یا اتصال) بستگی دارد دبلیو (هینینگ و لی نقل قول۲۰۲۰، فصل ۴) برای روابط فضایی بین مشاهدات، این سوال مطرح می شود که چگونه می توان با مشاهدات نزدیک به مرز هر طبقه برخورد کرد. به منظور بهبود دقت آماری (مخصوصاً اگر یک قشر مشاهدات نسبتاً کمی داشته باشد)، ممکن است برخی از مشاهدات نمونه از «سمت دیگر» مرز لایه «قرض گرفتن» مناسب باشد. اگرچه این ممکن است برخی سوگیری ها را در برآوردگرهای پارامتر ایجاد کند، چنین رویکردی ممکن است توجیه شود، به ویژه در شرایطی که برخی از بخش های مرز یک لایه بیشتر شبیه مناطق انتقال هستند، حتی اگر سایر بخش های مرزی تغییر ناگهانی را نشان دهند. تلاش برای حل چنین سوالی این است که تخمین زدن ورودی های غیر صفر در دبلیو ماتریس (هینینگ و لی نقل قول۲۰۲۰، ۴٫۱۰ و ۸٫۴). کریجینگ با یک پنجره متحرک و رگرسیون وزن‌دار جغرافیایی (GWR) گزینه‌های جایگزینی برای درونیابی فضایی برای نقاطی است که جمعیت SSH است. این دو رویکرد به طور بالقوه خطر خطای بزرگی در مرزهای SSH دارند، زیرا هر دو رویکرد مبتنی بر ترسیم نمونه‌های همسایه هستند. یانگ و همکاران (نقل قول۲۰۲۲) دو حوضه آب (دو لایه) را با هم ادغام کردند تا زمانی که SSH آنها برای کاهش خطاهای درون یابی خاک (Stein، Hoogerwerf و Bouma) ناچیز است، یک منطقه همگن تشکیل دهند. نقل قول۱۹۸۸).

هنگامی که توجه به توزیع فضایی برخی از پارامترها، Haining و Li (نقل قول۲۰۲۰، فصول ۷ و ۸) تعدادی BHM با وابستگی فضایی را تشریح کردند که تخمین هایی از یک پارامتر ناهمگن را ارائه می دهند. آن‌ها کاربرد این روش‌ها را برای نمونه‌های درآمد خانوار نیوکاسل آپون تاین، انگلستان در سطح منطقه ابر خروجی متوسط (MSOA) نشان می‌دهند. MSOA یک منطقه کوچک برای گزارش داده‌های سرشماری بریتانیا است که با روش ما به عنوان یک لایه واحد در نظر گرفته می‌شود. نمونه ای از یک نظرسنجی ملی جمع آوری می شود به طوری که همه MSOA ها (قشرها) داده ندارند یا بسیاری از آنها فقط تعداد کمی مشاهدات دارند. فرض می‌شود که نمونه‌های درون هر لایه به‌طور مشروط مستقل و به طور یکسان توزیع شده‌اند، یعنی مشروط به فرآیند زیربنایی تولید داده‌ها. مجموعه ای از مقادیر پارامتر در سطح MSOA است که SAC هستند. این نرم افزار شامل مدل های خودرگرسیون مختلف برای گرفتن خودهمبستگی فضایی در توزیع فضایی پارامتر مورد علاقه (متوسط درآمد خانوار در سطح MSOA) است. مدل انتخاب شده، که در مدل قبلی BHM برای پارامتر مورد نظر مشخص شده است، منجر به اشتراک گذاری اطلاعات در سراسر MSOA ها می شود. BHM ها با استفاده از شبیه سازی مونت کارلو زنجیره مارکوف نصب شده اند. در اینجا نیز مانند سایر روش‌هایی که قبلاً توضیح داده شد، متغیرهای کمکی اضافی را می‌توان در مدل گنجاند تا دقت برآوردها را بهبود بخشد.

درونیابی فضایی با SSH

درون‌یابی منطقه‌ای اصطلاحی است که برای توصیف فرآیند انتقال داده‌ها از یک چارچوب مکانی (“منبع”) به یک چارچوب فضایی جدید (“هدف” یا “چارچوب گزارش‌دهی” استفاده می‌شود. برای مثال، به گودچایلد، آنسلین و دایچمن مراجعه کنید.نقل قول۱۹۹۳) هاینینگ (نقل قول۲۰۰۳، ۱۳۱-۳۸) و لین، زو و وانگ (نقل قول۲۰۲۳) برای یک مرور کلی. JF Wang، Haining، و همکاران. (نقل قول۲۰۱۳(). این روش تخمین هایی را برای هر منطقه هدف با برآورد واریانس خطا ارائه می دهد. ابتدا، جمعیت SSH به طبقات همگن (JF Wang، Haining و Cao) طبقه بندی می شود. نقل قول۲۰۱۰) و برآوردهای میانگین و واریانس برای هر یک از طبقات منبع به دست آمده است ({ساعت} که در ). سپس، جمعیت SSH مناطق منبع روی چارچوب منطقه هدف قرار می‌گیرد ({r} که در ). برآوردها برای مناطق هدف از مناطق منبع به نسبت میزان همپوشانی رخ می دهد. هر منطقه منبع منفرد می تواند در تخمین مناطق هدف چندگانه کمک کند. از این نظر، رویکرد ساندویچی بسته به گستره جغرافیایی و پیکربندی مناطق منبع نسبت به مناطق هدف، «قدرت» را از همه لایه‌های منبعی که با هر لایه هدف خاصی همپوشانی دارند، وام می‌گیرد. این روند قدرت استقراض ممکن است فقط به مناطق نزدیک محدود نشود. به شرطی که مقادیر نمونه در هر منطقه منبع وجود داشته باشد، روش را می توان بدون نیاز به تعلق آنها به داده های نمونه در یک واحد هدف اعمال کرد. با توجه به تعریف از q و نمونه گیری طبقه بندی شده، خطای کلی برآوردگر ساندویچ را می توان به راحتی بدست آورد: mse( $\overset{آ}{y}$ ) = (۱ â €” q) (1 â€” $\frac{n}{ن}$ ) $\frac{{Ïƒ}^{۲}}{n} ،$ جایی که n و ن مخفف تعداد واحدهای نمونه و جامعه به ترتیب و Ïƒ^۲ واریانس است. واضح است که خطا صفر است اگر qâ€‰=â€‰۱ و در خطای میانگین نمونه جمع می شود اگر qâ€‰=â€‰۰٫

شکل ۶٫ نشان دادن برآوردگر ساندویچ زمانی که جمعیت از نظر فضایی ناهمگن طبقه بندی شده است (SSH). یک جمعیت â”œ از اقشار تشکیل شده است {ساعتâ€‰=â€‰۱، .، L} و واحدهای گزارش دهی {r}. منطقه سایه دار سبز در {ساعت} لایه ای را مثال می زند ساعتâ€‰=â€‰۴٫ منشور شفاف قرمز بین {ساعت} و {r} اطلاعاتی را نشان می دهد که از {ساعت} به {r}; $\overset{آ}{y}$ و V $\overset{آ}{y}$ مخفف میانگین و واریانس صفت y، به ترتیب؛ n و ن به ترتیب مخفف تعداد واحدهای نمونه و همه واحدها در یک لایه است. اشتراک ساعت مخفف لایه ساعت، سلام مخفف the منواحد نمونه در قشر ساعت; زیرنویس rh مخفف واحدی است که از تقاطع بین دو واحد تشکیل می شود r و ساعت

تعدادی از تکنیک‌ها برای ساختن نقشه‌های توزیع فضایی برخی از SSH پیشنهاد شده‌اند ویژگی های (به عنوان مثال، دمای هوای سالانه بر اساس مناطق آب و هوایی) بر اساس یک نمونه از مشاهدات SAC. میانگین سطح با ناهمگنی (MSN)، تخمین‌گر بیماری ناحیه بیمارستان نگهبان بایاس (B-SHADE)، و تخمین‌گر ناحیه تک نقطه‌ای (SPA) کریجینگ و نمونه‌برداری طبقه‌ای را ترکیب می‌کنند تا استنتاج‌هایی را به دست آورند که بهترین بی‌طرفداری خطی (BLUE) است. MSN زمانی قابل استفاده است که همه اقشار دارای نمونه باشند (JF Wang، Christakos و Hu نقل قول۲۰۰۹; هو و وانگ نقل قول۲۰۱۱; گائو و همکاران نقل قول۲۰۱۵). اگر SSH وجود نداشته باشد برآوردگر به کریجینگ کاهش می‌یابد یا به تخمین‌گر ساندویچ (JF Wang, Haining, et al. نقل قول۲۰۱۳) اگر SAC وجود نداشته باشد. هنگامی که برخی از اقشار هیچ مشاهده ای ندارند، از B-SHADE می توان برای پیش بینی فضایی با نسبت بین یک نمونه و جامعه استفاده کرد. این نسبت را می توان با استفاده از متغیر کمکی تخمین زد. برای مثال، نسبت در سال‌های اولیه که تعداد ایستگاه‌ها کم است را می‌توان با مشاهدات ایستگاه‌های هواشناسی امروزی برای تعدیل سوگیری نمونه تخمین زد (JF Wang et al. نقل قول۲۰۱۱; هو و همکاران نقل قول۲۰۱۳; سی دی خو، وانگ و لی نقل قول۲۰۱۸). اگر همه اقشار نمونه داشته باشند، B-SHADE به MSN کاهش می یابد. هنگامی که تنها یک واحد نمونه در دسترس باشد، SPA با استفاده از یک رابطه قبلی که بین متغیر هدف (مانند PM2.5) و یک متغیر کمکی (مثلا PM10) که در همه لایه‌ها مشاهده شده است (JF) شناسایی شده است، میانگین مساحتی را تخمین می‌زند. وانگ، هو و همکاران نقل قول۲۰۱۳).

علیت فضایی

ایجاد ارتباط علت و معلولی بین متغیرها یک علاقه اصلی برای محققان علمی است (انیشتین نقل قول۱۹۵۳)، شامل هر دو علت قطعی و تصادفی (Christakos نقل قول۲۰۱۲). با علیت تصادفی فضایی استنتاج شده از ویژگی های فضایی، کریستاکوس (نقل قول۲۰۱۲) این اصطلاح را ابداع کرد علیت تصادفی برای اشاره به موردی که اگر اتفاقی در مکان A رخ دهد، آنگاه چیزی مرتبط در مکان B با احتمال خاصی اتفاق می‌افتد، جایی که B ممکن است از نظر مکانی با A منطبق باشد یا نباشد. استنتاج علیت مبتنی بر مداخله دوتایی یا عدم مداخله در آزمایش‌های طبیعی (ایمبنس و روبین نقل قول۲۰۱۵; مروارید و مکنزی نقل قول۲۰۱۸و با استفاده از داده های SAC (Gao et al. نقل قول۲۰۲۳) به ترتیب توسعه یافتند.

الگوهای فضایی ممکن است بینشی در مورد علیت ارائه دهند. برف (نقل قول۱۸۵۴) ارتباط بین مکان های مسکونی مرگ و میر افراد در اثر وبا و مکان های پمپ های خیابان براد را ترسیم کرد که مردم ساکن در این منطقه آب مورد نیاز خود را از آن تامین می کردند. وی مشاهده کرد که با افزایش فاصله از پمپ، تعداد مرگ و میر ناشی از وبا کاهش می یابد.). یک داستان جدیدتر از علیت فضایی، شناسایی بازار غذاهای دریایی به عنوان منبع احتمالی COVID-19 در شهر ووهان چین است. این امر با توجه به این که مرکز انبوه پرونده ها به جای شهروندان در یک شهر، به طور قابل توجهی به بازار نزدیکتر است، انجام شد. پشتیبانی دوم این است که نقشه هات اسپات موارد دقیقاً با موقعیت بازار مطابقت دارد. حمایت سوم این است که دایره در مرکز بازار، با شعاع مساوی با فاصله میانه بین کیس ها و بازار، بسیار کوچکتر از دایره متمرکز در بازار با شعاع مساوی با فاصله متوسط بین جمعیت انسانی تا بازار (Worobey et al. نقل قول۲۰۲۲).

شکل ۷٫ ارتباط بین (A) دو جفت نقطه (پیرسون نقل قول۱۸۹۵)، (ب) دو سری زمانی (ژانگ و همکاران. نقل قول۲۰۰۷، و (Câ€”D) دو الگوی فضایی (برف نقل قول۱۸۵۴; وانگ و همکاران نقل قول۲۰۱۰: از همبستگی (A) تا علیت (Bâ€“D). ضریب پیرسون برای هر دو (A) و (B) حدود ۰٫۷ است، اما (B) یک اطلاعات اضافی از سازگاری بین دو روند غیر یکنواخت دارد. (C) سازگاری فضایی بین تراکم موارد را نشان می دهد (y) و فاصله تا چاه (ایکس) در یک شیوع وبا در لندن در سال ۱۸۵۴٫ (D) سازگاری بین دو الگوی فضایی پیچیده را نشان می دهد که از شیوع نقایص مادرزادی عصبی تشکیل شده است.y) و زون های سنگ شناسی (ایکس)، به ترتیب. جفت با ناهمگنی طبقه بندی شده فضایی اندازه گیری می شود q-آمار

اصل ما این است که اگر ایکس علل Yسپس الگوهای فضایی آن‌ها (ناهمگونی‌های طبقه‌بندی‌شده فضایی) علاوه بر نمایش یک همبستگی قابل‌توجه پیرسون، تمایل به جفت شدن دارند. نسخه ای از تابع q(L; پ) می تواند برای بررسی جفت استفاده شود، همانطور که در اشاره شده است . که در توجه می کنیم که پارتیشن، پ، را می توان بر حسب مقادیر مشاهده شده مشخص کرد Y، که متغیری است که باید برای ناهمگنی طبقه بندی شده آزمایش شود، یا می توان آن را بر اساس یک متغیر توضیحی مشکوک مشخص کرد، مثلا ایکس. برای اینکه مشخص شود کدام متغیر برای ساخت پارتیشن استفاده می شود، می توانیم بنویسیم q(L; Px) زمانی که پارتیشن بر اساس یک متغیر است ایکس. این متغیر، ایکس، ممکن است مقوله ای باشد، مانند نوع کاربری زمین، یا کمی با ویژگی هایی که مقادیر ایکس در هر یک از ایکساقشار تعریف شده مشابه هستند اما بین اقشار فاصله دارند. فرض کنید که بتوانیم یک پارتیشن را مشخص کنیم، Px، از یک متغیر کمی ایکس. مقدار میانگین از ایکس در یک لایه واحد سطح را تعریف می کند ایکس در آن قشر و تمام مقادیر مشاهده شده از ایکس در همان قشر مشابه هستند. در صورت وجود علیت بین Y و ایکس در سراسر طبقات و سپس مقدار تابع، آن را فراخوانی کنید q(L; Px) محاسبه شده است Y تمایل به بزرگ (نزدیک به ۱) خواهد داشت. از طرفی اگر بین علیت وجود نداشته باشد Y و ایکس، ارزش q(L; Px) محاسبه شده است Y تمایل به کوچک (نزدیک به ۰) خواهد داشت. این به این دلیل است که اگر ایکس علل Y سپس، در داخل اقشار، باید انتظار داشته باشیم Y همگن بودن در اقشار ایکس. به عبارت دیگر، الگوهای فضایی آنها، که توسط طبقه بندی ها (L; Px، تمایل به جفت شدن دارند. درجه سازگاری را می توان با اندازه گیری کرد q(L; Px) از y.

مطابقت بین دو شکل جغرافیایی ممکن است نشان دهنده یک ارتباط علی باشد (Sugihara et al. نقل قول۲۰۱۲). شکل‌های گرافیکی مختلفی را نشان می‌دهد که می‌تواند حاکی از علیت فضایی باشد. یک نمودار پراکندگی خطی را نشان می دهد که ارتباط بین دو متغیر را نشان می دهد، داده هایی برای آنها در یک مکان جغرافیایی با مقادیر بزرگتر ثبت شده است. ایکس مرتبط با مقادیر بزرگتر از Y. ضریب همبستگی پیرسون ۰٫۷ است که شواهد آماری یک ارتباط را ارائه می دهد. دو نمودار سری زمانی را نشان می دهد که ۵۰۰ سال در یک مکان جغرافیایی را پوشش می دهد. ضریب همبستگی پیرسون بین دو متغیر ۰٫۷ است، اما علاوه بر این دو سری زمانی در دراز مدت یک شکل را حفظ می کنند. محاسبه همبستگی پیرسون که به تاخیرهای زمانی مختلف (تغییرهای زمانی) در دو سری زمانی اجازه می دهد می تواند زمان پاسخ را در رابطه نشان دهد. ژانگ و همکاران (نقل قول۲۰۰۷) استنباط کرد که تغییرات دمای نیمکره شمالی بر تولید کشاورزی در چین تأثیر می گذارد. برگشت ناپذیری پیکان زمانی اغلب در تعیین ماهیت هر رابطه علی مهم است (Runge et al. نقل قول۲۰۲۳). با همان خط فکری، ارتباط بین دو الگوی فضایی ساکن ()، به خصوص زمانی که اشکال پیچیده هستند، می تواند دلالت بر یک علیت تصادفی بین دو متغیر فضایی داشته باشد (، ). از آنجا که مکان (برخلاف زمان) جهت دار نیست، ماهیت هر علیت ممکن است نیاز به دانش بیرونی و مبتنی بر نظم داشته باشد، در غیر این صورت تداعی در بهترین حالت توصیفی از «اینجا و اکنون» است. به همین دلیل است که می تواند برای تجزیه و تحلیل فضا-زمان و نه صرفاً داده های مکانی بسیار ارزشمند است.

تعامل عمومی بین متغیرها

از آنجایی که متغیرهای توضیحی بیشتری در هر تحلیلی وارد می شوند، باید به نحوه تعامل متغیرها برای تأثیرگذاری بر نتیجه توجه شود.Y). در مورد دو متغیر توضیحی، ایکس۱ و ایکس۲، ما می توانیم نقشه هایی بسازیم که تعامل اساسی بین آنها را منعکس می کند (ایکس۱ âˆ© ایکس۲) همانطور که در نشان داده شده است . تعاملات شامل، اما نه محدود به، ارتباط تعامل محصول مورد مطالعه در اقتصاد سنجی است (گجراتی و پورتر نقل قول۲۰۰۹، ۲۶۳، ۲۸۷، ۴۷۰). علاوه بر این، با مقایسه مقادیر q(ایکس۱) q(ایکس۲) و q(ایکس۱âˆ©ایکس۲) می توان شروع به بررسی چگونگی تعامل بین کرد ایکس۱ و ایکس۲ ممکن است با تغییرات خطی یا غیرخطی در سطح مرتبط باشد Y. لو و همکاران (نقل قول۲۰۱۶) تعامل بین عوامل تعیین کننده تکه تکه شدن چشم انداز در ایالات متحده را بررسی کرد. B. Xu et al. (نقل قول۲۰۲۱) تعامل کلی بین شاخص های هواشناسی و شیوع ویروس های تنفسی در چین را بررسی کرد.

شکل ۸٫ تعامل کلی بین متغیرهای توضیحی X1 و X2 تاثیر بر متغیر پاسخ Y: q(Y|X1 $âˆ©$ X2).

خوبی فضایی تناسب

یین و همکاران (نقل قول۲۰۱۹) یک شاخص جدید به نام حداکثر دمای مکرر (MFT) برای توضیح دمای حداقل مرگ و میر (MMT) در سطح جهانی ایجاد کرد. ضریب پیرسون بین MMT و MFT بسیار بزرگتر از ضریب بین MMT و دو شاخص رایج دیگر است.). علاوه بر این، q مقادیر با این پیشنهاد محاسبه می شوند که MFT از نظر مکانی بهتر از متغیرهای باقی مانده در نظر گرفته شده با MMT مطابقت دارد. هر دو آمار استفاده از MFT را برای توضیح MMT توصیه می کنند.

جدول ۲٫ شاخص های آماری بین سه شاخص دما و دمای حداقل مرگ و میر (Yin et al. نقل قول۲۰۱۹)

CSV را دانلود کنید جدول نمایش

ژئودیتکتور q +

q به راحتی با روش های دیگر ادغام می شود تا ظرفیت های آنها افزایش یابد. نمونه ها هستند q + کریجینگ برای تهیه نقشه آلودگی خاک (یانگ و همکاران نقل قول۲۰۲۲) q + GWR برای بررسی خشکسالی (Ji et al. نقل قول۲۰۲۲) q + InSAR برای شناسایی تغییر شکل زمین (چن و همکاران. نقل قول۲۰۲۲) q + موتور Google Earth برای مطالعه تغییرات کاربری زمین (Liu et al. نقل قول۲۰۲۱) q + SWAT برای ارزیابی عملکردهای حفاظت از آب (یو، وانگ و لیو نقل قول۲۰۲۰) q + BHM برای مدل سازی نقطه مورد علاقه نشاط شهری (Z. Wang et al. نقل قول۲۰۲۲) و q + یادگیری عمیق نقشه برداری تاج درخت (Guo et al. نقل قول۲۰۲۳). برای مثال های بیشتر لطفا به ادامه مطلب مراجعه کنید www.geodetector.cn.

طرح SSH

اگر ایکس یک متغیر کمی است، سپس یک نمودار دو متغیره از میانگین ایکس در برابر ابزار مربوطه از Y بر اساس طبقات، شکل هر ارتباطی را نشان می دهد که نیازی به خطی نیست. توجه داشته باشید که برای دو مقدار از q(L; Px) با یک محاسبه شده در Y و دیگری در ایکس اما با Px برای هر دو مورد، یک فرمت مورد نیاز است تا مشخص شود کدام یک از این دو متغیر در لایه ها همگن تر است. اجزای تشکیل دهنده را تجزیه می کند q– زمانی که هدف مقایسه دو متغیر است (ایکس و Y). ما فرض می کنیم که طبقه بندی نقشه بر اساس تغییرات مکانی در متغیر به دست آمده است ایکس (نه Y). هر دایره در نمودار پراکندگی به یک واحد اشاره دارد ایکس– قشر تعریف شده مرکز هر دایره در نمودار پراکندگی با مقادیر میانگین تعریف می شود Y و ایکس به ترتیب در آن قشر. اندازه هر دایره متناسب با اندازه لایه (از نظر اندازه جمعیت یا وسعت منطقه) است تا وزن بصری را به اقشار بزرگتر بدهد. با این حال، سایه هر دایره (برای لایه ساعت) بر اساس q_ساعت = ۱ â€” [Ï_h²/Ï^۲] بر روی متغیر محاسبه می شود Y. هرچه سایه تیره تر باشد، واریانس درون لایه کوچکتر است Y (واریانس درون لایه روی ایکس از نظر ساخت کوچک است) است. ما می توانیم این طرح را بیشتر اصلاح کنیم. اگر هر قشر ساعت شامل چندین منطقه جغرافیایی گسسته است (نگاه کنید به ، سپس دایره های متعدد برای لایه ساعت را می توان با یکی برای هر ناحیه گسسته تفکیک کرد. این ممکن است نشان دهد که مناطق بزرگ و به طور گسترده از نظر جغرافیایی پراکنده هستند. اگر هر ناحیه جغرافیایی گسسته بسیار کوچک باشد، ممکن است انجام این کار نامطلوب باشد، در نتیجه مشکل عدد کوچک را به وجود می آورد (به عنوان مثال، هاینینگ و لی را ببینید. نقل قول۲۰۲۰، ۸۱).

شکل ۹٫ q-تابع پراکندگی. فلش ها در جهت افزایش مقادیر هستند. هر دایره به یک واحد اشاره دارد ایکس-قشر تعریف شده اندازه هر دایره متناسب با اندازه لایه است. سایه هر دایره بر اساس q_ساعت = ۱ – Ïƒ_ساعت^۲/Ïƒ^۲ محاسبه شده در Yو هر چه سایه تیره تر باشد واریانس کمتر است q_ساعت. نمودار پراکندگی، به طور توصیفی، یک رابطه ضعیف و معکوس را بین ایکس و Y در مقیاس هفت طبقه کل با اندازه های مختلف. ممکن است موردی برای تفکیک دایره بزرگ، سوم از سمت راست، وجود داشته باشد، اگر شامل چندین منطقه جغرافیایی گسسته باشد. همین نظر ممکن است در مورد دو دایره بزرگتر دیگر نیز صدق کند – اول از سمت راست و سوم از سمت چپ.

مطالعات تجربی

در این بخش، دو مطالعه تجربی در اپیدمیولوژی جغرافیایی (یا فضایی) را مرور می‌کنیم که حضور SSH مسائل روش‌شناختی را مطرح می‌کند.

به دست آوردن نقشه ای از بروز سرطان سینه با استفاده از داده های نمونه: مقایسه ساندویچ و کریجینگ (مرکز ملی سرطان چین) نقل قول۲۰۱۹)

میزان مرگ و میر ناشی از سرطان سینه در بیش از ۲۷۰۰ شهرستان چین در سال ۱۹۹۲ از مرکز کنترل بیماری های چین (CDC) جمع آوری شد. ). موران من تست همبستگی مکانی (با استفاده از چهار نزدیکترین شهرستان به عنوان همسایه هنگام تعیین دبلیو ماتریس) مقدار ۰٫۱۹۵ (پâ€‰=â€‰۰٫۰۰۱). محاسبه کردیم q برای هشت پارتیشن مختلف (Lâ€‰=â€‰۳، ۴، â€¦، ۱۰ طبقه) از داده های مرگ و میر سرطان سینه و تقسیم بندی بر اساس انتخاب مقدار زیادی از q ضمن محدود کردن تعداد پارتیشن ها (L). ما طبقه بندی را انتخاب کردیم (Lâ€‰=â€‰۵)، که منجر به اولین مقدار قابل توجه از q در سطح ۱ درصد (qâ€‰=â€‰۰٫۶۳۸۱ با پâ€‰<â€‰0.01) در حالی که برای افزایش مقادیر L (دیدن ). همانطور که ما از Lâ€‰=â€‰۴ به Lâ€‰=â€‰۵، q 0.074 (از ۰٫۵۶۴ به ۰٫۶۳۸) و از پ مقدار ۰٫۰۲۹ (در سطح ۱ درصد معنی دار نیست) به a پ-مقدار ۰٫۰۰۷ (در سطح ۱ درصد قابل توجه است). در سطح بعدی طبقه بندی از Lâ€‰=â€‰۵ تا Lâ€‰=â€‰۶، بهبود در L (که طبق تعریف باید اتفاق بیفتد) کمتر از زمانی است که هنگام حرکت از چهار به پنج طبقه (۰٫۰۶۱ در مقایسه با ۰٫۰۷۴) اتفاق افتاده است، که نشان دهنده کاهش اندازه بهبود نسبت به بهبود هنگام حرکت از Lâ€‰=â€‰۴ به Lâ€‰=â€‰۵٫ ما هنگام تلاش برای دستیابی به اهمیت آماری به طور ضمنی از معیار سادگی استفاده می کنیم. q با کوچکتر L، مشکلی که بعداً دوباره در مورد آن صحبت خواهیم کرد. این دو آمار (Moranâ€™s من و q-function) نشان می دهد که داده های مرگ و میر سرطان پستان هم همبستگی فضایی و هم SSH را در پشتیبانی شهرستان نشان می دهد.

شکل ۱۰٫ درون یابی (A) داده های نمونه مرگ و میر سرطان پستان با استفاده از (B) کریجینگ مبتنی بر همبستگی فضایی و (C) روش های ساندویچی مبتنی بر ناهمگنی طبقه بندی شده فضایی.

جدول ۳٫ q– تابع محاسبه شده برای نرخ مرگ و میر سرطان سینه در چین در سال ۱۹۹۲

CSV را دانلود کنید جدول نمایش

روش ساندویچ مبتنی بر SSH از داده های مرگ و میر شصت و چهار شهرستان نمونه استفاده کرد (نگاه کنید به ) برای ایجاد یک نقشه در سطح شهرستان از مرگ و میر سرطان پستان برای تمام شهرستان های چین در سال ۱۹۹۲ (). نتایج به دست آمده با این روش و توسط کریجینگ () با میزان مرگ و میر شناخته شده از پایگاه داده CDC مقایسه شد. اعتبار سنجی یکباره آر^۲ به دست آمده از نقشه ساندویچ ۰٫۷۰۵ است، در حالی که برای Kriging این مقدار ۰٫۵۳۲ است. در این مورد و در نتیجه توسط آر^۲ معیار، نقشه برداری ساندویچی بهتر از Kriging عمل می کند. مکانیسم پشت یافته‌های آماری می‌تواند این باشد که سرطان پستان (جمعیت) SSH بیشتری نسبت به SAC نشان می‌دهد، که شاید از نظر اپیدمیولوژیک نشان دهنده SSH بین مناطق شهری و روستایی باشد. بنابراین، یک برآوردگر مبتنی بر SSH از نظر تئوری مناسب‌تر از یک برآوردگر مبتنی بر SAC در این مورد است. جدای از بسیاری از واحدهای گزارش دهی متفاوتی که می‌توانستند از نمونه اصلی ارائه شوند، روش ساندویچ دارای شایستگی خاصی است که مفروضات مدل‌سازی ساده را همراه با استفاده کامل از داده‌های نمونه از طریق طبقه‌بندی به جای استفاده از مقادیر داده‌های نزدیکترین همسایه به عنوان مثال، دارد. در مورد کریجینگ شواهد این مثال نشان می دهد که روش ساندویچ عملکرد خوبی دارد. هنگامی که متغیر SSH را نشان می دهد، از Kriging بهتر عمل می کند. به وضوح نیاز به کار بیشتری برای تعیین اینکه آیا این ویژگی به طور کلی تر است یا خیر، به ویژه در مواردی که روش های کریجینگ، توسعه یافته برای سطوح ناهمگن، اجرا شده است، نیاز دارد.

انتساب فضایی نقایص لوله عصبی در شهرستان هشون

ما یافته‌های خود از یک پروژه آزمایشی را خلاصه می‌کنیم که عوامل مرتبط با توزیع جغرافیایی موارد نقص لوله عصبی (NTDs) را در شهرستان هشون، استان شانشی بررسی می‌کند (JF Wang، Li، و همکاران). نقل قول۲۰۱۰). این منطقه با یکی از بالاترین نرخ های بروز NTD در چین است. عوامل (ایکس) تصور می شود که مسئول تغییر در بروز NTD است (Y) شامل محیط فیزیکی، آلودگی های انسان ساز و تغذیه است. عوامل (ایکس) هم در سطح اسمی و هم در سطح کمی اندازه گیری می شوند و SSH را نشان می دهند (نگاه کنید به ). را q-تابع (برای بررسی ارتباط فضایی بین بروز NTD و عوامل مشکوک استفاده شد (ایکس). روش بررسی ارتباط بین الف Y و هر خاص ایکس به شرح زیر است. اول، نقشه برای انتخاب شده است ایکس طبقه بندی شده است Px. دوم، نقشه برای y روی نقشه طبقه بندی شده پوشانده شده است Px از برگزیده ایکس. در نهایت، داده ها در y برای محاسبه استفاده می شود q(L، Px). نرم افزار برای محاسبه q در دسترس است www.geodetector.cn.

شکل ۱۱٫ (الف) داده‌های نمونه بروز نقص لوله عصبی (NTD)Y) و عوامل مشکوک (ایکس) (ب) حوزه آبخیز، (ج) نوع خاک، و (د) سطح ارتفاع. منبع: برگرفته از JF Wang, Li, et al. (نقل قول۲۰۱۰).

ارائه می کند qپراکندگی تابعی بین بروز NTD (Y) و ارتفاع (ایکس)، نماینده یکی از عوامل مشکوک. Scatterplot اطلاعات SSH داده ها را به تصویر می کشد. به عنوان مثال، میزان بروز NTD در ارتفاع ۱۳۰۰ € ‰m زیاد است (۶٫۹ درصد) اما همانطور که با رنگ سفید دایره نشان داده می شود بسیار متغیر است. علاوه بر این، سطح لایه ای که این داده ها به آن اشاره می کنند کوچک است (همانطور که با اندازه دایره نشان داده می شود). چهار دایره تاریک در نمودار نشان دهنده ارتفاعات است که در آن بروز NTD بسیار متغیر نیست اما هیچ مدرکی دال بر یک رابطه خطی ساده بین بروز NTD و ارتفاع وجود ندارد.

شکل ۱۲٫ qپراکندگی عملکرد بین بروز نقص لوله عصبی (Y) و ارتفاع (ایکس).

ارائه می کند q-عملکرد بین بروز NTD (Y) و سه مورد از عوامل مشکوک تعیین کننده (Xs). این مطالعه نشان داد که برخی از عوامل محیطی (نوع حوضه و ارتفاع، اما نه نوع خاک) به طور قابل توجهی با تنوع در وقوع NTD در منطقه مرتبط است. معمولاً کیفیت آب و محیط شیمیایی زمین شناسی در داخل حوضه های آبخیز بیشتر از بین حوزه ها مشابه است. عوامل غیر محیطی (در اینجا گزارش نشده است) در درجه دوم اهمیت قرار داشتند. این یافته‌ها برای شناسایی این که چه روش‌هایی برای مداخله بیماری در منطقه مناسب‌تر است مفید بودند (به JF Wang، Li، و همکاران مراجعه کنید. نقل قول۲۰۱۰).

جدول ۴٫ q– تابع محاسبه شده برای بروز نقص لوله عصبی با استفاده از لایه های ساخته شده برای عوامل مشکوک مختلف

CSV را دانلود کنید جدول نمایش

در هر دو مثال و در چندین بخش قبلی، نتایج آماری به مقیاس (اندازه) یا تقسیم‌بندی مرتبط با واحدهای گزارشگر (که به آن MAUP، Openshaw گفته می‌شود، بستگی دارد. نقل قول۱۹۸۴; Ge و همکاران نقل قول۲۰۱۹). این یک مسئله بومی در تحلیل فضایی هنگام کار با واحدهای منطقه است. به طور معمول، روش‌هایی که در اینجا توضیح داده می‌شوند، به نظر نمی‌رسد که منجر به اثرات مقیاس اضافی یا قابل توجهی شوند، زیرا خود واحدهای گزارش‌دهنده تحت تأثیر قرار نگرفته‌اند (به استثنای برخی از کاربردهای روش ساندویچ که ممکن است برخی از مناطق منبع تقسیم شده و به دو قسمت تقسیم شوند. یا مناطق هدف بیشتری). ایجاد زیر مجموعه های همگن، با این حال، لایه دیگری از افکت پارتیشن را اضافه می کند. به همین دلیل است که تشخیص و توجیه حضور ناهمگونی فضایی با اجرای روش‌شناسی مربوطه برای شناسایی زیرمجموعه‌های همگن همانطور که قبلاً توضیح داده شد و در ادامه بیشتر مورد بحث قرار گرفت، مهم است.

بحث و نتایج

SSH زمانی رایج است که داده ها یک منطقه جغرافیایی بزرگ را پوشش می دهند یا در جایی که داده ها با وضوح بالا هستند. مشکلات ناشی از SSHy برای آمارهایی که فرض می کنند همگنی را می توان حل کرد یا حداقل کاهش داد اگر ساختار ناهمگنی را بتوان شناسایی کرد، به طوری که نقشه را می توان به زیرجمعیت های همگن تقسیم کرد. اگر مشاهدات مستقل باشند، می توان از روش های آماری مرسوم (iid) در هر طبقه استفاده کرد و اگر مشاهدات SAC باشند، باید از روش های آماری مکانی استفاده کرد. اگر بتوان ساختار SSH را شناسایی کرد، می‌توان از آن برای طراحی طرح‌های نمونه‌گیری نیز استفاده کرد که به ترسیم یک نمونه نماینده که پوشش لایه‌های مختلف را ارائه می‌دهد و سوگیری برآوردگر را کاهش می‌دهد، کمک می‌کند.

شناسایی SSH فرصتی برای درون یابی فضایی زمانی که SAC وجود ندارد یا ضعیف است، ارائه می دهد. علاوه بر ارائه معیاری از SSH، qتابع را می توان برای کشف ارتباط غیرخطی بین الگوهای فضایی دو متغیر مورد استفاده قرار داد و همانطور که قبلاً بحث شد معنای فیزیکی واضحی دارد. ابزارهایی را خلاصه می کند که اغلب برای داده های نشان دادن حالات مختلف (حضور – عدم وجود) SSH و SAC استفاده می شوند.

جدول ۵٫ نمونه هایی از تکنیک ها هنگام کار با داده های ناهمگن طبقه بندی شده فضایی

CSV را دانلود کنید جدول نمایش

اگرچه در زمینه‌های تحقیقاتی خاص، SSH با الگوریتم‌های متعدد توسعه‌یافته برای خوشه‌بندی فضایی بومی است، اما توجهی که سایر ویژگی‌های خاص داده‌های مکانی دریافت کرده‌اند، به آن توجه نشده است. توسعه آمار برای SSH به جعبه ابزار تکنیک های تحلیل فضایی اکتشافی، در کنار تکنیک هایی برای کاوش داده هایی که SAC هستند (Anselin) اضافه می کند. نقل قول۱۹۹۵).

کرسی (نقل قول۱۹۹۳اشاره کرد، «اینکه فردی انتخاب کند که تغییرات فضایی را از طریق ساختار میانگین (غیر تصادفی) (به نام تغییرات مقیاس بزرگ) یا ساختار وابستگی تصادفی (به نام تنوع مقیاس کوچک) مدل‌سازی کند، به مشکل علمی اساسی بستگی دارد و گاهی اوقات می‌تواند صرفاً یک مبادله بین تناسب مدل و صرفه جویی در توصیف مدل باشد. آنچه ساختار کوواریانس (فضایی) یک فرد است ممکن است ساختار متوسط فرد دیگر باشد.â € (۲۵). این اظهار نظر به رابطه بین ویژگی‌های ناهمگنی و خودهمبستگی فضایی و نحوه استفاده از آن در جریان تجزیه و تحلیل داده‌ها (اتکینسون و تیت) مربوط می‌شود. نقل قول۲۰۰۰). به عنوان مثال، رفتار شاخص‌های محلی تداعی فضایی (LISA)، آمار Ord Getis و GWR، همه آمارهای اکتشافی، می‌تواند منعکس کننده همبستگی مکانی محلی باشد (Anselin نقل قول۱۹۹۵; سوئی نقل قول۲۰۰۶، ۴۹۴) یا ناهمگونی فضایی (Goodchild and Haining نقل قول۲۰۰۴; آنسلین نقل قول۲۰۰۶). نیم متغیری که در زمین آمار به خوبی شناخته شده است، زیربنای کریجینگ است. این یک روش درونیابی است که بر اساس ویژگی های خودهمبستگی فضایی مجموعه ای از داده ها است. این روش همچنین می تواند برای شناسایی ناهمگونی فضایی به کار رود (نگاه کنید به Isaaks و Srivastava نقل قول۱۹۸۹، ۲۲۳-۲۴ و ; ۲۹۲ و همچنین در مورد استفاده از همبستگی در کریجینگ بحث کنید). دو مفهوم، ناهمگونی فضایی و خودهمبستگی مکانی، ویژگی های متمایز و مجزای داده های مکانی را منعکس نمی کنند. به تعبیر کرسی، «ناهمگونی یک فرد در میانگین ممکن است خود همبستگی فضایی محلی یا جهانی فرد دیگر باشد.» با این حال، یکی از نکات اصلی این مقاله این بود که استدلال کنیم که SSH ممکن است، به عنوان در مثال‌های ارائه‌شده در اینجا، با مسئله علمی تطبیق بهتری دارد و یک مبادله رضایت‌بخش بین تناسب مدل و پیچیدگی مدل ارائه می‌کند.

SSH یک فرصت مهم برای تشخیص علیت فضایی و برای تعامل کلی ارائه می دهد. چه زمانی Y به صورت غیر یکنواخت مرتبط است ایکس، مدل سازی در سطح جهانی ممکن است گیج شود (کریستاکوس و همکاران. نقل قول۲۰۱۷; و ، در حالی که یک مدل محلی ممکن است بیش از حد مناسب باشد و روندهای جمعیت را نادیده بگیرد (). در واقع، یک راه حل ساده برای آشفتگی، تقسیم جمعیت به طبقات همگن است.) به گونه ای که می توان طبقات را مدلسازی کرد و روندهای اقشار را به ترتیب، همانطور که قبلاً پیشنهاد شد، پس رفت. یک مزیت بیشتر از تایید SSH از ترکیب آن ها ناشی می شود SSW و SST آمار مانند ژئودیتکتور q-تابع (به طوری که ارتباط غیر یکنواخت بین دو متغیر قابل بررسی باشد () که ممکن است با مدلسازی خطی مرسوم رد شود.

شکل ۱۳٫ جمعیت غیر یکنواخت (منحنی قرمز) و استراتژی های مدل سازی (خطوط آبی). GWRâ€‰=â€‰رگرسیون وزنی جغرافیایی.

به عنوان یک ابزار جدید برای تجزیه و تحلیل SSH، ما معتقدیم که دو موضوع مربوط به q-عملکرد نیاز به بررسی بیشتر دارد. اول، ارزش q(L، پ) هم به تعداد طبقات و هم به ساختار فضایی طبقه بندی بستگی دارد. در برخی شرایط ممکن است تعداد زیادی طبقه بندی قابل قبول وجود داشته باشد (از نظر هر دو L و پ) و روشهای کارآمدی برای مقایسه آنها مورد نیاز است. در ارتباط نزدیک با این نکته، تصمیم گیری در مورد تعداد اقشار برای به کارگیری شامل یک مبادله بین پیچیدگی (تعداد اقشار) و سطح همگنی درون لایه ای است که قبلاً بحث شد. (چگونه می توانیم مطمئن باشیم که بهترین را انتخاب کرده ایم L و پ? آیا فقط باید یک تصمیم آماری باشد؟ برای انتخاب نهایی چقدر باید از دانش اساسی استفاده کرد و نتایج ما چقدر نسبت به انتخاب شده حساس است L و پ?) مطابق با اشکال دیگر تصمیم گیری آماری، یک آمار AIC می تواند راهی را برای رسمی کردن این مبادله، همانطور که قبلاً پیشنهاد شد، ارائه دهد، اما برای ارزیابی این امر به کار بیشتری نیاز است زیرا AIC به طور مستقیم قابل اجرا نیست. دلیل آن این است که PDF که AIC بر اساس آن است، بر روی یک نگاشت یک به یک با توزیع فضایی که q-تابع مبتنی است. به عنوان مثال، توزیع های فضایی مختلف (طبقه بندی) ممکن است PDF یکسانی را به اشتراک بگذارند. دوم، اگرچه خودهمبستگی مکانی و SSH دو ویژگی مهم داده های مکانی هستند، روابط بین آنها و تأثیر یکی بر دیگری در انجام تجزیه و تحلیل داده های مکانی نیاز به بررسی بیشتر دارد. با وجود این نگرانی ها، چند قانون کلی وجود دارد که باید در انتخاب مفید باشد (ال، پی) همانطور که در این مقاله نشان دادیم.

بیانیه افشا

هیچ تضاد منافع احتمالی توسط نویسندگان گزارش نشده است.

بیانیه تصحیح

این مقاله با تغییرات جزئی اصلاح شده است. این تغییرات بر محتوای علمی مقاله تأثیری ندارد.

اطلاعات تکمیلی

منابع مالی

این مطالعه توسط بنیاد ملی علوم طبیعی چین (شماره ۴۲۰۷۱۳۷۵، ۴۱۵۳۱۱۷۹)، وزارت علوم و فناوری چین (۲۰۲۲YFC3600800؛ ۲۰۲۳YFF1305403) و بنیاد ملی علوم اجتماعی چین (شماره ۲۱&ZD186) پشتیبانی شده است.

یادداشت هایی در مورد مشارکت کنندگان

جین فنگ وانگ

JINFENG WANG استاد آزمایشگاه کلید دولتی منابع و سیستم اطلاعات محیطی، موسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین، و در دانشگاه آکادمی علوم چین، پکن، چین است. پست الکترونیک: wangjf@Lreis.ac.cn. علاقه پژوهشی اولیه او روش‌شناسی برای نمونه‌گیری فضایی و استنتاج آماری با کاربرد در تحقیقات سلامت است.

رابرت هاینینگ

رابرت هاینینگ، استاد بازنشسته در گروه جغرافیا در دانشگاه کمبریج، کمبریج CB2 3EN، انگلستان است. پست الکترونیک: rph26@cam.ac.uk. علاقه پژوهشی اولیه او روش‌شناسی برای تجزیه و تحلیل داده‌های مکانی با کاربردها در تحقیقات خدمات سلامت و جغرافیای جرم است.

تونگلین ژانگ

تونگلین ژانگ دانشیار دپارتمان آمار، دانشگاه پردو، لافایت، IN 47907، ایالات متحده آمریکا است. پست الکترونیک: tlzhang@purdue.edu. علایق پژوهشی او روش شناسی آمار ریاضی و اپیدمیولوژی فضایی است.

چنگدونگ خو

CHENGDONG XU دانشیار آزمایشگاه کلیدی ایالتی منابع و سیستم اطلاعات محیطی، موسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: xucd@Lreis.ac.cn. علاقه پژوهشی او علم GIS است.

مائوگی هو

MAOGUI HU دانشیار آزمایشگاه کلیدی ایالتی منابع و سیستم اطلاعات محیطی، مؤسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: humg@Lreis.ac.cn. علاقه اولیه تحقیقاتی او آمار فضایی با کاربرد در تحقیقات بهداشتی است.

کیان یین

QIAN YIN دانشیار آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، مؤسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: yinq@Lreis.ac.cn. علاقه اولیه تحقیقاتی او اپیدمیولوژی فضایی است.

لیانفا لی

LIANFA LI استاد آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، موسسه علوم جغرافیایی و تحقیقات منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: lilf@Lreis.ac.cn. علاقه اولیه تحقیقاتی او روش‌شناسی برای یادگیری ماشین فضایی و هوش مصنوعی است.

چنگو ژو

CHENGHU ZHOU استاد آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، موسسه علوم جغرافیایی و تحقیقات منابع طبیعی، آکادمی علوم چین، پکن، چین است. و استاد دانشگاه آکادمی علوم چین، پکن، چین. پست الکترونیک: zhouch@Lreis.ac.cn. علاقه اولیه تحقیقاتی او علم GIS است.

گوانگ کوان لی

GUANGQUAN LI استادیار دپارتمان ریاضیات، فیزیک و مهندسی برق در دانشگاه نورثامبریا، نیوکاسل آپون تاین NE1 8ST، انگلستان است. پست الکترونیک: guangquan.li@northumbria.ac.uk. علاقه پژوهشی اولیه او روش‌شناسی بیزی برای تجزیه و تحلیل داده‌های ناشی از علوم بهداشتی و اجتماعی است.

هونگیان چن

HONGYAN CHEN دانشمند داده های مکانی در مرکز اکولوژی و هیدرولوژی بریتانیا، مرکز محیط زیست لنکستر، لنکستر، LA1 4AP، انگلستان است. پست الکترونیک: honche@ceh.ac.uk. علاقه اولیه تحقیقاتی او علم GIS است.

منابع

Akaike, H. 1974. نگاهی جدید به شناسایی مدل آماری. معاملات IEEE در کنترل خودکار ۱۹ (۶): ۷۱۶ – ۲۳٫ دو: ۱۰٫۱۱۰۹/TAC.1974.1100705.
Web of Science ®Google Scholar
Anselin, L. 1995. شاخص های محلی ارتباط فضایی – LISA. تحلیل جغرافیایی ۲۷ (۲): ۹۳ – ۱۱۵٫ doi: 10.1111/j.1538-4632.1995.tb00338.x.
Web of Science ®Google Scholar
Anselin, L. 2006. ناهمگونی فضایی. که در دایره المعارف جغرافیای انسانی، ویرایش ب. وارف، ۴۵۲ تا ۵۳٫ هزار اوکس، کالیفرنیا: سیج.
Google Scholar
اتکینسون، پی، و ان. تیت. ۲۰۰۰٫ مسائل مقیاس فضایی و راه حل های زمین آماری: بررسی. جغرافی دان حرفه ای ۵۲ (۴): ۶۰۷ – ۲۳٫ doi: 10.1111/0033-0124.00250.
Web of Science ®Google Scholar
بردلی، وی سی، اس. کوریواکی، ام. ایزاکوف، دی. سجدینوویچ، ایکس ال منگ، و اس. فلاکسمن. ۲۰۲۱٫ نظرسنجی های بزرگ غیرنماینده به طور قابل توجهی جذب واکسن ایالات متحده را بیش از حد تخمین زدند. طبیعت ۶۰۰ (۷۸۹۰): ۶۹۵-۷۰۰٫ دو: ۱۰٫۱۰۳۸/s41586-021-04198-4.
PubMed Web of Science ®Google Scholar
باتل، جی ام، دی.ام. آلن، دی. کیسی، بی. دیویسون، ام. هایاشی، دی ال پیترز، جی دبلیو پومروی، اس. سیمونوویچ، ای. سنت هیلر، و پی‌اچ ویتفیلد. ۲۰۱۶٫ فرآیندهای سیل در کانادا: جنبه های منطقه ای و ویژه. مجله منابع آب کانادا ۴۱ (۱ – ۲): ۷ تا ۳۰٫ doi: 10.1080/07011784.2015.1131629.
Web of Science ®Google Scholar
چن، جی.، تی وو، دی. زو، ال. لیو، ایکس وو، دبلیو گونگ، ایکس ژو، آر. لی، جی. هائو، جی. هو، و همکاران. ۲۰۲۲٫ بزرگی ها و الگوهای تغییر شکل زمین دائمی منجمد در مقیاس بزرگ که توسط Sentinel-1 InSAR در فلات مرکزی چینگهای-تبت آشکار شد. سنجش از دور محیط زیست ۲۶۸:۱۱۲۷۷۸٫ doi: 10.1016/j.rse.2021.112778.
Web of Science ®Google Scholar
مرکز ملی سرطان چین ۲۰۱۹٫ اطلس سرطان در چین. پکن: Sinomap Press.
Google Scholar
کریستاکوس، جی. ۱۹۹۲٫ مدل های میدانی تصادفی در علوم زمین. سن دیگو، کالیفرنیا: انتشارات آکادمیک.
Google Scholar
کریستاکوس، جی. ۲۰۱۲٫ زمین آمار فضایی و زمانی مدرن. ویرایش جدید مینولا، نیویورک: دوور.
Google Scholar
کریستاکوس، جی.، جی ام آنگولو، اچ.-ال. یو، و جی پی وو. ۲۰۱۷٫ تعیین متریک فضا-زمان در مدل‌سازی محیطی. مجله محیط زیست ۳۰ (۱): ۲۹ تا ۴۰٫
Google Scholar
کلیف، AD، و JK Ord. 1981. فرآیندهای فضایی: مدل ها و کاربرد. لندن: پایون.
Google Scholar
کرسی، ن. ۱۹۹۳٫ آمار برای داده های مکانی. نیویورک: وایلی.
Google Scholar
دان، آر، و آر هریسون. ۱۳۷۲٫ نمونه گیری سیستماتیک دو بعدی کاربری اراضی. آمار کاربردی ۴۲ (۴): ۵۸۵ تا ۶۰۱٫ doi: 10.2307/2986177.
Web of Science ®Google Scholar
Dutilleul، PRL 2011. ناهمگونی مکانی-زمانی: مفاهیم و تحلیل. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
Google Scholar
انیشتین، A. 1953. آرشیو انیشتین، ۶۱ – ۳۸۱٫ بازدید در ۱۷ دسامبر ۲۰۲۳٫ http://www.autodidactproject.org/quote/einstn2.html.
Google Scholar
Everitt، BS، و A. Skrondal. 2010. فرهنگ لغت آمار کمبریج. ویرایش چهارم کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
Google Scholar
Fotheringham، AS، C. Brunsdon، و M. Charlton. 2000. جغرافیای کمی: دیدگاه‌های تحلیل داده‌های مکانی. لندن: سیج.
Google Scholar
گائو، B.-B.، J.-F. وانگ، اچ.-ام. فن، K. Xu، M.-G. هو، و Z.-Y. چن. ۲۰۱۵٫ یک روش بهینه سازی طبقه بندی شده برای یک شبکه چند متغیره نظارت بر محیط زیست دریایی در مصب رودخانه یانگ تسه و دریای مجاور آن. مجله بین المللی علم اطلاعات جغرافیایی ۲۹ (۸):۱۳۳۲-۴۹٫ doi: 10.1080/13658816.2015.1024254.
Web of Science ®Google Scholar
گائو، بی بی، جی وای یانگ، زی چن، جی. سوگیهارا، ام سی لی، آ. استین، ام بی کوان، و جی اف وانگ. ۲۰۲۳٫ استنتاج علی از داده های سیستم زمین مقطعی با نقشه برداری متقاطع همگرا جغرافیایی. ارتباطات طبیعت ۱۴ (۱): ۵۸۷۵٫ دو: ۱۰٫۱۰۳۸/s41467-023-41619-6.
PubMed Web of Science ®Google Scholar
Ge، Y.، Y. Jin، A. Stein، Y. Chen، J. Wang، J. Wang، Q. Cheng، H. Bai، M. Liu، و PM Atkinson. 2019. اصول و روش های مقیاس بندی داده های علوم زمین مکانی. بررسی های علوم زمین ۱۹۷:۱۰۲۸۹۷٫ doi: 10.1016/j.earscirev.2019.102897.
Web of Science ®Google Scholar
Getis، A.، و JK Ord. 1992. تحلیل تداعی فضایی با استفاده از آمار فاصله. تحلیل جغرافیایی ۲۴ (۳): ۱۸۹ – ۲۰۶٫ doi: 10.1111/j.1538-4632.1992.tb00261.x.
Web of Science ®Google Scholar
گلدشتاین، H. 2011. مدل های آماری چند سطحی. ویرایش چهارم چیچستر، انگلستان: ویلی.
Google Scholar
Goodchild، MF، L. Anselin، و U. Deichmann. 1993. چارچوبی برای درونیابی منطقه ای داده های اجتماعی-اقتصادی. محیط زیست و برنامه ریزی الف: اقتصاد و فضا ۲۵ (۳): ۳۸۳ – ۹۷٫ doi: 10.1068/a250383.
Web of Science ®Google Scholar
گودچایلد، ام.، و آر. هاینینگ. ۱۳۸۳٫ GIS و تجزیه و تحلیل داده های مکانی: دیدگاه های همگرا. مقالات علوم منطقه ای ۸۳ (۱): ۳۶۳ تا ۸۵٫ doi: 10.1007/s10110-003-0190-y.
Web of Science ®Google Scholar
گریفیث، DA 2003. خودهمبستگی فضایی و فیلتر فضایی، به دست آوردن درک از طریق تئوری و تجسم. برلین: Springer Verlag.
Google Scholar
گجراتی، DN و DC Porter. 2009. اقتصاد سنجی پایه. ویرایش پنجم نیویورک: مک گراو هیل.
Google Scholar
Guo، JH، QS Xu، Y. Zeng، ZH Liu، و XX Zhu. 2023. نقشه برداری و ارزیابی پوشش تاج درخت شهری در سراسر کشور در برزیل از تصاویر سنجش از دور با وضوح بالا با استفاده از یادگیری عمیق. مجله فتوگرامتری و سنجش از دور ISPRS 198:1-15. doi: 10.1016/j.isprsjprs.2023.02.007.
Web of Science ®Google Scholar
هاینینگ، R. 2003. تجزیه و تحلیل داده های مکانی: تئوری و عمل. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
Google Scholar
Haining، R.، و GQ Li. 2020. مدل‌سازی داده‌های مکانی و مکانی-زمانی: رویکرد بیزی. بوکا راتون، فلوریدا: CRC.
Google Scholar
Heckman, JJ 1979. سوگیری انتخاب نمونه به عنوان یک خطای مشخصات. اقتصادسنجی ۴۷ (۱): ۱۵۳ – ۶۱٫ doi: 10.2307/1912352.
Web of Science ®Google Scholar
هاکس، جی جی ۲۰۱۰٫ تجزیه و تحلیل چند سطحی: تکنیک ها و کاربردها. ویرایش دوم لندن و نیویورک: روتلج.
Google Scholar
هو، ام جی و جی اف وانگ. ۲۰۱۱٫ بسته بهینه سازی شبکه هواشناسی با استفاده از نظریه MSN. مدلسازی و نرم افزار محیطی ۲۶ (۴): ۵۴۶ – ۴۸٫ doi: 10.1016/j.envsoft.2010.10.006.
Google Scholar
هو، M.-G.، J.-F. وانگ، ی. ژائو و ال. جیا. ۲۰۱۳٫ بهترین ابزار تخمین بی طرفانه خطی مبتنی بر B-SHADE برای نمونه های بایاس. مدلسازی و نرم افزار محیطی ۴۸:۹۳-۹۷٫ doi: 10.1016/j.envsoft.2013.06.011.
Web of Science ®Google Scholar
Imbens، GW و DB Rubin. 2015. استنتاج علی در آمار، علوم اجتماعی و زیست پزشکی. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
Google Scholar
Isaaks، E.، و R. Srivastava. 1989. زمین آمار کاربردی. نیویورک: انتشارات دانشگاه آکسفورد.
Google Scholar
Ji، BW، YB Qin، TB Zhang، XB Zhou، GH Yi، MT Zhang و ML Li. 2022. تحلیل عوامل محرک خشکسالی در فصل رشد در مغولستان داخلی بر اساس مدل‌های ژئودتکتور و GWR. سنجش از دور ۱۴ (۲۳): ۶۰۰۷٫ doi: 10.3390/rs14236007.
Web of Science ®Google Scholar
Kulldorff, M. 1997. آمار اسکن فضایی. ارتباطات در آمار: نظریه و روش ۲۶ (۶): ۱۴۸۱ – ۹۶٫ doi: 10.1080/03610929708831995.
Web of Science ®Google Scholar
Li، X.، M. Feng، Y. Ran، Y. Su، F. Liu، C. Huang، H. Shen، Q. Xiao، J. Su، S. Yuan، و همکاران. ۲۰۲۳٫ داده های بزرگ در علم سیستم زمین و پیشرفت به سمت یک دوقلوی دیجیتال. بررسی های طبیعت درباره زمین و محیط زیست ۴ (۵): ۳۱۹ – ۳۲٫ doi: 10.1038/s43017-023-00409-w.
Google Scholar
Lin، Y.، CD Xu، و JF Wang. 2023. Sandwichr: پیش بینی فضایی در R بر اساس ناهمگنی طبقه بندی فضایی. معاملات در GIS 27 (5): 1579 – 98. doi: 10.1111/tgis.13088.
Web of Science ®Google Scholar
لیندلی، دی وی، و ام آر نوویک. ۱۳۶۰٫ نقش مبادله پذیری در استنتاج. سالنامه آمار ۹:۴۵ – ۵۸٫
Web of Science ®Google Scholar
لیو، سی، دبلیو لی، دبلیو وانگ، اچ. ژو، تی لیانگ، اف. هو، جی. زو و پی. زو. ۲۰۲۱٫ تحلیل فضایی کمی دینامیک پوشش گیاهی و عوامل محرک بالقوه در یک منطقه آلپی معمولی در فلات شمال شرقی تبت با استفاده از موتور Google Earth. کاتنا ۲۰۶: ۱۰۵۵۰۰٫ doi: 10.1016/j.catena.2021.105500.
Web of Science ®Google Scholar
لوید، سی دی ۲۰۱۰٫ مدل های محلی برای تحلیل فضایی. ویرایش دوم بوکا راتون، فلوریدا: CRC.
Google Scholar
Longley، PA، MF Goodchild، DJ Maguire، و DW Rind. 2005. سیستم های اطلاعات جغرافیایی و علم. ویرایش دوم هوبوکن، نیوجرسی: وایلی.
Google Scholar
لو، دبلیو، جی. جاسیویچ، تی استپینسکی، جی. وانگ، سی. ژو، و ایکس. کانگ. ۲۰۱۶٫ ارتباط فضایی بین تراکم تشریح و عوامل محیطی در سراسر ایالات متحده. نامه های تحقیقاتی ژئوفیزیک ۴۳ (۲): ۶۹۲ تا ۷۰۰٫ doi: 10.1002/2015GL066941.
Web of Science ®Google Scholar
Matheron, G. 1963. اصول زمین آمار. زمین شناسی اقتصادی ۵۸ (۸): ۱۲۴۶ – ۶۶٫ دو: ۱۰٫۲۱۱۳/gsecongeo.58.8.1246.
Google Scholar
منگ، XL 2018. بهشت‌های آماری و پارادوکس‌ها در داده‌های بزرگ (I): قانون جمعیت‌های بزرگ، پارادوکس کلان داده‌ها و انتخابات ریاست‌جمهوری ایالات متحده در سال ۲۰۱۶٫ Annals of Applied Statistics 12 (2):685-726. دو: ۱۰٫۱۲۱۴/۱۸-AOAS1161SF.
Web of Science ®Google Scholar
موران، ص ۱۹۵۰٫ نکاتی در مورد پدیده های تصادفی پیوسته. بیومتریک ۳۷ (۱ – ۲): ۱۷ – ۲۳٫
PubMed Web of Science ®Google Scholar
او کانل، پی ای، آر جی گورنی، دی جونز، جی بی میلر، کالیفرنیا نیکلاس و ام آر ارشد. ۱۹۷۹٫ مطالعه موردی منطقی سازی شبکه باران سنج در جنوب غربی انگلستان. تحقیقات منابع آب ۱۵ (۶): ۱۸۱۳ – ۲۲٫ doi: 10.1029/WR015i006p01813.
Web of Science ®Google Scholar
Openshaw, S. 1984. مشکل واحد منطقه ای قابل تغییر: CATMOG 38. نورویچ، انگلستان: GeoAbstracts
Google Scholar
پرل، جی، و دی مکنزی. ۲۰۱۸٫ کتاب چرا: علم جدید علت و معلول. نیویورک: کتاب های پایه.
Google Scholar
پیرسون، ک. ۱۸۹۵٫ نکاتی در مورد رجعت و ارث در مورد دو والدین. مجموعه مقالات انجمن سلطنتی لندن ۵۸:۲۴۰-۴۲٫
Google Scholar
رائو، JNK 2003. تخمین مساحت کوچک. نیویورک: وایلی.
Google Scholar
ریپلی، بی دی ۱۹۸۱٫ آمار فضایی. نیویورک: وایلی.
Google Scholar
RodrÃguez-Iturbe، I.، و JM Mejaa. 1974. طراحی شبکه های بارش در زمان و مکان. تحقیقات منابع آب ۱۰ (۴): ۷۱۳ – ۲۸٫ doi: 10.1029/WR010i004p00713.
Web of Science ®Google Scholar
رانج، جی.، آ. گرهاردوس، جی. واراندو، وی. آیرینگ و جی. کمپس-والز. ۲۰۲۳٫ استنتاج علی برای سری های زمانی. بررسی های طبیعت درباره زمین و محیط زیست ۴ (۷): ۴۸۷ تا ۵۰۵٫ doi: 10.1038/s43017-023-00431-y.
Google Scholar
Snijders، TAB و RJ Bosker. 2011. تجزیه و تحلیل چند سطحی: مقدمه ای بر مدل سازی چند سطحی پایه و پیشرفته. ویرایش دوم هزار اوکس، کالیفرنیا: سیج.
Google Scholar
اسنو، ج. ۱۸۵۴٫ در مورد نحوه ارتباط وبا. لندن، چرچیل.
Google Scholar
Stein, A. 2022. توسعه مجله آمار فضایی: ۱۰ سال اول. آمار فضایی ۵۰:۱۰۰۵۷۶٫ doi: 10.1016/j.spasta.2021.100576.
Web of Science ®Google Scholar
استاین، ا.، ام. هوگرورف، و جی. بوما. ۱۹۸۸٫ استفاده از ترسیم نقشه خاک برای بهبود (Co-)کریجینگ داده های نقطه ای در مورد کمبود رطوبت. ژئودرما ۴۳ (۲ – ۳): ۱۶۳ – ۷۷٫ doi: 10.1016/0016-7061(88)90041-9.
Web of Science ®Google Scholar
Sugihara، G.، R. Ma، H. Ye، C. Hsieh، E. Deyle، M. Fogarty، و S. Munch. 2012. تشخیص علیت در اکوسیستم های پیچیده. علوم پایه ۳۳۸ (۶۱۰۶): ۴۹۶ تا ۵۰۰٫ doi: 10.1126/science.1227079.
PubMed Web of Science ®Google Scholar
Sui, D. 2006. اولین قانون جغرافیایی Tobler. که در دایره المعارف جغرافیای انسانی، ویرایش B. Warff, 454. Thousand Oaks, CA: Sage.
Google Scholar
وانگ، جی اف، جی. کریستاکوس، و ام جی هو. ۱۳۸۸٫ مدلسازی وسایل فضایی سطوح با ناهمگنی طبقاتی. معاملات IEEE در زمینه علوم زمین و سنجش از راه دور ۴۷ (۱۲): ۴۱۶۷ – ۷۴٫ doi: 10.1109/TGRS.2009.2023326.
Web of Science ®Google Scholar
وانگ، JF، R. Haining، و ZD Cao. 2010. بررسی نمونه برای تخمین میانگین سطح ناهمگن: کاهش واریانس خطا از طریق پهنه بندی. مجله بین المللی علم اطلاعات جغرافیایی ۲۴ (۴): ۵۲۳ – ۴۳٫ doi: 10.1080/13658810902873512.
Web of Science ®Google Scholar
وانگ، J.-F.، R. Haining، T.-J. لیو، L.-F. لی و سی.-اس. جیانگ. ۲۰۱۳٫ برآورد ساندویچ برای گزارش چند واحدی در یک سطح ناهمگن طبقه بندی شده. محیط زیست و برنامه ریزی الف: اقتصاد و فضا ۴۵ (۱۰): ۲۵۱۵ – ۳۴٫ doi: 10.1068/a44710.
Web of Science ®Google Scholar
Wang، JF، MG Hu، CD Xu، G. Christakos و Y. Zhao. 2013. برآورد آلودگی هوا در سطح شهر در پکن. PloS ONE 8 (1):e53400. doi: 10.1371/journal.pone.0053400.
PubMed Web of Science ®Google Scholar
وانگ، JF، XH Li، G. Christakos، YL Liao، T. Zhang، X. Gu، و XY Zheng. 2010. ارزیابی خطر سلامت مبتنی بر آشکارسازهای جغرافیایی و کاربرد آن در مطالعه نقص لوله عصبی منطقه هشون، چین. مجله بین المللی علم اطلاعات جغرافیایی ۲۴ (۱): ۱۰۷ – ۲۷٫ doi: 10.1080/13658810802443457.
Web of Science ®Google Scholar
وانگ، J.-F.، BY Reis، M.-G. هو، جی. کریستاکوس، W.-Z. یانگ، کیو سان، ز.-جی. لی، X.-Z. لی، اس.-جی. لای، اچ.-ای. چن و همکاران ۱۳۹۰٫ برآورد بیماری منطقه بر اساس سوابق بیمارستان نگهبان. PLoS ONE 6 (8):e23428. doi: 10.1371/journal.pone.0023428.
PubMed Web of Science ®Google Scholar
وانگ، جی، سی زو، ام. هو، کیو لی، زی یان و پی. جونز. ۲۰۱۸٫ دینامیک دمای هوای سطح زمین جهانی از سال ۱۸۸۰٫ مجله بین المللی اقلیم شناسی ۳۸ (تامین ۱):e466â€“e474. دو: ۱۰٫۱۰۰۲/بازی.۵۳۸۴٫
Google Scholar
وانگ، جی اف، تی ال ژانگ و بی جی فو. ۱۳۹۵٫ اندازه گیری ناهمگنی طبقه بندی شده فضایی. شاخص های اکولوژیکی ۶۷: ۲۵۰ تا ۵۶٫ دو: ۱۰٫۱۰۱۶/j.ecolind.2016.02.052.
Web of Science ®Google Scholar
وانگ، زی، اف. لو، زی لیو، دبلیو تو، کی نی، کیو دو، کیو لی و زی وو. ۲۰۲۲٫ اندازه گیری اثرات غیر ثابت فضایی استفاده مختلط مبتنی بر POI بر سرزندگی شهری با استفاده از مدل ضرایب متغیر فضایی بیزی. مجله بین المللی علم اطلاعات جغرافیایی ۳۷ (۲): ۳۳۹ – ۵۹٫ doi: 10.1080/13658816.2022.2117363.
Web of Science ®Google Scholar
Womble, WH 1951. سیستماتیک دیفرانسیل. علوم پایه ۱۱۴ (۲۹۶۱): ۳۱۵ – ۲۲٫ doi: 10.1126/science.114.2961.315.
PubMed Web of Science ®Google Scholar
Worobey، M.، JI Levy، L Malpica Serrano، A Crits-Christoph، JE Pekar، SA Goldstein، AL Rasmussen، MUG Kraemer، C Newman، MPG Koopmans، و همکاران. ۲۰۲۲٫ بازار عمده فروشی غذاهای دریایی Huanan در ووهان مرکز اولیه همه گیری COVID-19 است. علوم پایه ۳۷۷ (۶۶۰۹): ۹۵۱ – ۵۹٫ doi: 10.1126/science.abp8715.
PubMed Web of Science ®Google Scholar
زو، بی.، جی. وانگ، زی. لی، سی. زو، ی. لیائو، ام. هو، جی. یانگ، اس. لای، ال. وانگ، و دبلیو یانگ. ۲۰۲۱٫ ارتباط فصلی بین علل ویروسی عفونت های حاد تنفسی تحتانی بستری در بیمارستان و عوامل هواشناسی در چین: یک مطالعه گذشته نگر. The Lancet: Planetary Health 5 (3):e154â€“e163. doi: 10.1016/S2542-5196(20)30297-7.
PubMedGoogle Scholar
خو، سی، جی. وانگ، ام. هو و دبلیو وانگ. ۲۰۲۲٫ روشی جدید برای درونیابی داده های کیفیت هوای از دست رفته در ایستگاه های مانیتور. محیط زیست بین المللی ۱۶۹:۱۰۷۵۳۸٫ doi: 10.1016/j.envint.2022.107538.
PubMed Web of Science ®Google Scholar
Xu، CD، JF Wang، و QX Li. 2018. روشی جدید برای درونیابی فضایی دما بر اساس ایستگاه های تاریخی پراکنده. مجله آب و هوا ۳۱ (۵): ۱۷۵۷ – ۷۰٫ دو: ۱۰٫۱۱۷۵/JCLI-D-17-0150.1.
Web of Science ®Google Scholar
خو، ال.، کیو لیو، ال سی استیج، تی. بن آری، ایکس فانگ، ک.-اس. چان، اس. وانگ، ان سی استنست، و ز. ژانگ. ۲۰۱۱٫ اثر غیر خطی آب و هوا بر طاعون در طول سومین بیماری همه گیر در چین. مجموعه مقالات آکادمی ملی علوم ایالات متحده آمریکا ۱۰۸ (۲۵): ۱۰۲۱۴ – ۱۹٫ doi: 10.1073/pnas.1019486108.
PubMed Web of Science ®Google Scholar
یانگ، جی.، جی. وانگ، ایکس. لیائو، اچ. تائو و ی. لی. ۲۰۲۲٫ مدل سازی زنجیره ای برای پیوند بیوژئوشیمیایی کادمیوم در سیستم سلامت انسان خاک-برنج. محیط زیست بین المللی ۱۶۷:۱۰۷۴۲۴٫ doi: 10.1016/j.envint.2022.107424.
PubMed Web of Science ®Google Scholar
یین، کیو، جی. وانگ، ز. رن، جی. لی و ی. گو. ۲۰۱۹٫ نقشه برداری از افزایش دمای حداقل مرگ و میر در زمینه تغییرات آب و هوایی جهانی. ارتباطات طبیعت ۱۰ (۱): ۴۶۴۰٫ doi:10.1038/s41467-019-12663-y.
PubMedGoogle Scholar
یو، سی ال، زی سی وانگ و دی لیو. ۲۰۲۰٫ تجزیه و تحلیل فرآیند تکامل و نیروی محرکه تالاب های طبیعی در حوضه رودخانه Xiliao بر اساس حالت SWAT. معاملات انجمن مهندسی کشاورزی چین ۳۶ (۲۲): ۲۸۶ – ۹۷٫
Google Scholar
Zhang، DD، P. Brecke، HF Lee، Y.-Q. او، و جی. ژانگ. ۲۰۰۷٫ تغییرات آب و هوایی جهانی، جنگ و کاهش جمعیت در تاریخ معاصر بشر. مجموعه مقالات آکادمی ملی علوم ایالات متحده آمریکا ۱۰۴ (۴۹): ۱۹۲۱۴ – ۱۹٫ doi: 10.1073/pnas.0703073104.
PubMed Web of Science ®Google Scholar

جلد نشریه

منبع:
۱- shahrsaz.ir ,مدل سازی آماری داده های ناهمگن طبقه بندی شده فضایی
,۲۰۲۴-۰۲-۰۷ ۱۲:۲۰:۲۷
۲- https://www.tandfonline.com/doi/full/10.1080/24694452.2023.2289982?af=R

مدل سازی آماری داده های ناهمگن طبقه بندی شده فضایی

خلاصه

چالش های آماری هنگام کار با جمعیت های ناهمگن طبقه بندی شده فضایی

نمونه های غیرنماینده و برآوردهای کیفیت ضعیف

روابط آشفته

معادله ناهمگنی طبقه بندی شده فضایی

معادله ای برای جمعیت SSH

یک تابع برای SSH

ارزیابی طبقه بندی های مختلف

استنتاج تحت ناهمگونی طبقه بندی شده فضایی

آمار در لایه های همگن

درونیابی فضایی با SSH

علیت فضایی

تعامل عمومی بین متغیرها

خوبی فضایی تناسب

ژئودیتکتور q +

طرح SSH

مطالعات تجربی

به دست آوردن نقشه ای از بروز سرطان سینه با استفاده از داده های نمونه: مقایسه ساندویچ و کریجینگ (مرکز ملی سرطان چین) نقل قول۲۰۱۹)

انتساب فضایی نقایص لوله عصبی در شهرستان هشون

بحث و نتایج

بیانیه افشا

بیانیه تصحیح

اطلاعات تکمیلی

منابع مالی

یادداشت هایی در مورد مشارکت کنندگان

جین فنگ وانگ

رابرت هاینینگ

تونگلین ژانگ

چنگدونگ خو

مائوگی هو

کیان یین

لیانفا لی

چنگو ژو

گوانگ کوان لی

هونگیان چن

منابع

لغو پاسخ