خلاصه
آمار مکانی یک روش مهم برای تجزیه و تحلیل داده های مکانی است. این برای مدیریت دادههای همبسته مکانی و دادههای ناهمگن از نظر مکانی (محلی) تکامل یافته است که به ترتیب قصد دارند قوانین اول و دوم جغرافیا را دریافت کنند. نمونه هایی از ناهمگونی طبقه بندی شده فضایی (SSH) شامل مناطق اقلیمی و انواع کاربری زمین است. روشها برای چنین دادههایی در مقایسه با دو ویژگی اول نسبتاً توسعه نیافتهاند. وجود SSH گواه این است که طبیعت قانونی و ساختار یافته است و نه تصادفی. این باعث ایجاد “لایه” دیگری از تغییرات زمینه ای علیت مشاهده شده در داده های جغرافیایی می شود. در این مقاله، ما فراتر از رویکردهای سنتی مبتنی بر خوشه میرویم و یک رویکرد واحد برای SSH پیشنهاد میکنیم که در آن معادلهای برای SSH ارائه میکنیم، نشان میدهیم که چگونه SSH منبع سوگیری در نمونهگیری فضایی و مخدوشکننده در مدلسازی فضایی است، تشخیص علیت تصادفی غیرخطی به ارث رسیده است. در توزیع SSH، برهمکنش عمومی شناسایی شده با همپوشانی دو توزیع SSH را کمی کنید، پیشبینی فضایی را بر اساس SSH انجام دهید، یک معیار جدید برای خوبی فضایی ایجاد کنید، و با ادغام آنها با آماره SSH q، مدلسازی جهانی را تقویت کنید. این تحقیق تئوری و روشهای آماری را برای مقابله با دادههای SSH پیشرفت میدهد و در نتیجه جعبه ابزار جدیدی برای تجزیه و تحلیل دادههای مکانی ارائه میدهد.
ç©ºé—´ç»Ÿè®¡æ˜¯åœ°ç †ç©ºé—´æ•°æ ®åˆ†æž çš„é‡ è¦ æ–¹æ³•، èƒ½å¤Ÿå¤„ç †ç ºé—´è‡ªç›¸å…³æ•°æ ®å'Œç©ºé—´(局部)å¼‚è´¨æ•°æ ®، ä»Žè€Œæ •æ ‰åœ° å¦ç¬¬ä¸€å®šå¾‹å'Œç¬¬äºŒå®šå¾‹ã€‚空间分层异质性(SSH)的例å 包括气候带å'ŒåœŸåœ°åˆ©ç”¨ç±»åž‹ã€‚ä¸Žå‰ ä¸¤ä¸ªç‰¹æ€§ç›¸æ¯ », 很å°'有é'ˆå¯¹æ¤ç±»æ•°æ ®çš„方法。SSHçš„å˜åœ¨, è¯ æ˜Žäº†è‡ªç„ ¯æœ‰è§„则的〠结构化皓, è€Œé žå®Œå…¨éš æœºçš„ã€‚è¿™å¼•å 'äº†åœ°ç †æ •°æ ®å·®å¼‚èƒŒå Žçš„â€œä¸€å±‚â € å› æžœå…³ç³»ã€‚æœ¬æ–‡è¶…è¶Šä¼ ç»Ÿçš„è šç±» 方法، æ 出整体性SSH方法، æ 供了SSH方程، ±•ç¤ºäº†SSH如伽 ©ºé—´é‡‡æ ·çš„å å·®å'Œç©ºé—´å»ºæ¨¡çšæ··æ·†، 检测了SSH分布ä¸çš «é žçº¿æ€§éš æœºå› æžœå…³ç³», Œäº†é‡ 化، 基于SSH进行了空间预测، å¼€å '了新的空间挟å , 并将其与SSHçš„qç»Ÿè®¡ç›¸ç»“å ˆä»Žè€Œæ”¹è¿›äº†å…¨å±€å»ºæ¨¡ã€‚ è¯¥ç ”ç©¶ä¿ƒè¿›äº†SSHæ•°æ ®å¤„ç †çš„ç»Ÿè®¡å¦ç †è®ºå'Œæ–¹æ³•، ä¸ºç©ºé —´æ•°æ ®åˆ†æž æ 供了新方法。
آمار مکانی یک روش ارزشمند برای تجزیه و تحلیل داده های مکانی است. این زمینه برای پرداختن به مدیریت دادههای خودهمبسته مکانی و دادههای ناهمگن مکانی (محلی) تکامل یافته است که به ترتیب به دنبال گرفتن قوانین اول و دوم جغرافیا هستند. نمونه هایی از ناهمگونی طبقه بندی شده فضایی (SSH) شامل مناطق آب و هوایی و انواع کاربری زمین است. روشهای آن نوع داده در مقایسه با دو ویژگی اول نسبتاً توسعه نیافته است. وجود SSH گواه بر این است که طبیعت به جای تصادفی کاملاً قانونی و ساختارمند است. این “لایه” دیگری از علیت را القا می کند که بر تغییرات مشاهده شده در داده های جغرافیایی تأکید می کند. در این مقاله ما فراتر از رویکردهای سنتی مبتنی بر خوشه حرکت می کنیم و یک رویکرد واحد برای SSH پیشنهاد می کنیم که در آن معادله ای برای SSH ارائه می دهیم، نشان می دهد که چگونه SSH منبع سوگیری در نمونه گیری فضایی و سردرگمی در مدل سازی فضایی است، ما تصادفی غیر خطی را تشخیص می دهیم. علیت در توزیع SSH، ما تعامل کلی شناسایی شده از طریق برهم نهی دو توزیع SSH را کمی می کنیم، یک پیش بینی فضایی را بر اساس SSH فرموله می کنیم، یک معیار جدید برای خوبی فضایی ایجاد می کنیم و مدل سازی جهانی را با ادغام همه چیز با یک آمار q از SSH. این تحقیق به پیشرفت تئوری آماری و روشهای مقابله با دادههای SSH کمک میکند و در نتیجه جعبه ابزار جدیدی برای تجزیه و تحلیل دادههای مکانی فراهم میکند.
کلید واژه ها:
کلید واژه ها:
نظریه آماری در ابتدا برای مشاهدات مستقل و یکسان توزیع شده (iid) از یک جمعیت (اغلب توسط یک سری آزمایش به دست می آید) توسعه یافت. با این حال، دادههای مکانی، ناشی از متغیرهای مورد علاقه که در یک فضای جغرافیایی به یکدیگر نزدیک هستند، از نظر محلی مشابه هستند. در ادبیات به این ویژگی خودهمبستگی مکانی (SAC) گفته می شود. اگر تغییرات فضایی زیربنایی از جمعیت را بتوان با یک مدل آماری فضایی توصیف کرد، استنتاج آماری ممکن می شود (به عنوان مثال، کریستاکوس را ببینید نقل قول۱۹۹۲; گریفیث نقل قول۲۰۰۳; هاینینگ نقل قول۲۰۰۳). مدلسازی وابستگی فضایی، توسط نوعی مدل خودرگرسیون مکانی برای دادههای شبکه، یا نیمه متغیرهنگاری مجاز برای دادههای زمینآماری، در قلب بسیاری از شاخههای آمار فضایی قرار دارد (Cliff and Ord). نقل قول۱۹۸۱; کرسی نقل قول۱۹۹۳; استین نقل قول۲۰۲۲).
توانایی مدلسازی وابستگی فضایی فرصتهایی را برای انجام بسیاری از اشکال تحلیل فضایی، مانند درون یابی فضایی (ماترون) باز میکند. نقل قول۱۹۶۳). اصل اساسی را می توان به عنوان یکی از قرض گرفتن مقادیر داده های نزدیک به وسیله وزن دهی معکوس فاصله به منظور تخمین مقادیر باقیمانده داده برای ساختن یک نقشه توصیف کرد. مدلهای تغییرات مکانی نیز میتوانند برای بهبود دقت تخمین پارامترهای ناحیه کوچک با فرآیندهای مشابه وام گرفتن اطلاعات از مناطق همسایه استفاده شوند. فرض اساسی که به این شکل از استقراض اطلاعات اجازه می دهد این است که مقادیر پارامترهای همسایه مشابه هستند به طوری که اطلاعات موجود در داده های مناطق همسایه را می توان برای تخمین پارامترهای ناشناخته “قرض گرفت” (ریپلی) نقل قول۱۹۸۱; فاثرینگهام، براندون و چارلتون نقل قول۲۰۰۰; رائو نقل قول۲۰۰۳; گلدشتاین نقل قول۲۰۱۱; هاینینگ و لی نقل قول۲۰۲۰).
این مقاله به توسعه روشهایی میپردازد که میتوانند یکی دیگر از ویژگیهای رایج دادههای مکانی را بررسی کنند: ناهمگنی فضایی. ناهمگونی اصطلاحی است که در آمار به کار می رود تا نشان دهد که یک یا چند ویژگی آماری مورد علاقه در تمام زیرمجموعه های جامعه یکسان نیستند (اوریت و اسکوندال). نقل قول۲۰۱۰، ۲۰۴). وجود ناهمگونی فضایی قسمت دوم فرض iid را نقض می کند – مشاهدات “به طور یکسان توزیع نشده اند.” به ویژه، اگر منطقه مورد مطالعه ما بزرگ و از نظر فیزیکی یا اجتماعی-اقتصادی متنوع باشد یا منطقه مورد مطالعه ما با وضوح فضایی بالا مشاهده شود، پس این فرض که همه زیرمجموعه های منطقه مورد مطالعه دارای ویژگی های آماری یکسانی هستند، احتمالاً نقض می شود. این فرض که برخی از زیر مجموعههای دادههای ما دارای ویژگیهای آماری متفاوتی هستند، ممکن است نقطه شروع مطمئنتری در تجزیه و تحلیل دادهها باشد. به عنوان مثال، دوتیلول (نقل قول۲۰۱۱، ۲۰ تا ۲۱) سه نوع ناهمگونی فضایی را که اغلب با آن مواجه می شوند توصیف کرد: ناهمگنی در میانگین (یا ناهمگونی مرتبه اول؛ به Stein، Hoogerwerf، و Bouma مراجعه کنید. نقل قول۱۹۸۸; فاثرینگهام، براندون و چارلتون نقل قول۲۰۰۰; لوید نقل قول۲۰۱۰; Ge و همکاران نقل قول۲۰۱۹; هاینینگ و لی نقل قول۲۰۲۰، فصل ۶)، ناهمگنی در واریانس (ناهمگنی یا ناهمگنی مرتبه دوم)، و ناهمگنی مرتبط با ساختار خودهمبستگی داده ها (به Getis و Ord مراجعه کنید. نقل قول۱۹۹۲; آنسلین نقل قول۱۹۹۵; کولدورف نقل قول۱۹۹۷).
شکل دیگری از ناهمگونی که در همه جا حاضر است، ناهمگنی طبقه بندی شده فضایی است (SSH؛ JF Wang، Zhang و Fu نقل قول۲۰۱۶). زمانی به وجود می آید که یک ناحیه شامل مجموعه ای از واحدهای فضایی به هم پیوسته را می توان به بخش های فضایی متمایز (طبقه) تقسیم کرد که در هر طبقه (که هر یک شامل تعدادی واحد فضایی است) میانگین یک متغیر یا ارتباط بین مشاهدات یکسان است. نشان می دهد که هر لایه فقط همگنی درون لایه را نشان می دهد. ویژگی های آماری ممکن است در مقایسه با سایر اقشار یکسان نباشد به طوری که اقشار ناهمگونی بین اقشار را به طور جمعی نشان می دهند. به نظر می رسد که این مشکل نسبت به سایر اشکال ناهمگونی فضایی که قبلاً توضیح داده شد توجه سیستماتیک کمتری را به خود جلب کرده است. بخشی از دلیل این امر ممکن است در چالش شناسایی مناطق همگن باشد. اشتاین، هوگرورف، و بوما (نقل قول۱۹۸۸) به نظر می رسد اولین مقاله ای باشد که به طبقه بندی فضایی می پردازد – موضوعی که در بخش های بعدی این مقاله به آن بازمی گردیم. اگر جمعیت SSH (پارادوکس سیمپسون) باشد، مدلسازی مخدوش خواهد شد. حتی اگر SSH تشخیص داده شود، ممکن است دادههای کافی برای ارائه تخمینهای مناسب از پارامترها در هر لایه با استفاده از روشهای تخمین سنتی وجود نداشته باشد – که به عنوان مشکل پراکندگی دادهها یا مشکل نمونه بایاس در زمانی که همه اقشار نمونهگیری نشدهاند، از آن یاد میشود (نگاه کنید به، به عنوان مثال، منگ نقل قول۲۰۱۸; جی وانگ و همکاران نقل قول۲۰۱۸; بردلی و همکاران نقل قول۲۰۲۱). علاوه بر چالشهای ناشی از حضور SSH، نادیده گرفتن حضور SSH به این معنی است که برخی از اطلاعات موجود در دادهها که میتوانند در تجزیه و تحلیل آن دادهها مفید باشند، مورد سوء استفاده قرار نمیگیرند.
هدف این مقاله از طریق تئوری و با استناد به مطالعات قبلی، ارتقای یک چارچوب سیستماتیک برای تحلیل و مدلسازی آماری SSH است. این مقاله به شرح زیر سازماندهی شده است. ما ابتدا چالش های آماری اصلی را در نظر می گیریم که هنگام کار با جمعیت های SSH بوجود می آیند. سپس معادله را برای جمعیت های SSH با هدف رسیدگی به چالش شناسایی مناطق SSH معرفی می کنیم. در مرحله بعد، نمونه هایی از استنتاج آماری برای جمعیت های SSH ارائه می دهیم. سپس توجه خواننده را به تعدادی از برنامههای کاربردی جلب میکنیم که در آنها SSH به دلیل ماهیت مشکل علمی یک مسئله کلیدی برای تجزیه و تحلیل دادهها است. ما در اینجا در مورد رابطه بین SSH و روش های این مقاله از یک سو و مسئله واحد منطقه ای قابل اصلاح (MAUP) از سوی دیگر نظر می دهیم. ما برخی از نتیجهگیریها و دستورالعملهای نهایی را برای نتیجهگیری کار آینده میگیریم.
چالش های آماری هنگام کار با جمعیت های ناهمگن طبقه بندی شده فضایی
در این بخش، مشکلات آماری را نشان میدهیم که اگر SSH در فرآیند تجزیه و تحلیل آماری شناسایی نشود، ممکن است ایجاد شود.
نمونه های غیرنماینده و برآوردهای کیفیت ضعیف
یک نمونه غیر نماینده به این معنی که هیستوگرام نمونه به طور قابل توجهی با جمعیتی که از آن جمع آوری شده است متفاوت است. در این مورد، مقدار مورد انتظار میانگین نمونه با میانگین جامعه یکسان نخواهد بود. یعنی میانگین نمونه یک برآوردگر مغرضانه میانگین جامعه خواهد بود. اگر جامعه SSH باشد و حجم نمونه کوچک با تعداد کم یا بدون نقاط نمونه در برخی از اقشار باشد، این امر مشکل سوگیری برآوردگر را تشدید خواهد کرد. اگر نقاط نمونه کمی در یک لایه وجود داشته باشد، تخمین های بزرگی از واریانس های خطا ظاهر می شود.
یک مشکل نمونه گیری مغرضانه معروف را نشان می دهد: توزیع مناطق آب و هوایی در چین و توزیع ایستگاه های هواشناسی در چین در سال ۱۹۰۰٫ ناکافی بودن شبکه اولیه ایستگاه ها برای تجزیه و تحلیل آماری کل کشور آشکار است. اطلاعات تکمیلی، در صورت وجود، میتواند برای کاهش اثرات هر گونه سوگیری نمونه درون لایهای مورد استفاده قرار گیرد (هکمن نقل قول۱۹۷۹; جی وانگ و همکاران نقل قول۲۰۱۸). اگر جمعیتی از نظر مکانی همگن باشد، با افزایش حجم نمونه مربوط به سطح معینی از همبستگی مکانی، میانگین مربعات خطا (MSE) برآوردگر کاهش می یابد (RodrÃguez-Iturbe and Mejaa). نقل قول۱۹۷۴; اوکانل و همکاران نقل قول۱۹۷۹).
روابط آشفته
وجود SSH استنباطهای مبتنی بر آمارهای جهانی را تضعیف میکند که هر گونه ناهمگنی طبقهبندی شده در جمعیت را نادیده میگیرد (لیندلی و نویک). نقل قول۱۹۸۱; هوکس نقل قول۲۰۱۰، ۳). به عنوان مثال، L. Xu et al. (نقل قول۲۰۱۱) از رکوردهای طاعون بوبونیک و سوابق آب و هوایی برای دوره ۱۸۵۰ تا ۱۹۶۴ استفاده کرد تا نشان دهد که شدت طاعون در چین تا زمانی که داده ها به نیمه شمالی و جنوبی کشور تقسیم نشده است، هیچ مدرک واضحی از ارتباط با سطح رطوبت ارائه نمی دهد. نموداری را بر اساس یک مجموعه داده برای کل کشور نشان می دهد، در حالی که داده ها را به شمال چین و چین جنوبی تقسیم کنید. L. Xu et al. (نقل قول۲۰۱۱) دریافتند که جوامع جوندگان ناقل طاعون به سطوح بالاتر بارندگی در شمال چین خشک در مقایسه با جنوب چین مرطوب واکنش متفاوتی نشان می دهند.
به طور مشابه، اگر جمعیت SSH بود، آنگاه هر مدل جهانی مبتنی بر ادغام مجموعههای داده، خطاهایی را در پیشبینی کل منطقه یا چند زیرحوزه ایجاد میکند بدون اینکه کاربر لزوماً بداند کدام زیرمجموعه هستند. در شماره ویژه ای از مجله منابع آب کاناداباتل و همکاران، بررسی اجمالی فرآیندهایی که باعث ایجاد سیل در کانادا می شوند. (نقل قول۲۰۱۶) گزارش کرد که یک مدل جهانی نمی تواند پیش بینی دقیق سیل را برای کل و مناطق مختلف کانادا که تحت رژیم های آب و هوایی مختلف قرار دارند ارائه دهد. فرآیندهای مختلف تولید سیل شامل سیل ناشی از ذوب برف، باران بر برف، و بارندگی و همچنین فرآیندهای سیلابهای زیرزمینی و سیل ناشی از موجهای طوفان، تجمع یخ و سیل شهری است.
دو چالش اصلی سوگیری و سردرگمی در آمارهای فضایی که قبلاً ذکر شد را نمیتوان بهطور خودکار با دادههای بزرگ و هوش مصنوعی حل کرد و در واقع میتوان آنها را به دلیل «پارادوکس کلان داده» بدتر کرد. نقل قول۲۰۱۸; لی و همکاران نقل قول۲۰۲۳). در واقع، اگر SSH قبل از مدلسازی شناسایی شده بود، میتوان آنها را سادهتر حل کرد. این اجازه می دهد تا آمار به صورت جداگانه در طبقات محاسبه شود تا از مخدوش نشدن یا با استفاده از Heckman (هکمن) جلوگیری شود. نقل قول۱۹۷۹) یا B-SHADE (JF Wang, Hu, et al. نقل قول۲۰۱۳; سی خو و همکاران. نقل قول۲۰۲۲) مواد و روش ها. اگر یک نظرسنجی ملی بزرگ انجام شود اما SSH در نظر گرفته نشود، اگر روابط در لایهها یکنواخت باشد، میتوان مشکلات فوق را با مدلهای سلسله مراتبی بیزی (BHMs) بررسی کرد، که به روش «اطلاعات وامگیری» اجازه میدهد که قبلاً اشاره شد (نگاه کنید به). ریپلی نقل قول۱۹۸۱، ۱۹-۲۷; دان و هریسون نقل قول۱۹۹۳; هاینینگ و لی نقل قول۲۰۲۰، فصل ۷ و ۸).
معادله ناهمگنی طبقه بندی شده فضایی
در این بخش، ما SSH () که سپس به شکل معادله نشان داده می شود. این امر بررسی آماری را که تابعی از (L، پ)، جایی که L نشان دهنده تعداد اقشار و پ شکل پارتیشن به طبقات را نشان می دهد.
طیف وسیعی از نقشه ها را نشان می دهد که مقادیر داده ها را با درجات مختلف ساختارهای فضایی نشان می دهد. نقشه ای را نشان می دهد که هیچ شواهدی از طبقه بندی را نشان نمی دهد. نقشهای را با درجات کوچکی از ساختارهای فضایی (برخی خودهمبستگی فضایی بین مقادیر همسایه) نشان میدهد، اما هنوز هیچ شواهدی از هرگونه طبقهبندی نشان نمیدهد. نقشه ای را با دو لایه کاملاً مشخص نشان می دهد که همگنی قوی را در هر یک از لایه ها نشان می دهد (تغییرات درون لایه ای کم یا بدون تغییر). یک نقشه “ناهمگن طبقه بندی شده ناقص” را به تصویر می کشد که در آن مقادیر داده ها به خوبی در فضا با برخی تغییرات درون لایه و خطوط مرزی (به رنگ قرمز) بین سه لایه ساختار یافته اند. اینها تا حدودی مبهم هستند – به نظر می رسد سه رژیم فضایی باشند، اگرچه موقعیت خطوط مرزی می تواند مورد بحث باشد. در عمل، محتمل ترین سناریو را نشان می دهد. پیوست به هر نقشه در یک مقدار تصوری از آن چیزی است که به آن می گویند q-statistic که اندازه گیری مناسبی از SSH را ارائه می دهد. ما در این مورد بحث می کنیم q-آمار بعدی
معادله ای برای جمعیت SSH
یک جمعیت SSH (فوق العاده) از طبقات (ساعت = ۱، …، L). ما فرض نمی کنیم که طبقه بندی شناخته شده است، به این معنی که این یک مشکل رگرسیونی نیست. بنابراین، ما همچنین نیاز به تخمین طبقه بندی در روش خود داریم. برای یک طبقه بندی معین، معادله SSH را می توان به صورت زیر بیان کرد:
(۱) (۱)
جایی که y = (y1, , yL)تی و yساعت = (yساعت۱, , )تی. ایکس = دیاگ(۱ن۱، , ۱NL) 1Nh هست Nh-بردار ستون بعدی با تمام اجزای آن برابر با ۱، β = (م۱، … مL)تی، و ه = (ه۱, , هL)تی با هساعت = (هساعت۱, , )تی. ایکس داده ها را به پارتیشن بندی می کند L اقشار در کدام قشر ساعت اندازه است نساعت و یک بردار عنصر yساعت و یک میانگین ساعت. اگر از رویکرد رگرسیون خطی استفاده شود (گجراتی و پورتر نقل قول۲۰۰۹، ۳۷)، سپس ایکس قابل تغییر نیست و به روز می شود. با این حال، در معادله SSH، اضافه کردن یا تغییر یک لایه نشان داده شده با ایکس مستلزم تغییر تعاریف برخی از اقشار است ایکس. ما داریم:
(۲a) (2a)
(۲b) (2b)
(۲c) (2c)
(۲d) (2d)
جایی که A = X(ایکستیایکس)âˆ'۱ایکس تی، ب = ۱(۱تی۱)âˆ'۱۱تی، و ۱ هست ن-بردار بعدی با تمام اجزاء برابر با ۱٫ داده شده است ایکس، SST، SSB، و SSW به ترتیب مجموع مجذورهای کل، مجموع مربعات بین طبقات و مجموع مربعات درون طبقات را نشان می دهد. توجه داشته باشید که آ â € ب یک ماتریس طرح ریزی متعامد است و tr(من â € آ) = ن â € L. معادلهمعادلات ۲b(2b) (2b) ، معادله۲c(2c) (2c) ، و معادله۲d(2d) (2d) فقط بر اساس یک طبقه بندی مشخص می توان استخراج کرد. برای شناسایی طبقه بندی واقعی، باید آنها را با هم ترکیب کنیم. این به ما انگیزه می دهد تا یک تابع برای SSH پیشنهاد کنیم.
یک تابع برای SSH
اندازه گیری SSH (JF Wang، Zhang و Fu نقل قول۲۰۱۶) را می توان تعمیم داد و به عنوان تابعی از L و پ بر اساس فرم ماتریس:
(۳) (3)
ما در اینجا به صراحت بیان می کنیم که q-آمار تابعی از تعداد اقشار است (L) و شکل پارتیشن خاص (پ) زیرا پارتیشن های زیادی وجود دارد که می توانند تولید کنند L اقشار. یک طبقه بندی بهینه را می توان با تعریف کرد
(۴) (۴)
یک تفاوت اساسی دیگر بین آر۲ برای رگرسیون خطی یا ضریب همبستگی بین طبقاتی (ICC) و ما q-تابع داده شده توسط معادلهمعادله ۳(۳) (3) آن است آر۲ یا ICC فرض می کند که پارتیشن داده شده است، اما در اینجا ما این فرض را نمی کنیم. نتیجه می شود که q-statistic یک غیر مرکزی دارد اف توزیع داده شده است ایکس (جی اف وانگ، ژانگ و فو نقل قول۲۰۱۶، در حالی که ICC از استاندارد مرکزی پیروی می کند اف توزیع (Snijders و Bosker نقل قول۲۰۱۱، ۴۶). را q تابع برای شناسایی SSH و برای تعیین اسناد برای SSH بدون نیاز به هیچ گونه فرض خطی استفاده می شود. این نیز با آر۲ و ICC برای مدل سازی چند سطحی. که در ، ما را نشان می دهیم q-تابع. برای تاکید ما آن قشر را نشان دادیم ساعت = ۱ در دو منطقه جغرافیایی مجزا ظاهر می شود. برچسب لایه به خوشه بندی آن (مثلاً نوع کاربری زمین) اشاره دارد، نه موقعیت مکانی آن. طبقه بندی یک متغیر Y قابل پارتیشن بندی یا توسط Y خود یا توسط یک متغیر توضیحی مشکوک ایکس (بعداً بحث خواهد شد)، بسته به هدف مطالعه. این نتیجه برای سایر اشکال طبقه بندی مانند زمانی که مقادیر داده ها موقتی هستند، صادق است.
را qتابع، برای هر داده شده است L و پ، یک مقدار در بازه می گیرد [۰, ۱]، جایی که ۰ نشان دهنده عدم تجانس طبقه بندی شده است. این نشان می دهد که هر یک از L طبقات دارای همان درجه ناهمگنی (داخلی) هستند که در کل نقشه یافت می شود (). یک ارزش از qتابع برابر با ۱ نشاندهنده همگنی کامل درون لایهای است (همه مقادیر دادهها در یک لایه یکسان هستند)، که به این معنی است که ناهمگونی مشاهده شده در کل نقشه به دلیل تفاوتهای بین L لایه ها برای پارتیشن داده شده ().
ارزیابی طبقه بندی های مختلف
شناسایی مناطق در قلب جغرافیای منطقهای سنتی و همچنین روش تحلیل دادههای معاصر مربوط به تعیین مرزها قرار دارد (به عنوان مثال، وومبلینگ؛ به Womble مراجعه کنید. نقل قول۱۹۵۱و اشکال مختلف خوشه بندی منطقه ای یا “منطقه سازی” (Longley et al. نقل قول۲۰۰۵، ۱۳۵; دوتیل نقل قول۲۰۱۱، ۲۰ تا ۲۱). از آنجایی که طبقه بندی ناشناخته است، ما می خواهیم یک استراتژی طبقه بندی برای ارائه حداقل مقدار تغییرات درون گروهی به طور همزمان با حداکثر مقدار تغییرات بین گروهی پیدا کنیم. مرز بین لایه ها ممکن است از قبل وجود داشته باشد، مانند نقشه های زمین شناسی و مناطق آب و هوایی، اگرچه می توان آنها را مجددا ارزیابی و با ابزارهای جدید تجدید نظر کرد. یا میتواند از طریق جستجو با استفاده از الگوریتمهای بهینه تعیین شود، یا طبق تنظیمات ArcGIS بر اساس فواصل مساوی تقسیم شود. انتخاب از بین رویکردها بر اساس زمینه مطالعه است. در مورد طبقه بندی کننده های فضایی (Haining نقل قول۲۰۰۳، ۲۰۱-۰۶)، تابع هدف در این روش ها معمولاً با ترکیب یک تابع همگن برای واریانس های درون گروهی و یک تابع فشردگی فضایی برای مکان های مختصات آنها ساخته می شود. را q-function را می توان به عنوان اولین این توابع در نظر گرفت. مزیت از q– آمار، همانطور که خواهیم دید، این است که می توان توزیع تهی را با یک توزیع استاندارد و شناخته شده متصل کرد، به طوری که بتوانیم به راحتی آن را استخراج کنیم. پ ارزش.
را q– آمار را می توان برای ارزیابی تجربی طبقه بندی های مختلف استفاده کرد (متفاوت L یا تغییر پارتیشن برای همان مقدار L) برای اینکه ببینید کدام یک بیشترین مقدار آمار را به دست می دهد. گرفتن موردی که در آن L ثابت است (ما در مورد تعداد لایه ها اطمینان داریم) و می خواهیم دو پارتیشن را با هم مقایسه کنیم P1 و P2 که بازده L لایه ها را محاسبه می کنیم:
(۵) (۵)
اگر (P1، P2) > 0 (< 0) سپس P1 (P2) یک پارتیشن درون لایه ای همگن تر از P2 (P1). زیرا (P1، P2) = = اهمیت آماری تفاوت بین دو پارتیشن را می توان توسط D(P1، P2). اگر P1 طبقه بندی واقعی است، پس می توان نشان داد که:
(۶) (6)
با
(۷) (۷)
(۸) (۸)
جایی که E و V به ترتیب انتظارات و واریانس را نشان می دهند. آ۱ و آ۲ هستند آ برای P1 و P2، به ترتیب؛ و ایکس۱ است ایکس برای یکی از پارتیشن ها P1، گفتن. اگرچه ممکن است پارتیشن های زیادی تولید شوند L طبقات، در عمل تعداد پارتیشن هایی که مقایسه را توجیه می کنند باید از نظر تعداد بسیار کمتر باشد.
عناصر فردی از q(L; پ)، SSWساعت، که مجموع مربع های درون لایه است ساعت و است L اصطلاحات در صورت کننده جمله دوم در تعریف q(L; پ) که در معادلهمعادله ۳(۳) (3) را می توان مقایسه کرد تا ببینیم کدام یک از این اقشار بیشترین ناهمگونی (intrastratum) را نشان می دهند. اقشاری که بیشترین سهم را در شمارشگر دارند ممکن است کاندیدای پارتیشن بندی بیشتر باشند – یعنی افزایش L. با این حال، مقایسه پارتیشنهایی که شامل تعداد لایههای مختلف است، مشکل دیگری را ایجاد میکند. یعنی نیاز به گنجاندن جریمه برای جلوگیری از طبقه بندی بیش از حد. این آرگومان مشابه چیزی است که هنگام انتخاب متغیرهای مستقل در یک مدل رگرسیونی مشاهده میشود که در آن معیار اطلاعاتی Akaike (AIC) برای مقایسه مدلهای مختلف استفاده میشود که امکان تفاوت در پیچیدگی مدل را فراهم میکند. یک مدل، A، با متغیرهای مستقل بیشتری نسبت به مدل دیگر، B، که در آن متغیرهای مستقل در B زیرمجموعهای از متغیرهای A را تشکیل میدهند، بهتر با دادهها تناسب دارند اما پیچیدهتر هستند و این باید برای زمانی که برازشهای مدل مقایسه میشوند مجاز باشد. در این مورد دو طبقه بندی با تعداد اقشار متفاوت شناسایی می شود. تخمین جریمهشده AIC بر اساس اطلاعات کمینهسازی کولبک – لایبلر بین دو تابع چگالی احتمال (PDF؛ Akaike نقل قول۱۹۷۴) ممکن است مستقیماً برای مقایسه دو طبقه بندی که از نظر تفاوت با هم متفاوت هستند استفاده نشود L. نشان می دهد که آمار فضایی برای تشخیص ترتیبات فضایی مختلف که دارای PDF حاشیه ای یا هیستوگرام یکسانی هستند ضروری است. در نتیجه، SSH های مختلف (اعم از پارتیشن ها یا تعداد لایه ها یا هر دو) می توانند AIC یکسانی را به اشتراک بگذارند. علاوه بر این، دادن SSH جمعیت (الگوهای متشکل از پیکسل های آبی و سفید در ، اثرات هر انتخاب مرز (خطوط قرمز در )، MAUP، توسط اندازه گیری می شوند q-آمار
SSH مشخصه یک جمعیت است (پس زمینه خاکستری در و و لایه زیرین ) که ابتدا توسط یک محقق یا تیمی از محققین شناسایی می شود که یک طبقه بندی بر داده ها اعمال می کنند (طبقه بندی شده با خطوط قرمز در ) و سپس توسط اندازه گیری می شود q(L، پ) آمار. بهترین طبقه بندی، طبقه بندی است که به طور دقیق SSH جمعیت را منعکس کند. در عمل، صدها الگوریتم برای کمک به یافتن بهترین طبقه بندی توسعه داده شده است. نحوه انتشار اطلاعات SSH از جمعیت SSH را نشان می دهد (q0 آ [۰, ۱]، ۰ اگر جمعیت iid باشد و ۱ برای SSH کامل) به طبقه بندی توسط محقق (Ψ ∈ [۰, ۱]، ۰ اگر SSH جمعیت به طور کامل نادیده گرفته شود و ۱ به طور کامل محاسبه شود)، که سپس با اندازه گیری می شود q. در اصل، q = Ψq0. موردی که q = ۱ نشان می دهد که جمعیت SSH کامل را نشان می دهد (q0 = 1)، که همچنین به طور کامل با طبقه بندی مشخص می شود (Ψ = ۱; طبقه بندی شده توسط خط ۱)؛ موردی که q = ۰ نشان دهنده iid بودن جمعیت است ( و ) یا اینکه جمعیت SSH طبقه بندی ضعیفی داشته است ( طبقه بندی شده توسط خط ۲). موردی که q مقدار بین ۰ و ۱ قرار دارد که نشان دهنده یک SSH بین دو حد بالا است ( طبقه بندی شده توسط خط ۱ یا خط ۲ یا هر دو).
یک جمعیت ممکن است از یک منظر SSH باشد اما از منظر دیگر نه. مثلا، SSH کامل را با دو لایه خاکستری و سفید نمایش می دهد، اما SSH را از منظر یک پهنه بندی جغرافیایی تقسیم شده توسط خط قرمز (q = ۰). گاهی اوقات، تفسیرپذیری یافتهها مهمتر از حداکثر کردن است q(L، پ). به عنوان مثال، در تجزیه و تحلیل تغییرات داده های اقتصادی، استانداردهای طبقه بندی (L، پ) مانند استاندارد سازمان ملل متحد برای سطوح تولید ناخالص داخلی سرانه، ممکن است برای انطباق با یک روش از قبل موجود انتخاب شود.
استنتاج تحت ناهمگونی طبقه بندی شده فضایی
در این بخش، نمونه هایی از تجزیه و تحلیل آماری زمانی که SSH در یک مجموعه داده وجود دارد، ارائه می دهیم.
آمار در لایه های همگن
هنگامی که یک پارتیشن به طبقات همگن تحت شرایطی که مشاهدات مستقل هستند ساخته شد، میتوان آمارهای مرسوم را برای استنتاج در مورد ویژگیهای درون لایهای به کار برد، همانطور که مثال قبلی نشان میدهد (نگاه کنید به ). از سوی دیگر، اگر مشاهدات درون لایهای SAC باشند، تکنیکهای آماری فضایی برای استنتاج درباره ویژگیهای درون لایهای مورد نیاز است. زیرا بسیاری از این آمارها به مشخصات یک ماتریس وزن (یا اتصال) بستگی دارد دبلیو (هینینگ و لی نقل قول۲۰۲۰، فصل ۴) برای روابط فضایی بین مشاهدات، این سوال مطرح می شود که چگونه می توان با مشاهدات نزدیک به مرز هر طبقه برخورد کرد. به منظور بهبود دقت آماری (مخصوصاً اگر یک قشر مشاهدات نسبتاً کمی داشته باشد)، ممکن است برخی از مشاهدات نمونه از «سمت دیگر» مرز لایه «قرض گرفتن» مناسب باشد. اگرچه این ممکن است برخی سوگیری ها را در برآوردگرهای پارامتر ایجاد کند، چنین رویکردی ممکن است توجیه شود، به ویژه در شرایطی که برخی از بخش های مرز یک لایه بیشتر شبیه مناطق انتقال هستند، حتی اگر سایر بخش های مرزی تغییر ناگهانی را نشان دهند. تلاش برای حل چنین سوالی این است که تخمین زدن ورودی های غیر صفر در دبلیو ماتریس (هینینگ و لی نقل قول۲۰۲۰، ۴٫۱۰ و ۸٫۴). کریجینگ با یک پنجره متحرک و رگرسیون وزندار جغرافیایی (GWR) گزینههای جایگزینی برای درونیابی فضایی برای نقاطی است که جمعیت SSH است. این دو رویکرد به طور بالقوه خطر خطای بزرگی در مرزهای SSH دارند، زیرا هر دو رویکرد مبتنی بر ترسیم نمونههای همسایه هستند. یانگ و همکاران (نقل قول۲۰۲۲) دو حوضه آب (دو لایه) را با هم ادغام کردند تا زمانی که SSH آنها برای کاهش خطاهای درون یابی خاک (Stein، Hoogerwerf و Bouma) ناچیز است، یک منطقه همگن تشکیل دهند. نقل قول۱۹۸۸).
هنگامی که توجه به توزیع فضایی برخی از پارامترها، Haining و Li (نقل قول۲۰۲۰، فصول ۷ و ۸) تعدادی BHM با وابستگی فضایی را تشریح کردند که تخمین هایی از یک پارامتر ناهمگن را ارائه می دهند. آنها کاربرد این روشها را برای نمونههای درآمد خانوار نیوکاسل آپون تاین، انگلستان در سطح منطقه ابر خروجی متوسط (MSOA) نشان میدهند. MSOA یک منطقه کوچک برای گزارش دادههای سرشماری بریتانیا است که با روش ما به عنوان یک لایه واحد در نظر گرفته میشود. نمونه ای از یک نظرسنجی ملی جمع آوری می شود به طوری که همه MSOA ها (قشرها) داده ندارند یا بسیاری از آنها فقط تعداد کمی مشاهدات دارند. فرض میشود که نمونههای درون هر لایه بهطور مشروط مستقل و به طور یکسان توزیع شدهاند، یعنی مشروط به فرآیند زیربنایی تولید دادهها. مجموعه ای از مقادیر پارامتر در سطح MSOA است که SAC هستند. این نرم افزار شامل مدل های خودرگرسیون مختلف برای گرفتن خودهمبستگی فضایی در توزیع فضایی پارامتر مورد علاقه (متوسط درآمد خانوار در سطح MSOA) است. مدل انتخاب شده، که در مدل قبلی BHM برای پارامتر مورد نظر مشخص شده است، منجر به اشتراک گذاری اطلاعات در سراسر MSOA ها می شود. BHM ها با استفاده از شبیه سازی مونت کارلو زنجیره مارکوف نصب شده اند. در اینجا نیز مانند سایر روشهایی که قبلاً توضیح داده شد، متغیرهای کمکی اضافی را میتوان در مدل گنجاند تا دقت برآوردها را بهبود بخشد.
درونیابی فضایی با SSH
درونیابی منطقهای اصطلاحی است که برای توصیف فرآیند انتقال دادهها از یک چارچوب مکانی (“منبع”) به یک چارچوب فضایی جدید (“هدف” یا “چارچوب گزارشدهی” استفاده میشود. برای مثال، به گودچایلد، آنسلین و دایچمن مراجعه کنید.نقل قول۱۹۹۳) هاینینگ (نقل قول۲۰۰۳، ۱۳۱-۳۸) و لین، زو و وانگ (نقل قول۲۰۲۳) برای یک مرور کلی. JF Wang، Haining، و همکاران. (نقل قول۲۰۱۳(). این روش تخمین هایی را برای هر منطقه هدف با برآورد واریانس خطا ارائه می دهد. ابتدا، جمعیت SSH به طبقات همگن (JF Wang، Haining و Cao) طبقه بندی می شود. نقل قول۲۰۱۰) و برآوردهای میانگین و واریانس برای هر یک از طبقات منبع به دست آمده است ({ساعت} که در ). سپس، جمعیت SSH مناطق منبع روی چارچوب منطقه هدف قرار میگیرد ({r} که در ). برآوردها برای مناطق هدف از مناطق منبع به نسبت میزان همپوشانی رخ می دهد. هر منطقه منبع منفرد می تواند در تخمین مناطق هدف چندگانه کمک کند. از این نظر، رویکرد ساندویچی بسته به گستره جغرافیایی و پیکربندی مناطق منبع نسبت به مناطق هدف، «قدرت» را از همه لایههای منبعی که با هر لایه هدف خاصی همپوشانی دارند، وام میگیرد. این روند قدرت استقراض ممکن است فقط به مناطق نزدیک محدود نشود. به شرطی که مقادیر نمونه در هر منطقه منبع وجود داشته باشد، روش را می توان بدون نیاز به تعلق آنها به داده های نمونه در یک واحد هدف اعمال کرد. با توجه به تعریف از q و نمونه گیری طبقه بندی شده، خطای کلی برآوردگر ساندویچ را می توان به راحتی بدست آورد: mse() = (۱ â €” q) (1 — ) جایی که n و ن مخفف تعداد واحدهای نمونه و جامعه به ترتیب و σ۲ واریانس است. واضح است که خطا صفر است اگر q = ۱ و در خطای میانگین نمونه جمع می شود اگر q = ۰٫
تعدادی از تکنیکها برای ساختن نقشههای توزیع فضایی برخی از SSH پیشنهاد شدهاند ویژگی های (به عنوان مثال، دمای هوای سالانه بر اساس مناطق آب و هوایی) بر اساس یک نمونه از مشاهدات SAC. میانگین سطح با ناهمگنی (MSN)، تخمینگر بیماری ناحیه بیمارستان نگهبان بایاس (B-SHADE)، و تخمینگر ناحیه تک نقطهای (SPA) کریجینگ و نمونهبرداری طبقهای را ترکیب میکنند تا استنتاجهایی را به دست آورند که بهترین بیطرفداری خطی (BLUE) است. MSN زمانی قابل استفاده است که همه اقشار دارای نمونه باشند (JF Wang، Christakos و Hu نقل قول۲۰۰۹; هو و وانگ نقل قول۲۰۱۱; گائو و همکاران نقل قول۲۰۱۵). اگر SSH وجود نداشته باشد برآوردگر به کریجینگ کاهش مییابد یا به تخمینگر ساندویچ (JF Wang, Haining, et al. نقل قول۲۰۱۳) اگر SAC وجود نداشته باشد. هنگامی که برخی از اقشار هیچ مشاهده ای ندارند، از B-SHADE می توان برای پیش بینی فضایی با نسبت بین یک نمونه و جامعه استفاده کرد. این نسبت را می توان با استفاده از متغیر کمکی تخمین زد. برای مثال، نسبت در سالهای اولیه که تعداد ایستگاهها کم است را میتوان با مشاهدات ایستگاههای هواشناسی امروزی برای تعدیل سوگیری نمونه تخمین زد (JF Wang et al. نقل قول۲۰۱۱; هو و همکاران نقل قول۲۰۱۳; سی دی خو، وانگ و لی نقل قول۲۰۱۸). اگر همه اقشار نمونه داشته باشند، B-SHADE به MSN کاهش می یابد. هنگامی که تنها یک واحد نمونه در دسترس باشد، SPA با استفاده از یک رابطه قبلی که بین متغیر هدف (مانند PM2.5) و یک متغیر کمکی (مثلا PM10) که در همه لایهها مشاهده شده است (JF) شناسایی شده است، میانگین مساحتی را تخمین میزند. وانگ، هو و همکاران نقل قول۲۰۱۳).
علیت فضایی
ایجاد ارتباط علت و معلولی بین متغیرها یک علاقه اصلی برای محققان علمی است (انیشتین نقل قول۱۹۵۳)، شامل هر دو علت قطعی و تصادفی (Christakos نقل قول۲۰۱۲). با علیت تصادفی فضایی استنتاج شده از ویژگی های فضایی، کریستاکوس (نقل قول۲۰۱۲) این اصطلاح را ابداع کرد علیت تصادفی برای اشاره به موردی که اگر اتفاقی در مکان A رخ دهد، آنگاه چیزی مرتبط در مکان B با احتمال خاصی اتفاق میافتد، جایی که B ممکن است از نظر مکانی با A منطبق باشد یا نباشد. استنتاج علیت مبتنی بر مداخله دوتایی یا عدم مداخله در آزمایشهای طبیعی (ایمبنس و روبین نقل قول۲۰۱۵; مروارید و مکنزی نقل قول۲۰۱۸و با استفاده از داده های SAC (Gao et al. نقل قول۲۰۲۳) به ترتیب توسعه یافتند.
الگوهای فضایی ممکن است بینشی در مورد علیت ارائه دهند. برف (نقل قول۱۸۵۴) ارتباط بین مکان های مسکونی مرگ و میر افراد در اثر وبا و مکان های پمپ های خیابان براد را ترسیم کرد که مردم ساکن در این منطقه آب مورد نیاز خود را از آن تامین می کردند. وی مشاهده کرد که با افزایش فاصله از پمپ، تعداد مرگ و میر ناشی از وبا کاهش می یابد.). یک داستان جدیدتر از علیت فضایی، شناسایی بازار غذاهای دریایی به عنوان منبع احتمالی COVID-19 در شهر ووهان چین است. این امر با توجه به این که مرکز انبوه پرونده ها به جای شهروندان در یک شهر، به طور قابل توجهی به بازار نزدیکتر است، انجام شد. پشتیبانی دوم این است که نقشه هات اسپات موارد دقیقاً با موقعیت بازار مطابقت دارد. حمایت سوم این است که دایره در مرکز بازار، با شعاع مساوی با فاصله میانه بین کیس ها و بازار، بسیار کوچکتر از دایره متمرکز در بازار با شعاع مساوی با فاصله متوسط بین جمعیت انسانی تا بازار (Worobey et al. نقل قول۲۰۲۲).
اصل ما این است که اگر ایکس علل Yسپس الگوهای فضایی آنها (ناهمگونیهای طبقهبندیشده فضایی) علاوه بر نمایش یک همبستگی قابلتوجه پیرسون، تمایل به جفت شدن دارند. نسخه ای از تابع q(L; پ) می تواند برای بررسی جفت استفاده شود، همانطور که در اشاره شده است . که در توجه می کنیم که پارتیشن، پ، را می توان بر حسب مقادیر مشاهده شده مشخص کرد Y، که متغیری است که باید برای ناهمگنی طبقه بندی شده آزمایش شود، یا می توان آن را بر اساس یک متغیر توضیحی مشکوک مشخص کرد، مثلا ایکس. برای اینکه مشخص شود کدام متغیر برای ساخت پارتیشن استفاده می شود، می توانیم بنویسیم q(L; Px) زمانی که پارتیشن بر اساس یک متغیر است ایکس. این متغیر، ایکس، ممکن است مقوله ای باشد، مانند نوع کاربری زمین، یا کمی با ویژگی هایی که مقادیر ایکس در هر یک از ایکساقشار تعریف شده مشابه هستند اما بین اقشار فاصله دارند. فرض کنید که بتوانیم یک پارتیشن را مشخص کنیم، Px، از یک متغیر کمی ایکس. مقدار میانگین از ایکس در یک لایه واحد سطح را تعریف می کند ایکس در آن قشر و تمام مقادیر مشاهده شده از ایکس در همان قشر مشابه هستند. در صورت وجود علیت بین Y و ایکس در سراسر طبقات و سپس مقدار تابع، آن را فراخوانی کنید q(L; Px) محاسبه شده است Y تمایل به بزرگ (نزدیک به ۱) خواهد داشت. از طرفی اگر بین علیت وجود نداشته باشد Y و ایکس، ارزش q(L; Px) محاسبه شده است Y تمایل به کوچک (نزدیک به ۰) خواهد داشت. این به این دلیل است که اگر ایکس علل Y سپس، در داخل اقشار، باید انتظار داشته باشیم Y همگن بودن در اقشار ایکس. به عبارت دیگر، الگوهای فضایی آنها، که توسط طبقه بندی ها (L; Px، تمایل به جفت شدن دارند. درجه سازگاری را می توان با اندازه گیری کرد q(L; Px) از y.
مطابقت بین دو شکل جغرافیایی ممکن است نشان دهنده یک ارتباط علی باشد (Sugihara et al. نقل قول۲۰۱۲). شکلهای گرافیکی مختلفی را نشان میدهد که میتواند حاکی از علیت فضایی باشد. یک نمودار پراکندگی خطی را نشان می دهد که ارتباط بین دو متغیر را نشان می دهد، داده هایی برای آنها در یک مکان جغرافیایی با مقادیر بزرگتر ثبت شده است. ایکس مرتبط با مقادیر بزرگتر از Y. ضریب همبستگی پیرسون ۰٫۷ است که شواهد آماری یک ارتباط را ارائه می دهد. دو نمودار سری زمانی را نشان می دهد که ۵۰۰ سال در یک مکان جغرافیایی را پوشش می دهد. ضریب همبستگی پیرسون بین دو متغیر ۰٫۷ است، اما علاوه بر این دو سری زمانی در دراز مدت یک شکل را حفظ می کنند. محاسبه همبستگی پیرسون که به تاخیرهای زمانی مختلف (تغییرهای زمانی) در دو سری زمانی اجازه می دهد می تواند زمان پاسخ را در رابطه نشان دهد. ژانگ و همکاران (نقل قول۲۰۰۷) استنباط کرد که تغییرات دمای نیمکره شمالی بر تولید کشاورزی در چین تأثیر می گذارد. برگشت ناپذیری پیکان زمانی اغلب در تعیین ماهیت هر رابطه علی مهم است (Runge et al. نقل قول۲۰۲۳). با همان خط فکری، ارتباط بین دو الگوی فضایی ساکن ()، به خصوص زمانی که اشکال پیچیده هستند، می تواند دلالت بر یک علیت تصادفی بین دو متغیر فضایی داشته باشد (، ). از آنجا که مکان (برخلاف زمان) جهت دار نیست، ماهیت هر علیت ممکن است نیاز به دانش بیرونی و مبتنی بر نظم داشته باشد، در غیر این صورت تداعی در بهترین حالت توصیفی از «اینجا و اکنون» است. به همین دلیل است که می تواند برای تجزیه و تحلیل فضا-زمان و نه صرفاً داده های مکانی بسیار ارزشمند است.
تعامل عمومی بین متغیرها
از آنجایی که متغیرهای توضیحی بیشتری در هر تحلیلی وارد می شوند، باید به نحوه تعامل متغیرها برای تأثیرگذاری بر نتیجه توجه شود.Y). در مورد دو متغیر توضیحی، ایکس۱ و ایکس۲، ما می توانیم نقشه هایی بسازیم که تعامل اساسی بین آنها را منعکس می کند (ایکس۱ ∩ ایکس۲) همانطور که در نشان داده شده است . تعاملات شامل، اما نه محدود به، ارتباط تعامل محصول مورد مطالعه در اقتصاد سنجی است (گجراتی و پورتر نقل قول۲۰۰۹، ۲۶۳، ۲۸۷، ۴۷۰). علاوه بر این، با مقایسه مقادیر q(ایکس۱) q(ایکس۲) و q(ایکس۱∩ایکس۲) می توان شروع به بررسی چگونگی تعامل بین کرد ایکس۱ و ایکس۲ ممکن است با تغییرات خطی یا غیرخطی در سطح مرتبط باشد Y. لو و همکاران (نقل قول۲۰۱۶) تعامل بین عوامل تعیین کننده تکه تکه شدن چشم انداز در ایالات متحده را بررسی کرد. B. Xu et al. (نقل قول۲۰۲۱) تعامل کلی بین شاخص های هواشناسی و شیوع ویروس های تنفسی در چین را بررسی کرد.
خوبی فضایی تناسب
یین و همکاران (نقل قول۲۰۱۹) یک شاخص جدید به نام حداکثر دمای مکرر (MFT) برای توضیح دمای حداقل مرگ و میر (MMT) در سطح جهانی ایجاد کرد. ضریب پیرسون بین MMT و MFT بسیار بزرگتر از ضریب بین MMT و دو شاخص رایج دیگر است.). علاوه بر این، q مقادیر با این پیشنهاد محاسبه می شوند که MFT از نظر مکانی بهتر از متغیرهای باقی مانده در نظر گرفته شده با MMT مطابقت دارد. هر دو آمار استفاده از MFT را برای توضیح MMT توصیه می کنند.
ژئودیتکتور q +
q به راحتی با روش های دیگر ادغام می شود تا ظرفیت های آنها افزایش یابد. نمونه ها هستند q + کریجینگ برای تهیه نقشه آلودگی خاک (یانگ و همکاران نقل قول۲۰۲۲) q + GWR برای بررسی خشکسالی (Ji et al. نقل قول۲۰۲۲) q + InSAR برای شناسایی تغییر شکل زمین (چن و همکاران. نقل قول۲۰۲۲) q + موتور Google Earth برای مطالعه تغییرات کاربری زمین (Liu et al. نقل قول۲۰۲۱) q + SWAT برای ارزیابی عملکردهای حفاظت از آب (یو، وانگ و لیو نقل قول۲۰۲۰) q + BHM برای مدل سازی نقطه مورد علاقه نشاط شهری (Z. Wang et al. نقل قول۲۰۲۲) و q + یادگیری عمیق نقشه برداری تاج درخت (Guo et al. نقل قول۲۰۲۳). برای مثال های بیشتر لطفا به ادامه مطلب مراجعه کنید www.geodetector.cn.
طرح SSH
اگر ایکس یک متغیر کمی است، سپس یک نمودار دو متغیره از میانگین ایکس در برابر ابزار مربوطه از Y بر اساس طبقات، شکل هر ارتباطی را نشان می دهد که نیازی به خطی نیست. توجه داشته باشید که برای دو مقدار از q(L; Px) با یک محاسبه شده در Y و دیگری در ایکس اما با Px برای هر دو مورد، یک فرمت مورد نیاز است تا مشخص شود کدام یک از این دو متغیر در لایه ها همگن تر است. اجزای تشکیل دهنده را تجزیه می کند q– زمانی که هدف مقایسه دو متغیر است (ایکس و Y). ما فرض می کنیم که طبقه بندی نقشه بر اساس تغییرات مکانی در متغیر به دست آمده است ایکس (نه Y). هر دایره در نمودار پراکندگی به یک واحد اشاره دارد ایکس– قشر تعریف شده مرکز هر دایره در نمودار پراکندگی با مقادیر میانگین تعریف می شود Y و ایکس به ترتیب در آن قشر. اندازه هر دایره متناسب با اندازه لایه (از نظر اندازه جمعیت یا وسعت منطقه) است تا وزن بصری را به اقشار بزرگتر بدهد. با این حال، سایه هر دایره (برای لایه ساعت) بر اساس qساعت = ۱ — [Ïh2/Ï۲] بر روی متغیر محاسبه می شود Y. هرچه سایه تیره تر باشد، واریانس درون لایه کوچکتر است Y (واریانس درون لایه روی ایکس از نظر ساخت کوچک است) است. ما می توانیم این طرح را بیشتر اصلاح کنیم. اگر هر قشر ساعت شامل چندین منطقه جغرافیایی گسسته است (نگاه کنید به ، سپس دایره های متعدد برای لایه ساعت را می توان با یکی برای هر ناحیه گسسته تفکیک کرد. این ممکن است نشان دهد که مناطق بزرگ و به طور گسترده از نظر جغرافیایی پراکنده هستند. اگر هر ناحیه جغرافیایی گسسته بسیار کوچک باشد، ممکن است انجام این کار نامطلوب باشد، در نتیجه مشکل عدد کوچک را به وجود می آورد (به عنوان مثال، هاینینگ و لی را ببینید. نقل قول۲۰۲۰، ۸۱).
مطالعات تجربی
در این بخش، دو مطالعه تجربی در اپیدمیولوژی جغرافیایی (یا فضایی) را مرور میکنیم که حضور SSH مسائل روششناختی را مطرح میکند.
به دست آوردن نقشه ای از بروز سرطان سینه با استفاده از داده های نمونه: مقایسه ساندویچ و کریجینگ (مرکز ملی سرطان چین) نقل قول۲۰۱۹)
میزان مرگ و میر ناشی از سرطان سینه در بیش از ۲۷۰۰ شهرستان چین در سال ۱۹۹۲ از مرکز کنترل بیماری های چین (CDC) جمع آوری شد. ). موران من تست همبستگی مکانی (با استفاده از چهار نزدیکترین شهرستان به عنوان همسایه هنگام تعیین دبلیو ماتریس) مقدار ۰٫۱۹۵ (پ = ۰٫۰۰۱). محاسبه کردیم q برای هشت پارتیشن مختلف (L = ۳، ۴، …، ۱۰ طبقه) از داده های مرگ و میر سرطان سینه و تقسیم بندی بر اساس انتخاب مقدار زیادی از q ضمن محدود کردن تعداد پارتیشن ها (L). ما طبقه بندی را انتخاب کردیم (L = ۵)، که منجر به اولین مقدار قابل توجه از q در سطح ۱ درصد (q = ۰٫۶۳۸۱ با پ < 0.01) در حالی که برای افزایش مقادیر L (دیدن ). همانطور که ما از L = ۴ به L = ۵، q 0.074 (از ۰٫۵۶۴ به ۰٫۶۳۸) و از پ مقدار ۰٫۰۲۹ (در سطح ۱ درصد معنی دار نیست) به a پ-مقدار ۰٫۰۰۷ (در سطح ۱ درصد قابل توجه است). در سطح بعدی طبقه بندی از L = ۵ تا L = ۶، بهبود در L (که طبق تعریف باید اتفاق بیفتد) کمتر از زمانی است که هنگام حرکت از چهار به پنج طبقه (۰٫۰۶۱ در مقایسه با ۰٫۰۷۴) اتفاق افتاده است، که نشان دهنده کاهش اندازه بهبود نسبت به بهبود هنگام حرکت از L = ۴ به L = ۵٫ ما هنگام تلاش برای دستیابی به اهمیت آماری به طور ضمنی از معیار سادگی استفاده می کنیم. q با کوچکتر L، مشکلی که بعداً دوباره در مورد آن صحبت خواهیم کرد. این دو آمار (Moran’s من و q-function) نشان می دهد که داده های مرگ و میر سرطان پستان هم همبستگی فضایی و هم SSH را در پشتیبانی شهرستان نشان می دهد.
روش ساندویچ مبتنی بر SSH از داده های مرگ و میر شصت و چهار شهرستان نمونه استفاده کرد (نگاه کنید به ) برای ایجاد یک نقشه در سطح شهرستان از مرگ و میر سرطان پستان برای تمام شهرستان های چین در سال ۱۹۹۲ (). نتایج به دست آمده با این روش و توسط کریجینگ () با میزان مرگ و میر شناخته شده از پایگاه داده CDC مقایسه شد. اعتبار سنجی یکباره آر۲ به دست آمده از نقشه ساندویچ ۰٫۷۰۵ است، در حالی که برای Kriging این مقدار ۰٫۵۳۲ است. در این مورد و در نتیجه توسط آر۲ معیار، نقشه برداری ساندویچی بهتر از Kriging عمل می کند. مکانیسم پشت یافتههای آماری میتواند این باشد که سرطان پستان (جمعیت) SSH بیشتری نسبت به SAC نشان میدهد، که شاید از نظر اپیدمیولوژیک نشان دهنده SSH بین مناطق شهری و روستایی باشد. بنابراین، یک برآوردگر مبتنی بر SSH از نظر تئوری مناسبتر از یک برآوردگر مبتنی بر SAC در این مورد است. جدای از بسیاری از واحدهای گزارش دهی متفاوتی که میتوانستند از نمونه اصلی ارائه شوند، روش ساندویچ دارای شایستگی خاصی است که مفروضات مدلسازی ساده را همراه با استفاده کامل از دادههای نمونه از طریق طبقهبندی به جای استفاده از مقادیر دادههای نزدیکترین همسایه به عنوان مثال، دارد. در مورد کریجینگ شواهد این مثال نشان می دهد که روش ساندویچ عملکرد خوبی دارد. هنگامی که متغیر SSH را نشان می دهد، از Kriging بهتر عمل می کند. به وضوح نیاز به کار بیشتری برای تعیین اینکه آیا این ویژگی به طور کلی تر است یا خیر، به ویژه در مواردی که روش های کریجینگ، توسعه یافته برای سطوح ناهمگن، اجرا شده است، نیاز دارد.
انتساب فضایی نقایص لوله عصبی در شهرستان هشون
ما یافتههای خود از یک پروژه آزمایشی را خلاصه میکنیم که عوامل مرتبط با توزیع جغرافیایی موارد نقص لوله عصبی (NTDs) را در شهرستان هشون، استان شانشی بررسی میکند (JF Wang، Li، و همکاران). نقل قول۲۰۱۰). این منطقه با یکی از بالاترین نرخ های بروز NTD در چین است. عوامل (ایکس) تصور می شود که مسئول تغییر در بروز NTD است (Y) شامل محیط فیزیکی، آلودگی های انسان ساز و تغذیه است. عوامل (ایکس) هم در سطح اسمی و هم در سطح کمی اندازه گیری می شوند و SSH را نشان می دهند (نگاه کنید به ). را q-تابع (برای بررسی ارتباط فضایی بین بروز NTD و عوامل مشکوک استفاده شد (ایکس). روش بررسی ارتباط بین الف Y و هر خاص ایکس به شرح زیر است. اول، نقشه برای انتخاب شده است ایکس طبقه بندی شده است Px. دوم، نقشه برای y روی نقشه طبقه بندی شده پوشانده شده است Px از برگزیده ایکس. در نهایت، داده ها در y برای محاسبه استفاده می شود q(L، Px). نرم افزار برای محاسبه q در دسترس است www.geodetector.cn.
ارائه می کند qپراکندگی تابعی بین بروز NTD (Y) و ارتفاع (ایکس)، نماینده یکی از عوامل مشکوک. Scatterplot اطلاعات SSH داده ها را به تصویر می کشد. به عنوان مثال، میزان بروز NTD در ارتفاع ۱۳۰۰ € ‰m زیاد است (۶٫۹ درصد) اما همانطور که با رنگ سفید دایره نشان داده می شود بسیار متغیر است. علاوه بر این، سطح لایه ای که این داده ها به آن اشاره می کنند کوچک است (همانطور که با اندازه دایره نشان داده می شود). چهار دایره تاریک در نمودار نشان دهنده ارتفاعات است که در آن بروز NTD بسیار متغیر نیست اما هیچ مدرکی دال بر یک رابطه خطی ساده بین بروز NTD و ارتفاع وجود ندارد.
ارائه می کند q-عملکرد بین بروز NTD (Y) و سه مورد از عوامل مشکوک تعیین کننده (Xs). این مطالعه نشان داد که برخی از عوامل محیطی (نوع حوضه و ارتفاع، اما نه نوع خاک) به طور قابل توجهی با تنوع در وقوع NTD در منطقه مرتبط است. معمولاً کیفیت آب و محیط شیمیایی زمین شناسی در داخل حوضه های آبخیز بیشتر از بین حوزه ها مشابه است. عوامل غیر محیطی (در اینجا گزارش نشده است) در درجه دوم اهمیت قرار داشتند. این یافتهها برای شناسایی این که چه روشهایی برای مداخله بیماری در منطقه مناسبتر است مفید بودند (به JF Wang، Li، و همکاران مراجعه کنید. نقل قول۲۰۱۰).
در هر دو مثال و در چندین بخش قبلی، نتایج آماری به مقیاس (اندازه) یا تقسیمبندی مرتبط با واحدهای گزارشگر (که به آن MAUP، Openshaw گفته میشود، بستگی دارد. نقل قول۱۹۸۴; Ge و همکاران نقل قول۲۰۱۹). این یک مسئله بومی در تحلیل فضایی هنگام کار با واحدهای منطقه است. به طور معمول، روشهایی که در اینجا توضیح داده میشوند، به نظر نمیرسد که منجر به اثرات مقیاس اضافی یا قابل توجهی شوند، زیرا خود واحدهای گزارشدهنده تحت تأثیر قرار نگرفتهاند (به استثنای برخی از کاربردهای روش ساندویچ که ممکن است برخی از مناطق منبع تقسیم شده و به دو قسمت تقسیم شوند. یا مناطق هدف بیشتری). ایجاد زیر مجموعه های همگن، با این حال، لایه دیگری از افکت پارتیشن را اضافه می کند. به همین دلیل است که تشخیص و توجیه حضور ناهمگونی فضایی با اجرای روششناسی مربوطه برای شناسایی زیرمجموعههای همگن همانطور که قبلاً توضیح داده شد و در ادامه بیشتر مورد بحث قرار گرفت، مهم است.
بحث و نتایج
SSH زمانی رایج است که داده ها یک منطقه جغرافیایی بزرگ را پوشش می دهند یا در جایی که داده ها با وضوح بالا هستند. مشکلات ناشی از SSHy برای آمارهایی که فرض می کنند همگنی را می توان حل کرد یا حداقل کاهش داد اگر ساختار ناهمگنی را بتوان شناسایی کرد، به طوری که نقشه را می توان به زیرجمعیت های همگن تقسیم کرد. اگر مشاهدات مستقل باشند، می توان از روش های آماری مرسوم (iid) در هر طبقه استفاده کرد و اگر مشاهدات SAC باشند، باید از روش های آماری مکانی استفاده کرد. اگر بتوان ساختار SSH را شناسایی کرد، میتوان از آن برای طراحی طرحهای نمونهگیری نیز استفاده کرد که به ترسیم یک نمونه نماینده که پوشش لایههای مختلف را ارائه میدهد و سوگیری برآوردگر را کاهش میدهد، کمک میکند.
شناسایی SSH فرصتی برای درون یابی فضایی زمانی که SAC وجود ندارد یا ضعیف است، ارائه می دهد. علاوه بر ارائه معیاری از SSH، qتابع را می توان برای کشف ارتباط غیرخطی بین الگوهای فضایی دو متغیر مورد استفاده قرار داد و همانطور که قبلاً بحث شد معنای فیزیکی واضحی دارد. ابزارهایی را خلاصه می کند که اغلب برای داده های نشان دادن حالات مختلف (حضور – عدم وجود) SSH و SAC استفاده می شوند.
اگرچه در زمینههای تحقیقاتی خاص، SSH با الگوریتمهای متعدد توسعهیافته برای خوشهبندی فضایی بومی است، اما توجهی که سایر ویژگیهای خاص دادههای مکانی دریافت کردهاند، به آن توجه نشده است. توسعه آمار برای SSH به جعبه ابزار تکنیک های تحلیل فضایی اکتشافی، در کنار تکنیک هایی برای کاوش داده هایی که SAC هستند (Anselin) اضافه می کند. نقل قول۱۹۹۵).
کرسی (نقل قول۱۹۹۳اشاره کرد، «اینکه فردی انتخاب کند که تغییرات فضایی را از طریق ساختار میانگین (غیر تصادفی) (به نام تغییرات مقیاس بزرگ) یا ساختار وابستگی تصادفی (به نام تنوع مقیاس کوچک) مدلسازی کند، به مشکل علمی اساسی بستگی دارد و گاهی اوقات میتواند صرفاً یک مبادله بین تناسب مدل و صرفه جویی در توصیف مدل باشد. آنچه ساختار کوواریانس (فضایی) یک فرد است ممکن است ساختار متوسط فرد دیگر باشد.â € (۲۵). این اظهار نظر به رابطه بین ویژگیهای ناهمگنی و خودهمبستگی فضایی و نحوه استفاده از آن در جریان تجزیه و تحلیل دادهها (اتکینسون و تیت) مربوط میشود. نقل قول۲۰۰۰). به عنوان مثال، رفتار شاخصهای محلی تداعی فضایی (LISA)، آمار Ord Getis و GWR، همه آمارهای اکتشافی، میتواند منعکس کننده همبستگی مکانی محلی باشد (Anselin نقل قول۱۹۹۵; سوئی نقل قول۲۰۰۶، ۴۹۴) یا ناهمگونی فضایی (Goodchild and Haining نقل قول۲۰۰۴; آنسلین نقل قول۲۰۰۶). نیم متغیری که در زمین آمار به خوبی شناخته شده است، زیربنای کریجینگ است. این یک روش درونیابی است که بر اساس ویژگی های خودهمبستگی فضایی مجموعه ای از داده ها است. این روش همچنین می تواند برای شناسایی ناهمگونی فضایی به کار رود (نگاه کنید به Isaaks و Srivastava نقل قول۱۹۸۹، ۲۲۳-۲۴ و ; ۲۹۲ و همچنین در مورد استفاده از همبستگی در کریجینگ بحث کنید). دو مفهوم، ناهمگونی فضایی و خودهمبستگی مکانی، ویژگی های متمایز و مجزای داده های مکانی را منعکس نمی کنند. به تعبیر کرسی، «ناهمگونی یک فرد در میانگین ممکن است خود همبستگی فضایی محلی یا جهانی فرد دیگر باشد.» با این حال، یکی از نکات اصلی این مقاله این بود که استدلال کنیم که SSH ممکن است، به عنوان در مثالهای ارائهشده در اینجا، با مسئله علمی تطبیق بهتری دارد و یک مبادله رضایتبخش بین تناسب مدل و پیچیدگی مدل ارائه میکند.
SSH یک فرصت مهم برای تشخیص علیت فضایی و برای تعامل کلی ارائه می دهد. چه زمانی Y به صورت غیر یکنواخت مرتبط است ایکس، مدل سازی در سطح جهانی ممکن است گیج شود (کریستاکوس و همکاران. نقل قول۲۰۱۷; و ، در حالی که یک مدل محلی ممکن است بیش از حد مناسب باشد و روندهای جمعیت را نادیده بگیرد (). در واقع، یک راه حل ساده برای آشفتگی، تقسیم جمعیت به طبقات همگن است.) به گونه ای که می توان طبقات را مدلسازی کرد و روندهای اقشار را به ترتیب، همانطور که قبلاً پیشنهاد شد، پس رفت. یک مزیت بیشتر از تایید SSH از ترکیب آن ها ناشی می شود SSW و SST آمار مانند ژئودیتکتور q-تابع (به طوری که ارتباط غیر یکنواخت بین دو متغیر قابل بررسی باشد () که ممکن است با مدلسازی خطی مرسوم رد شود.
به عنوان یک ابزار جدید برای تجزیه و تحلیل SSH، ما معتقدیم که دو موضوع مربوط به q-عملکرد نیاز به بررسی بیشتر دارد. اول، ارزش q(L، پ) هم به تعداد طبقات و هم به ساختار فضایی طبقه بندی بستگی دارد. در برخی شرایط ممکن است تعداد زیادی طبقه بندی قابل قبول وجود داشته باشد (از نظر هر دو L و پ) و روشهای کارآمدی برای مقایسه آنها مورد نیاز است. در ارتباط نزدیک با این نکته، تصمیم گیری در مورد تعداد اقشار برای به کارگیری شامل یک مبادله بین پیچیدگی (تعداد اقشار) و سطح همگنی درون لایه ای است که قبلاً بحث شد. (چگونه می توانیم مطمئن باشیم که بهترین را انتخاب کرده ایم L و پ? آیا فقط باید یک تصمیم آماری باشد؟ برای انتخاب نهایی چقدر باید از دانش اساسی استفاده کرد و نتایج ما چقدر نسبت به انتخاب شده حساس است L و پ?) مطابق با اشکال دیگر تصمیم گیری آماری، یک آمار AIC می تواند راهی را برای رسمی کردن این مبادله، همانطور که قبلاً پیشنهاد شد، ارائه دهد، اما برای ارزیابی این امر به کار بیشتری نیاز است زیرا AIC به طور مستقیم قابل اجرا نیست. دلیل آن این است که PDF که AIC بر اساس آن است، بر روی یک نگاشت یک به یک با توزیع فضایی که q-تابع مبتنی است. به عنوان مثال، توزیع های فضایی مختلف (طبقه بندی) ممکن است PDF یکسانی را به اشتراک بگذارند. دوم، اگرچه خودهمبستگی مکانی و SSH دو ویژگی مهم داده های مکانی هستند، روابط بین آنها و تأثیر یکی بر دیگری در انجام تجزیه و تحلیل داده های مکانی نیاز به بررسی بیشتر دارد. با وجود این نگرانی ها، چند قانون کلی وجود دارد که باید در انتخاب مفید باشد (ال، پی) همانطور که در این مقاله نشان دادیم.
بیانیه افشا
هیچ تضاد منافع احتمالی توسط نویسندگان گزارش نشده است.
بیانیه تصحیح
این مقاله با تغییرات جزئی اصلاح شده است. این تغییرات بر محتوای علمی مقاله تأثیری ندارد.
اطلاعات تکمیلی
منابع مالی
یادداشت هایی در مورد مشارکت کنندگان
جین فنگ وانگ
JINFENG WANG استاد آزمایشگاه کلید دولتی منابع و سیستم اطلاعات محیطی، موسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین، و در دانشگاه آکادمی علوم چین، پکن، چین است. پست الکترونیک: wangjf@Lreis.ac.cn. علاقه پژوهشی اولیه او روششناسی برای نمونهگیری فضایی و استنتاج آماری با کاربرد در تحقیقات سلامت است.
رابرت هاینینگ
رابرت هاینینگ، استاد بازنشسته در گروه جغرافیا در دانشگاه کمبریج، کمبریج CB2 3EN، انگلستان است. پست الکترونیک: rph26@cam.ac.uk. علاقه پژوهشی اولیه او روششناسی برای تجزیه و تحلیل دادههای مکانی با کاربردها در تحقیقات خدمات سلامت و جغرافیای جرم است.
تونگلین ژانگ
تونگلین ژانگ دانشیار دپارتمان آمار، دانشگاه پردو، لافایت، IN 47907، ایالات متحده آمریکا است. پست الکترونیک: tlzhang@purdue.edu. علایق پژوهشی او روش شناسی آمار ریاضی و اپیدمیولوژی فضایی است.
چنگدونگ خو
CHENGDONG XU دانشیار آزمایشگاه کلیدی ایالتی منابع و سیستم اطلاعات محیطی، موسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: xucd@Lreis.ac.cn. علاقه پژوهشی او علم GIS است.
مائوگی هو
MAOGUI HU دانشیار آزمایشگاه کلیدی ایالتی منابع و سیستم اطلاعات محیطی، مؤسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: humg@Lreis.ac.cn. علاقه اولیه تحقیقاتی او آمار فضایی با کاربرد در تحقیقات بهداشتی است.
کیان یین
QIAN YIN دانشیار آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، مؤسسه تحقیقات علوم جغرافیایی و منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: yinq@Lreis.ac.cn. علاقه اولیه تحقیقاتی او اپیدمیولوژی فضایی است.
لیانفا لی
LIANFA LI استاد آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، موسسه علوم جغرافیایی و تحقیقات منابع طبیعی، آکادمی علوم چین، پکن، چین است. پست الکترونیک: lilf@Lreis.ac.cn. علاقه اولیه تحقیقاتی او روششناسی برای یادگیری ماشین فضایی و هوش مصنوعی است.
چنگو ژو
CHENGHU ZHOU استاد آزمایشگاه کلید ایالتی منابع و سیستم اطلاعات محیطی، موسسه علوم جغرافیایی و تحقیقات منابع طبیعی، آکادمی علوم چین، پکن، چین است. و استاد دانشگاه آکادمی علوم چین، پکن، چین. پست الکترونیک: zhouch@Lreis.ac.cn. علاقه اولیه تحقیقاتی او علم GIS است.
گوانگ کوان لی
GUANGQUAN LI استادیار دپارتمان ریاضیات، فیزیک و مهندسی برق در دانشگاه نورثامبریا، نیوکاسل آپون تاین NE1 8ST، انگلستان است. پست الکترونیک: guangquan.li@northumbria.ac.uk. علاقه پژوهشی اولیه او روششناسی بیزی برای تجزیه و تحلیل دادههای ناشی از علوم بهداشتی و اجتماعی است.
هونگیان چن
HONGYAN CHEN دانشمند داده های مکانی در مرکز اکولوژی و هیدرولوژی بریتانیا، مرکز محیط زیست لنکستر، لنکستر، LA1 4AP، انگلستان است. پست الکترونیک: honche@ceh.ac.uk. علاقه اولیه تحقیقاتی او علم GIS است.
منابع
- Akaike, H. 1974. نگاهی جدید به شناسایی مدل آماری. معاملات IEEE در کنترل خودکار ۱۹ (۶): ۷۱۶ – ۲۳٫ دو: ۱۰٫۱۱۰۹/TAC.1974.1100705.
- Anselin, L. 1995. شاخص های محلی ارتباط فضایی – LISA. تحلیل جغرافیایی ۲۷ (۲): ۹۳ – ۱۱۵٫ doi: 10.1111/j.1538-4632.1995.tb00338.x.
- Anselin, L. 2006. ناهمگونی فضایی. که در دایره المعارف جغرافیای انسانی، ویرایش ب. وارف، ۴۵۲ تا ۵۳٫ هزار اوکس، کالیفرنیا: سیج.
- اتکینسون، پی، و ان. تیت. ۲۰۰۰٫ مسائل مقیاس فضایی و راه حل های زمین آماری: بررسی. جغرافی دان حرفه ای ۵۲ (۴): ۶۰۷ – ۲۳٫ doi: 10.1111/0033-0124.00250.
- بردلی، وی سی، اس. کوریواکی، ام. ایزاکوف، دی. سجدینوویچ، ایکس ال منگ، و اس. فلاکسمن. ۲۰۲۱٫ نظرسنجی های بزرگ غیرنماینده به طور قابل توجهی جذب واکسن ایالات متحده را بیش از حد تخمین زدند. طبیعت ۶۰۰ (۷۸۹۰): ۶۹۵-۷۰۰٫ دو: ۱۰٫۱۰۳۸/s41586-021-04198-4.
- باتل، جی ام، دی.ام. آلن، دی. کیسی، بی. دیویسون، ام. هایاشی، دی ال پیترز، جی دبلیو پومروی، اس. سیمونوویچ، ای. سنت هیلر، و پیاچ ویتفیلد. ۲۰۱۶٫ فرآیندهای سیل در کانادا: جنبه های منطقه ای و ویژه. مجله منابع آب کانادا ۴۱ (۱ – ۲): ۷ تا ۳۰٫ doi: 10.1080/07011784.2015.1131629.
- چن، جی.، تی وو، دی. زو، ال. لیو، ایکس وو، دبلیو گونگ، ایکس ژو، آر. لی، جی. هائو، جی. هو، و همکاران. ۲۰۲۲٫ بزرگی ها و الگوهای تغییر شکل زمین دائمی منجمد در مقیاس بزرگ که توسط Sentinel-1 InSAR در فلات مرکزی چینگهای-تبت آشکار شد. سنجش از دور محیط زیست ۲۶۸:۱۱۲۷۷۸٫ doi: 10.1016/j.rse.2021.112778.
- مرکز ملی سرطان چین ۲۰۱۹٫ اطلس سرطان در چین. پکن: Sinomap Press.
- کریستاکوس، جی. ۱۹۹۲٫ مدل های میدانی تصادفی در علوم زمین. سن دیگو، کالیفرنیا: انتشارات آکادمیک.
- کریستاکوس، جی. ۲۰۱۲٫ زمین آمار فضایی و زمانی مدرن. ویرایش جدید مینولا، نیویورک: دوور.
- کریستاکوس، جی.، جی ام آنگولو، اچ.-ال. یو، و جی پی وو. ۲۰۱۷٫ تعیین متریک فضا-زمان در مدلسازی محیطی. مجله محیط زیست ۳۰ (۱): ۲۹ تا ۴۰٫
- کلیف، AD، و JK Ord. 1981. فرآیندهای فضایی: مدل ها و کاربرد. لندن: پایون.
- کرسی، ن. ۱۹۹۳٫ آمار برای داده های مکانی. نیویورک: وایلی.
- دان، آر، و آر هریسون. ۱۳۷۲٫ نمونه گیری سیستماتیک دو بعدی کاربری اراضی. آمار کاربردی ۴۲ (۴): ۵۸۵ تا ۶۰۱٫ doi: 10.2307/2986177.
- Dutilleul، PRL 2011. ناهمگونی مکانی-زمانی: مفاهیم و تحلیل. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
- انیشتین، A. 1953. آرشیو انیشتین، ۶۱ – ۳۸۱٫ بازدید در ۱۷ دسامبر ۲۰۲۳٫ http://www.autodidactproject.org/quote/einstn2.html.
- Everitt، BS، و A. Skrondal. 2010. فرهنگ لغت آمار کمبریج. ویرایش چهارم کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
- Fotheringham، AS، C. Brunsdon، و M. Charlton. 2000. جغرافیای کمی: دیدگاههای تحلیل دادههای مکانی. لندن: سیج.
- گائو، B.-B.، J.-F. وانگ، اچ.-ام. فن، K. Xu، M.-G. هو، و Z.-Y. چن. ۲۰۱۵٫ یک روش بهینه سازی طبقه بندی شده برای یک شبکه چند متغیره نظارت بر محیط زیست دریایی در مصب رودخانه یانگ تسه و دریای مجاور آن. مجله بین المللی علم اطلاعات جغرافیایی ۲۹ (۸):۱۳۳۲-۴۹٫ doi: 10.1080/13658816.2015.1024254.
- گائو، بی بی، جی وای یانگ، زی چن، جی. سوگیهارا، ام سی لی، آ. استین، ام بی کوان، و جی اف وانگ. ۲۰۲۳٫ استنتاج علی از داده های سیستم زمین مقطعی با نقشه برداری متقاطع همگرا جغرافیایی. ارتباطات طبیعت ۱۴ (۱): ۵۸۷۵٫ دو: ۱۰٫۱۰۳۸/s41467-023-41619-6.
- Ge، Y.، Y. Jin، A. Stein، Y. Chen، J. Wang، J. Wang، Q. Cheng، H. Bai، M. Liu، و PM Atkinson. 2019. اصول و روش های مقیاس بندی داده های علوم زمین مکانی. بررسی های علوم زمین ۱۹۷:۱۰۲۸۹۷٫ doi: 10.1016/j.earscirev.2019.102897.
- Getis، A.، و JK Ord. 1992. تحلیل تداعی فضایی با استفاده از آمار فاصله. تحلیل جغرافیایی ۲۴ (۳): ۱۸۹ – ۲۰۶٫ doi: 10.1111/j.1538-4632.1992.tb00261.x.
- گلدشتاین، H. 2011. مدل های آماری چند سطحی. ویرایش چهارم چیچستر، انگلستان: ویلی.
- Goodchild، MF، L. Anselin، و U. Deichmann. 1993. چارچوبی برای درونیابی منطقه ای داده های اجتماعی-اقتصادی. محیط زیست و برنامه ریزی الف: اقتصاد و فضا ۲۵ (۳): ۳۸۳ – ۹۷٫ doi: 10.1068/a250383.
- گودچایلد، ام.، و آر. هاینینگ. ۱۳۸۳٫ GIS و تجزیه و تحلیل داده های مکانی: دیدگاه های همگرا. مقالات علوم منطقه ای ۸۳ (۱): ۳۶۳ تا ۸۵٫ doi: 10.1007/s10110-003-0190-y.
- گریفیث، DA 2003. خودهمبستگی فضایی و فیلتر فضایی، به دست آوردن درک از طریق تئوری و تجسم. برلین: Springer Verlag.
- گجراتی، DN و DC Porter. 2009. اقتصاد سنجی پایه. ویرایش پنجم نیویورک: مک گراو هیل.
- Guo، JH، QS Xu، Y. Zeng، ZH Liu، و XX Zhu. 2023. نقشه برداری و ارزیابی پوشش تاج درخت شهری در سراسر کشور در برزیل از تصاویر سنجش از دور با وضوح بالا با استفاده از یادگیری عمیق. مجله فتوگرامتری و سنجش از دور ISPRS 198:1-15. doi: 10.1016/j.isprsjprs.2023.02.007.
- هاینینگ، R. 2003. تجزیه و تحلیل داده های مکانی: تئوری و عمل. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
- Haining، R.، و GQ Li. 2020. مدلسازی دادههای مکانی و مکانی-زمانی: رویکرد بیزی. بوکا راتون، فلوریدا: CRC.
- Heckman, JJ 1979. سوگیری انتخاب نمونه به عنوان یک خطای مشخصات. اقتصادسنجی ۴۷ (۱): ۱۵۳ – ۶۱٫ doi: 10.2307/1912352.
- هاکس، جی جی ۲۰۱۰٫ تجزیه و تحلیل چند سطحی: تکنیک ها و کاربردها. ویرایش دوم لندن و نیویورک: روتلج.
- هو، ام جی و جی اف وانگ. ۲۰۱۱٫ بسته بهینه سازی شبکه هواشناسی با استفاده از نظریه MSN. مدلسازی و نرم افزار محیطی ۲۶ (۴): ۵۴۶ – ۴۸٫ doi: 10.1016/j.envsoft.2010.10.006.
- هو، M.-G.، J.-F. وانگ، ی. ژائو و ال. جیا. ۲۰۱۳٫ بهترین ابزار تخمین بی طرفانه خطی مبتنی بر B-SHADE برای نمونه های بایاس. مدلسازی و نرم افزار محیطی ۴۸:۹۳-۹۷٫ doi: 10.1016/j.envsoft.2013.06.011.
- Imbens، GW و DB Rubin. 2015. استنتاج علی در آمار، علوم اجتماعی و زیست پزشکی. کمبریج، انگلستان: انتشارات دانشگاه کمبریج.
- Isaaks، E.، و R. Srivastava. 1989. زمین آمار کاربردی. نیویورک: انتشارات دانشگاه آکسفورد.
- Ji، BW، YB Qin، TB Zhang، XB Zhou، GH Yi، MT Zhang و ML Li. 2022. تحلیل عوامل محرک خشکسالی در فصل رشد در مغولستان داخلی بر اساس مدلهای ژئودتکتور و GWR. سنجش از دور ۱۴ (۲۳): ۶۰۰۷٫ doi: 10.3390/rs14236007.
- Kulldorff, M. 1997. آمار اسکن فضایی. ارتباطات در آمار: نظریه و روش ۲۶ (۶): ۱۴۸۱ – ۹۶٫ doi: 10.1080/03610929708831995.
- Li، X.، M. Feng، Y. Ran، Y. Su، F. Liu، C. Huang، H. Shen، Q. Xiao، J. Su، S. Yuan، و همکاران. ۲۰۲۳٫ داده های بزرگ در علم سیستم زمین و پیشرفت به سمت یک دوقلوی دیجیتال. بررسی های طبیعت درباره زمین و محیط زیست ۴ (۵): ۳۱۹ – ۳۲٫ doi: 10.1038/s43017-023-00409-w.
- Lin، Y.، CD Xu، و JF Wang. 2023. Sandwichr: پیش بینی فضایی در R بر اساس ناهمگنی طبقه بندی فضایی. معاملات در GIS 27 (5): 1579 – 98. doi: 10.1111/tgis.13088.
- لیندلی، دی وی، و ام آر نوویک. ۱۳۶۰٫ نقش مبادله پذیری در استنتاج. سالنامه آمار ۹:۴۵ – ۵۸٫
- لیو، سی، دبلیو لی، دبلیو وانگ، اچ. ژو، تی لیانگ، اف. هو، جی. زو و پی. زو. ۲۰۲۱٫ تحلیل فضایی کمی دینامیک پوشش گیاهی و عوامل محرک بالقوه در یک منطقه آلپی معمولی در فلات شمال شرقی تبت با استفاده از موتور Google Earth. کاتنا ۲۰۶: ۱۰۵۵۰۰٫ doi: 10.1016/j.catena.2021.105500.
- لوید، سی دی ۲۰۱۰٫ مدل های محلی برای تحلیل فضایی. ویرایش دوم بوکا راتون، فلوریدا: CRC.
- Longley، PA، MF Goodchild، DJ Maguire، و DW Rind. 2005. سیستم های اطلاعات جغرافیایی و علم. ویرایش دوم هوبوکن، نیوجرسی: وایلی.
- لو، دبلیو، جی. جاسیویچ، تی استپینسکی، جی. وانگ، سی. ژو، و ایکس. کانگ. ۲۰۱۶٫ ارتباط فضایی بین تراکم تشریح و عوامل محیطی در سراسر ایالات متحده. نامه های تحقیقاتی ژئوفیزیک ۴۳ (۲): ۶۹۲ تا ۷۰۰٫ doi: 10.1002/2015GL066941.
- Matheron, G. 1963. اصول زمین آمار. زمین شناسی اقتصادی ۵۸ (۸): ۱۲۴۶ – ۶۶٫ دو: ۱۰٫۲۱۱۳/gsecongeo.58.8.1246.
- منگ، XL 2018. بهشتهای آماری و پارادوکسها در دادههای بزرگ (I): قانون جمعیتهای بزرگ، پارادوکس کلان دادهها و انتخابات ریاستجمهوری ایالات متحده در سال ۲۰۱۶٫ Annals of Applied Statistics 12 (2):685-726. دو: ۱۰٫۱۲۱۴/۱۸-AOAS1161SF.
- موران، ص ۱۹۵۰٫ نکاتی در مورد پدیده های تصادفی پیوسته. بیومتریک ۳۷ (۱ – ۲): ۱۷ – ۲۳٫
- او کانل، پی ای، آر جی گورنی، دی جونز، جی بی میلر، کالیفرنیا نیکلاس و ام آر ارشد. ۱۹۷۹٫ مطالعه موردی منطقی سازی شبکه باران سنج در جنوب غربی انگلستان. تحقیقات منابع آب ۱۵ (۶): ۱۸۱۳ – ۲۲٫ doi: 10.1029/WR015i006p01813.
- Openshaw, S. 1984. مشکل واحد منطقه ای قابل تغییر: CATMOG 38. نورویچ، انگلستان: GeoAbstracts
- پرل، جی، و دی مکنزی. ۲۰۱۸٫ کتاب چرا: علم جدید علت و معلول. نیویورک: کتاب های پایه.
- پیرسون، ک. ۱۸۹۵٫ نکاتی در مورد رجعت و ارث در مورد دو والدین. مجموعه مقالات انجمن سلطنتی لندن ۵۸:۲۴۰-۴۲٫
- رائو، JNK 2003. تخمین مساحت کوچک. نیویورک: وایلی.
- ریپلی، بی دی ۱۹۸۱٫ آمار فضایی. نیویورک: وایلی.
- RodrÃguez-Iturbe، I.، و JM Mejaa. 1974. طراحی شبکه های بارش در زمان و مکان. تحقیقات منابع آب ۱۰ (۴): ۷۱۳ – ۲۸٫ doi: 10.1029/WR010i004p00713.
- رانج، جی.، آ. گرهاردوس، جی. واراندو، وی. آیرینگ و جی. کمپس-والز. ۲۰۲۳٫ استنتاج علی برای سری های زمانی. بررسی های طبیعت درباره زمین و محیط زیست ۴ (۷): ۴۸۷ تا ۵۰۵٫ doi: 10.1038/s43017-023-00431-y.
- Snijders، TAB و RJ Bosker. 2011. تجزیه و تحلیل چند سطحی: مقدمه ای بر مدل سازی چند سطحی پایه و پیشرفته. ویرایش دوم هزار اوکس، کالیفرنیا: سیج.
- اسنو، ج. ۱۸۵۴٫ در مورد نحوه ارتباط وبا. لندن، چرچیل.
- Stein, A. 2022. توسعه مجله آمار فضایی: ۱۰ سال اول. آمار فضایی ۵۰:۱۰۰۵۷۶٫ doi: 10.1016/j.spasta.2021.100576.
- استاین، ا.، ام. هوگرورف، و جی. بوما. ۱۹۸۸٫ استفاده از ترسیم نقشه خاک برای بهبود (Co-)کریجینگ داده های نقطه ای در مورد کمبود رطوبت. ژئودرما ۴۳ (۲ – ۳): ۱۶۳ – ۷۷٫ doi: 10.1016/0016-7061(88)90041-9.
- Sugihara، G.، R. Ma، H. Ye، C. Hsieh، E. Deyle، M. Fogarty، و S. Munch. 2012. تشخیص علیت در اکوسیستم های پیچیده. علوم پایه ۳۳۸ (۶۱۰۶): ۴۹۶ تا ۵۰۰٫ doi: 10.1126/science.1227079.
- Sui, D. 2006. اولین قانون جغرافیایی Tobler. که در دایره المعارف جغرافیای انسانی، ویرایش B. Warff, 454. Thousand Oaks, CA: Sage.
- وانگ، جی اف، جی. کریستاکوس، و ام جی هو. ۱۳۸۸٫ مدلسازی وسایل فضایی سطوح با ناهمگنی طبقاتی. معاملات IEEE در زمینه علوم زمین و سنجش از راه دور ۴۷ (۱۲): ۴۱۶۷ – ۷۴٫ doi: 10.1109/TGRS.2009.2023326.
- وانگ، JF، R. Haining، و ZD Cao. 2010. بررسی نمونه برای تخمین میانگین سطح ناهمگن: کاهش واریانس خطا از طریق پهنه بندی. مجله بین المللی علم اطلاعات جغرافیایی ۲۴ (۴): ۵۲۳ – ۴۳٫ doi: 10.1080/13658810902873512.
- وانگ، J.-F.، R. Haining، T.-J. لیو، L.-F. لی و سی.-اس. جیانگ. ۲۰۱۳٫ برآورد ساندویچ برای گزارش چند واحدی در یک سطح ناهمگن طبقه بندی شده. محیط زیست و برنامه ریزی الف: اقتصاد و فضا ۴۵ (۱۰): ۲۵۱۵ – ۳۴٫ doi: 10.1068/a44710.
- Wang، JF، MG Hu، CD Xu، G. Christakos و Y. Zhao. 2013. برآورد آلودگی هوا در سطح شهر در پکن. PloS ONE 8 (1):e53400. doi: 10.1371/journal.pone.0053400.
- وانگ، JF، XH Li، G. Christakos، YL Liao، T. Zhang، X. Gu، و XY Zheng. 2010. ارزیابی خطر سلامت مبتنی بر آشکارسازهای جغرافیایی و کاربرد آن در مطالعه نقص لوله عصبی منطقه هشون، چین. مجله بین المللی علم اطلاعات جغرافیایی ۲۴ (۱): ۱۰۷ – ۲۷٫ doi: 10.1080/13658810802443457.
- وانگ، J.-F.، BY Reis، M.-G. هو، جی. کریستاکوس، W.-Z. یانگ، کیو سان، ز.-جی. لی، X.-Z. لی، اس.-جی. لای، اچ.-ای. چن و همکاران ۱۳۹۰٫ برآورد بیماری منطقه بر اساس سوابق بیمارستان نگهبان. PLoS ONE 6 (8):e23428. doi: 10.1371/journal.pone.0023428.
- وانگ، جی، سی زو، ام. هو، کیو لی، زی یان و پی. جونز. ۲۰۱۸٫ دینامیک دمای هوای سطح زمین جهانی از سال ۱۸۸۰٫ مجله بین المللی اقلیم شناسی ۳۸ (تامین ۱):e466–e474. دو: ۱۰٫۱۰۰۲/بازی.۵۳۸۴٫
- وانگ، جی اف، تی ال ژانگ و بی جی فو. ۱۳۹۵٫ اندازه گیری ناهمگنی طبقه بندی شده فضایی. شاخص های اکولوژیکی ۶۷: ۲۵۰ تا ۵۶٫ دو: ۱۰٫۱۰۱۶/j.ecolind.2016.02.052.
- وانگ، زی، اف. لو، زی لیو، دبلیو تو، کی نی، کیو دو، کیو لی و زی وو. ۲۰۲۲٫ اندازه گیری اثرات غیر ثابت فضایی استفاده مختلط مبتنی بر POI بر سرزندگی شهری با استفاده از مدل ضرایب متغیر فضایی بیزی. مجله بین المللی علم اطلاعات جغرافیایی ۳۷ (۲): ۳۳۹ – ۵۹٫ doi: 10.1080/13658816.2022.2117363.
- Womble, WH 1951. سیستماتیک دیفرانسیل. علوم پایه ۱۱۴ (۲۹۶۱): ۳۱۵ – ۲۲٫ doi: 10.1126/science.114.2961.315.
- Worobey، M.، JI Levy، L Malpica Serrano، A Crits-Christoph، JE Pekar، SA Goldstein، AL Rasmussen، MUG Kraemer، C Newman، MPG Koopmans، و همکاران. ۲۰۲۲٫ بازار عمده فروشی غذاهای دریایی Huanan در ووهان مرکز اولیه همه گیری COVID-19 است. علوم پایه ۳۷۷ (۶۶۰۹): ۹۵۱ – ۵۹٫ doi: 10.1126/science.abp8715.
- زو، بی.، جی. وانگ، زی. لی، سی. زو، ی. لیائو، ام. هو، جی. یانگ، اس. لای، ال. وانگ، و دبلیو یانگ. ۲۰۲۱٫ ارتباط فصلی بین علل ویروسی عفونت های حاد تنفسی تحتانی بستری در بیمارستان و عوامل هواشناسی در چین: یک مطالعه گذشته نگر. The Lancet: Planetary Health 5 (3):e154–e163. doi: 10.1016/S2542-5196(20)30297-7.
- خو، سی، جی. وانگ، ام. هو و دبلیو وانگ. ۲۰۲۲٫ روشی جدید برای درونیابی داده های کیفیت هوای از دست رفته در ایستگاه های مانیتور. محیط زیست بین المللی ۱۶۹:۱۰۷۵۳۸٫ doi: 10.1016/j.envint.2022.107538.
- Xu، CD، JF Wang، و QX Li. 2018. روشی جدید برای درونیابی فضایی دما بر اساس ایستگاه های تاریخی پراکنده. مجله آب و هوا ۳۱ (۵): ۱۷۵۷ – ۷۰٫ دو: ۱۰٫۱۱۷۵/JCLI-D-17-0150.1.
- خو، ال.، کیو لیو، ال سی استیج، تی. بن آری، ایکس فانگ، ک.-اس. چان، اس. وانگ، ان سی استنست، و ز. ژانگ. ۲۰۱۱٫ اثر غیر خطی آب و هوا بر طاعون در طول سومین بیماری همه گیر در چین. مجموعه مقالات آکادمی ملی علوم ایالات متحده آمریکا ۱۰۸ (۲۵): ۱۰۲۱۴ – ۱۹٫ doi: 10.1073/pnas.1019486108.
- یانگ، جی.، جی. وانگ، ایکس. لیائو، اچ. تائو و ی. لی. ۲۰۲۲٫ مدل سازی زنجیره ای برای پیوند بیوژئوشیمیایی کادمیوم در سیستم سلامت انسان خاک-برنج. محیط زیست بین المللی ۱۶۷:۱۰۷۴۲۴٫ doi: 10.1016/j.envint.2022.107424.
- یین، کیو، جی. وانگ، ز. رن، جی. لی و ی. گو. ۲۰۱۹٫ نقشه برداری از افزایش دمای حداقل مرگ و میر در زمینه تغییرات آب و هوایی جهانی. ارتباطات طبیعت ۱۰ (۱): ۴۶۴۰٫ doi:10.1038/s41467-019-12663-y.
- یو، سی ال، زی سی وانگ و دی لیو. ۲۰۲۰٫ تجزیه و تحلیل فرآیند تکامل و نیروی محرکه تالاب های طبیعی در حوضه رودخانه Xiliao بر اساس حالت SWAT. معاملات انجمن مهندسی کشاورزی چین ۳۶ (۲۲): ۲۸۶ – ۹۷٫
- Zhang، DD، P. Brecke، HF Lee، Y.-Q. او، و جی. ژانگ. ۲۰۰۷٫ تغییرات آب و هوایی جهانی، جنگ و کاهش جمعیت در تاریخ معاصر بشر. مجموعه مقالات آکادمی ملی علوم ایالات متحده آمریکا ۱۰۴ (۴۹): ۱۹۲۱۴ – ۱۹٫ doi: 10.1073/pnas.0703073104.