۱٫ معرفی
بین سالهای ۲۰۱۴ تا ۲۰۱۸، جمعیت زاغهنشینان جهان از ۲۳ درصد به ۲۴ درصد افزایش یافته است. [
۱]. بدتر از آن، شواهد مربوط به سالهای ۲۰۲۰ و ۲۰۲۱ نشان میدهد که زاغهها یا جمعیت شهری محروم به دلیل چالشهای مرتبط رشد جمعیت، تأثیر موضعی بر تغییرات آب و هوا، همهگیری کووید-۱۹ و بحرانهای اقتصادی افزایش یافته است. [
۲,
۳]. اکثر ساکنان شهری در آفریقا در مناطق محرومی زندگی می کنند که فاقد خدمات اولیه و دارایی های خانگی هستند که در مناطق پرخطر زیست محیطی، مانند مناطق سیلابی، که در برابر تغییرات آب و هوایی آسیب پذیر هستند، زندگی می کنند. [
۴]. بانک جهانی تخمین می زند که اگر تا سال ۲۰۳۰ اقدامی انجام نشود، نزدیک به ۵۷۴ میلیون نفر همچنان در سطح جهان زیر خط فقر (۲٫۱۵ دلار در روز) زندگی خواهند کرد. [
۵].
در پاسخ به اهداف توسعه پایدار (SDGs) و برنامه های مرتبط، سازمان ملل متحد، بانک جهانی، سازمان های غیر دولتی، سایر سازمان های بین المللی و دولت های محلی به اطلاعات کافی در مورد موقعیت و ویژگی های مناطق محروم برای «توسعه طرح ها، نظارت بر پیشرفت و در نظر گرفتن اینکه چگونه برنامه های موجود می توانند آسیب پذیری های خاص جمعیت های مختلف را بهتر برطرف کنند. [
۶]. چنین اطلاعاتی شامل رشد مناطق محروم است. ویژگی های اجتماعی-اقتصادی، مانند دسترسی به خدمات اجتماعی؛ و خصوصیات فیزیکی مانند دوام مصالح ساختمانی. این اطلاعات برای برنامه ریزی هماهنگ پروژه های نوسازی و توسعه در سطح شهر و هدف گذاری مداخلات کاهش فقر ضروری است. [
۷].
برنامه ریزی و نظارت مؤثر به طور خاص به داده های به موقع، دقیق و در سطح شهر در مقیاس بلوک یا محله نیاز دارد. با این حال، این اطلاعات به ندرت در بسیاری از کشورهای با درآمد کم و متوسط (LMIC) در دسترس است.
داده های موجود اغلب در مورد جوامع مجرد، نادرست و جدا از بافت محلی هستند یا منسوخ شده یا در سطح منطقه یا ملی جمع شده اند. [
۸,
۹]. چهار منبع گسترده داده در مورد مناطق محروم توسط سنتهای نقشهبرداری زاغهنشینی عمدتاً سیلدار تولید میشوند: (۱) سرشماری و/یا بررسیهای خانگی، (۲) نقشهبرداری میدانی، (۳) دیجیتالی کردن دستی تصاویر منطقه/ماهواره، و ( ۴) مدل سازی تصاویر سنجش از دور [
۱۰]. سرشماریها و/یا نظرسنجیهای خانوارها شاخصهای اجتماعی-اقتصادی را جمعآوری میکند که برای مشخص کردن خانوادههای محروم استفاده میشود و بر اساس منطقه، شهر یا تمام مناطق شهری در سطح ملی جمعآوری میشوند. نه تنها تولید این نوع داده ها پرهزینه و نیازمند منابع زیادی است، بلکه محرومیت ها در سطح خانوار (مثلاً دسترسی به یک توالت خصوصی بهبود یافته) با محرومیت های سطح منطقه متفاوت است (مثلاً آیا یک سیستم فاضلاب عمومی وجود دارد یا خیر، همه خانوارها، و با موفقیت تمام زباله ها را بدون نشت درمان می کند) [
۶]. نقشه برداری میدانی عمدتاً به شیوه ای مشارکتی انجام می شود و با جوامع فردی برای نقشه برداری از سکونتگاه آنها کار می کند. [
۱۱]. به عنوان مثال، پروژه نقشه Kibera در نایروبی (کنیا) [
۱۲] و بیش از ۷۰۰۰ جامعه در سراسر آفریقا، آسیا و آمریکای لاتین در شبکه بین المللی Slum/Shack Dweller [
13]. اعضای جامعه دادههای دقیق منطقه و سطح خانوار را جمعآوری میکنند تا به طور مشترک چالشها و منابع را تعریف کنند و از این اطلاعات برای برنامهریزی و اولویتبندی طرحهای ارتقای داخلی و همچنین برای حمایت از خدمات عمومی اساسی استفاده کنند. اگرچه دادههای ایجاد شده توسط جامعه غنی از اطلاعات زمینه محلی هستند، اما برای جمعآوری منابع فشرده هستند، برای هر جامعه محروم مقیاسپذیر نیستند و جزئیات زمانی کمی دارند. دیجیتالی کردن دستی تصاویر ماهواره ای، به عنوان مثال در OpenStreetMap، توسط داوطلبان جهانی یا کارشناسان محلی می تواند اطلاعات قابل اعتمادی در مورد ویژگی های فیزیکی در سطح شهر (به عنوان مثال، جاده ها و ردپاهای ساختمان) ایجاد کند، اما این داده ها ناقص هستند، به خصوص در LMIC ها. [
۱۴]و بسیاری از مرتبطترین ویژگیها (به عنوان مثال، خود شیرهای آب یا خود مرزهای «زاغهنشین») بهطور دقیق بدون دانش بافت محلی محلی یا تأیید صحت نقشهبرداری دقیق غیرممکن است.
به طور مشابه، مدلهای یادگیری ماشینی مبتنی بر سنجش از دور میتوانند اطلاعاتی در مورد بسیاری از ویژگیهای فیزیکی مناطق محروم، از جمله مورفولوژی ساختمان و جاده و پوشش زمین ارائه دهند. [
۱۵,
۱۶]، و در مقایسه با روش های ذکر شده در بالا مقرون به صرفه هستند. با این حال، یک محدودیت عمده این است که سنجش از دور شاخصهای مهم اجتماعی-اقتصادی را نادیده میگیرد و برای آموزش مدلهای دقیق به دانش زمینه و دادههای آموزشی مناسب نیاز دارد. [
۱۷].
شبکه “سیستم نقشه برداری مناطق محروم یکپارچه (IDEAMAPS)” توسط اعضای این گروه های مختلف نقشه برداری زاغه ایجاد شد تا نقاط قوت هر رویکرد را برای تهیه نقشه های معمول، منسجم و دقیق از مناطق محروم در سراسر شهرها ادغام کند. [
۱۸]. یکی از جنبههای کلیدی این پروژه، استفاده از دادههای مکانی باز و ابزارهای کمهزینه است که مقیاسپذیر و قابل انتقال در چندین شهر هستند. استفاده از داده های مکانی برای نقشه برداری مناطق محروم هنوز به طور کامل مورد بهره برداری قرار نگرفته است [
۱۹]. دلایل عمده مربوط به داده های بدون ساختار، کیفیت داده ها، کامل بودن داده ها و وضوح های مکانی و زمانی متفاوت است. [
۱۴,
۱۷,
۲۰]. به عنوان مثال، یک مطالعه اخیر نشان می دهد که مجموعه داده های جمعیت جهانی سکونتگاه انسانی، مناطق زاغه نشین را دست کم می گیرد [
۲۱]. در نتیجه، مطالعات بسیار کمی چند شاخص اجتماعی-اقتصادی را برای نقشهبرداری از مناطق محروم ترکیب کردهاند. بیشتر مطالعات عمدتاً بر استفاده از تصاویر ماهوارهای برای نقشهبرداری مورفولوژی زاغهها متمرکز شدهاند (نگاه کنید به [
۱۵,
۲۲,
۲۳] برای بررسی دقیق تر). یک کار قابل توجه از مهابیر و همکارانش چندین شاخص جغرافیایی اجتماعی-اقتصادی، از جمله تراکم جمعیت، قیمت املاک، نرخ تولد، دسترسی به توالت گودال، و مکانهای عبادت را به منظور ترسیم نقشه مناطق محروم در کنیا ترکیب کرد. [
۲۰]. سایر محققان داده های سنجش از دور و سرشماری را با هم ترکیب کرده اند [
۲۴,
۲۵,
۲۶]. با این حال، تکرار این رویکردها در مناطقی که دادههای سرشماری مکانی در دسترس نیست، دشوار است.
پیشرفت دادههای فضایی باز فرصتهای جدیدی را برای پرداختن به نقشهبرداری مناطق محروم و در نظر گرفتن محدودیتهای رویکردهای موجود ارائه میکند. [
۱۷,
۲۰]. دادههای مکانی باز، دادههای دیجیتال عمومی یا خصوصی با مجوز باز هستند که دسترسی رایگان به دادهها را بدون محدودیت یا محدودیتهای کمی تضمین میکنند. [
۲۷]. این منابع داده به دلیل ابتکارات داده باز توسط دولت ها، سازمان های غیردولتی و شرکت های خصوصی به طور فزاینده ای در سطح جهانی در دسترس هستند. به عنوان مثال، Meta و WorldPop داده های مکانی با وضوح بالا در مورد جمعیت و جمعیت در مقیاس جهانی ارائه می دهند. [
۲۸,
۲۹]. سایر داده های جغرافیایی شامل جزایر گرمایی شهری، نقشه خیابان باز و اطلس مالاریا است [
۲۱,
۲۹,
۳۰]. دادههای نقطهنظر از OpenStreetMap را میتوان برای ایجاد ویژگیهای دسترسی، از جمله نزدیکی به زیرساختها، مانند بهداشت، مدارس، و فرصتهای شغلی استفاده کرد. [
۳۱]. مزیت مجموعه دادههای مکانی باز این است که دسترسی آزاد را تضمین میکنند و امکان استفاده مجدد و تکرارپذیری روشها را فراهم میکنند. آنها یک منبع داده جایگزین یا مکمل برای نقشه برداری و توصیف مناطق محروم از نظر فیزیکی و اجتماعی ارائه می دهند. آنها به طور بالقوه می توانند بینش جدیدی را در مورد شرایط زندگی در مناطق محروم با افزودن ویژگی های اجتماعی-اقتصادی به همان اندازه مهم که اغلب در روش های مبتنی بر سنجش از دور گم نمی شوند، ارائه دهند. [
۱۵,
۱۷,
۲۲].
در این مطالعه، شاخصهای فیزیکی و اجتماعی-اقتصادی را از دادههای فضایی باز برای نقشهبرداری مناطق محروم هماهنگ و استخراج کردیم. ما یک مدل یادگیری ماشینی را برای نقشهبرداری و توصیف مناطق محروم در شهرهای مختلف و در مقیاس بزرگ ایجاد و آزمایش کردیم. این مطالعه دامنه IDEAMAPS چارچوبهای محرومیت اخیر منتشر شده را عملیاتی کرد تا (۱) شاخصهای مرتبط و لایههای جغرافیایی مربوطه را برای توصیف مناطق محروم شناسایی کند، (ب) لایههای جغرافیایی شناساییشده را به شیوهای سیستماتیک و سازگار برای مدلسازی یادگیری ماشین پردازش کند، و (iii) تجزیه و تحلیل اهمیت نسبی شاخص ها برای مدل سازی. حوزه IDEAMAPS چارچوب محرومیت، دیدگاهی کل نگر درباره ویژگیهای اجتماعی و فیزیکی ارائه میکند که به تعریف محرومیت شهری در زمینههای مختلف، از جمله شاخصهای منابع سنتی (مثلا، نظرسنجیها) و دادههای بزرگ (مانند رسانههای اجتماعی) کمک میکند. با این حال، این چارچوب در مقیاس بزرگ اعمال نشده است. سهم اصلی این مطالعه شامل:
-
تجزیه و تحلیل منظر برای شناسایی شاخصهای مرتبط با دادههای مکانی متناظر که در سطح جهانی برای مدلسازی در دسترس هستند.
-
طراحی و آزمایش مدلهای یادگیری ماشینی برای پیشبینی و توصیف مناطق محروم در شهرهای مختلف و در مقیاس بزرگ.
-
اهمیت نسبی شاخص ها را برای نقشه برداری جهانی تجزیه و تحلیل کرد. این به ما این امکان را میدهد که مرتبطترین شاخصها را همانطور که برای نقشهبرداری جهانی هدف داریم، بشناسیم.
۲٫ منطقه مطالعه
این مطالعه در سه شهر آفریقای جنوب صحرای آکرا (غنا)، لاگوس (نیجریه) و نایروبی (کنیا) انجام شد.
شکل ۱. اینها شهرهایی بودند که پروژه IDEAMAPS روی آنها متمرکز شد و ما شبکه های محلی موجود را داریم که داده های مرجع و دانش زمینه محلی را در اختیار ما قرار می دهند. این سه شهر همچنین به ما اجازه میدهند که انواع ویژگیهای مورفولوژیکی شهری و زمینههای اجتماعی و محیطی را آزمایش کنیم. علاوه بر این، آنها بخش بزرگی از جمعیت را در شرایط زندگی محروم دارند [
۳۲,
۳۳,
۳۴]. مرزهای شهر یا منطقه مورد علاقه (ROI) – یک زمینه فضایی که برای مطالعه مورد علاقه است – با استفاده از تقاطع مرزهای اداری آنها و منطقه بزرگتر ساخته شده همانطور که با معیارهای ردپای ساختمان ۱۰۰ × ۱۰۰ متر WorldPop تعریف شده است، تعریف شد. [
۳۵,
۳۶]، با یک بافر ۱ کیلومتری اضافه شده برای اطمینان از گنجاندن مناطق محروم حاشیه شهری و آزمایش مقیاس پذیری روش ما.
آکرا یک شهر ساحلی و قطب اقتصادی غنا است که تقریباً چهار میلیون نفر جمعیت دارد [
۳۷]. شهرنشینی برنامه ریزی نشده منجر به عقب ماندگی مسکن شده است، به طوری که ۳۴ درصد از ساکنان داخل شهر (کمتر از ۵ درصد مساحت زمین) در محله های فقیر نشین زندگی می کنند. [
۳۴]. آکرا به مناطق حومه ای مانند آشیامان، تما، کوسوآ و ناساوان گسترش یافته است. ما ROI 2561 کیلومتر مربع را برای پوشش شهر اصلی و منطقه حومه شهری انتخاب کردیم. لاگوس یک شهر بندری با تالاب هایی است که ۲۲ درصد از مساحت زمین را پوشش می دهد. در سال ۲۰۲۱، تخمین زده شد که بیش از ۲۰ میلیون نفر در لاگوس در محله های فقیر نشین زندگی می کنند. [
۳۸]. ما ROI 5638 کیلومتر مربع را انتخاب کردیم که بزرگتر از مناطق اداری اصلی ایالت لاگوس با ۳۳۴۵ کیلومتر مربع است. نایروبی، پایتخت کنیا، تقریباً ۶۰ درصد از ساکنان آن در محله های فقیر نشین زندگی می کنند [
۳۹]. ROI انتخاب شده ۲۰۰۶ کیلومتر مربع است که فراتر از حوزه اداری است و ۶۹۵ کیلومتر مربع را پوشش می دهد.
۳٫ مواد و روشها
برای ایجاد یک رویکرد مقیاس پذیر و قابل انتقال برای نقشه برداری و مشخص کردن مناطق محروم در چندین شهر، از یک گام چهار فاز با ساخت هر فاز بر اساس یافته های قبلی استفاده شد.
شکل ۲). فاز ۱ یک تعریف عملیاتی و شاخصهای مربوطه برای نقشهبرداری منطقهمحور است که ویژگیهای فیزیکی و اجتماعی مناطق محروم را بر اساس چارچوب محرومیت IDEAMAPS یکپارچه میکند. [
۴۰]. فاز ۲ لایه های جغرافیایی شناسایی شده را به شیوه ای منسجم و سیستماتیک برای ادغام منابع داده های مختلف با وضوح زمانی و مکانی متفاوت پردازش می کند. این یک مجموعه داده آماده برای مدل سازی را در اختیار ما قرار می دهد. فاز ۳ یک مدل یادگیری ماشین مقیاس پذیر و قابل انتقال را برای پیش بینی مناطق محروم طراحی و آزمایش کرد و دقت مدل را ارزیابی کرد. مرحله ۴ اهمیت نسبی شاخص های مورد استفاده برای مدل سازی را تجزیه و تحلیل کرد.
در تمام مراحل، این تیم با شبکه IDEAMAPS و کارشناسان درگیر در کارهای مرتبط با محرومیت شهری برای به اشتراک گذاشتن یافتهها برای برجسته کردن اشتراکات و تقویت یافتههای مطالعه، هماهنگ شدند. کارشناسان از طریق نمونه گیری هدفمند انتخاب شدند و گروهی متنوع شامل محققان مؤسساتی مانند مرکز تحقیقات شهری و محیطی (CUER) دانشگاه جورج واشنگتن، دانشکده علوم اطلاعات جغرافیایی و رصد زمین در دانشگاه توئنته، مرکز کلان داده شهری دانشگاه گلاسکو، دانشگاه لاگوس، و مرکز تحقیقات جمعیت و سلامت آفریقا و همچنین کارشناسان سازمانهای غیردولتی مانند طرحهای عدالت و توانمندسازی در نیجریه و گفتگوی مردمی در غنا.
۳٫۱٫ مفهوم سازی مناطق محروم
چالش نقشه برداری جهانی مناطق محروم با مفهوم سازی یک تعریف عملیاتی آغاز می شود. اصطلاحی که اغلب استفاده می شود، زاغه یا «سکونتگاه های غیررسمی» است. این اصطلاحات از نظر مفهومی مبهم هستند. آنها تعاریف متفاوتی دارند و به دلایل مختلفی مانند بافت فرهنگی و مصالح ساختمانی و زیرساخت های موجود با نام های محلی مختلف شناخته می شوند. [
۴۱]همانطور که می توان مشاهده کرد، برای مثال، در Zongo در غنا، Favelas در ریودوژانیرو، Kachi Abadi در کراچی، و Vijiji در نایروبی. UN Habitat زاغه ها را در سطح خانوار تعریف می کند. محله فقیر نشین هر خانواده ای است که فاقد یکی از موارد زیر باشد: دسترسی به آب، سرویس بهداشتی بهبود یافته، مسکن بادوام، فضای زندگی کافی، و امنیت تصدی [
۴۲]. تعریف خانوار فقیر نشین خطرات مبتنی بر منطقه مانند جرم و جنایت، خطرات سیل و فقدان امکانات اجتماعی را که ساکنان با آن مواجه هستند، نادیده می گیرد. سایر مشکلات مرتبط این است که زاغه ها از نظر مفهومی نسبی هستند زیرا هر کشوری تعریف خاص خود را از زاغه دارد [
۱۰]، و به طور گسترده مورد انتقاد قرار می گیرد زیرا می تواند معانی بدی را برای انگ و اخراج اجباری نشان دهد. [
۱۸,
۴۳].
با توجه به پیچیدگی های مفهومی زاغه ها، این مطالعه از مطالعات موجود در مورد اندازه گیری محرومیت یا “منطقه محروم” در سطح منطقه محور، به ویژه تامسون و همکارانش الهام گرفته است. [
۱۸]. اصطلاح “منطقه محروم” به طور گسترده توسط دانشمندان رصد زمین (EO) استفاده می شود زیرا بر محرومیت در سطح منطقه تمرکز می کند. [
۱۰]. دانشمندان EO از ویژگی های مورفولوژیکی از جمله اندازه ساختمان، تراکم و الگوی سکونت برای تشخیص مناطق محروم از مناطق غیر محروم استفاده می کنند. [
۴۴]. برای این پژوهش، مناطق محروم به عنوان فضاهای شهری که فاقد سرمایه های کالبدی و اجتماعی، اغلب ناشی از شهرنشینی بی برنامه، مستعد بلایا و فقر و شرایط نامناسب زندگی هستند، تعریف می شود. این تعریف عملیات ویژگی های فیزیکی و اجتماعی مناطق محروم را یکپارچه می کند. دید وسیعی از مناطق محروم و بینش جدیدی از ویژگی های آنها ارائه می دهد.
برگرفته از چارچوب محرومیت IDEAMAPS [
40]ما شش حوزه را شناسایی کردیم – (۱) مخاطرات فیزیکی، (۲) شهرنشینی برنامه ریزی نشده، (۳) ویژگی های جمعیت و مسکن، (۴) مخاطرات اجتماعی، و (۵) امکانات و خدمات. خطر فیزیکی به قرار گرفتن در معرض خطر مربوط می شود. شاخصها شامل مناطق سیل، شیبهای تند، آلودگی، کمبود پوشش گیاهی، تنش گرمایی، نزدیکی به جادهها، تالابها، رودخانهها، راهآهن، صنعت مخاطرات و خطوط برق فشار قوی است. شهرنشینی برنامه ریزی نشده با ویژگی های زاغه مانند مانند شکل و الگوهای نامنظم سکونتگاه، تراکم بالای ساختمان، کمبود جاده، اندازه ساختمان کوچک و مصالح ساختمانی ضعیف همراه است. ویژگی های جمعیت و مسکن به ویژگی های جمعیت شناختی و بهداشتی مربوط می شود. شاخصها شامل تعداد/تراکم جمعیت بالا، شرایط نامناسب مسکن و قومیت است. مخاطرات اجتماعی به خطر اجتماعی یک محله مربوط می شود. شاخصها شامل جرایم بالا، محلههای ناامن، نیازهای برآورده نشده برای تنظیم خانواده، خطر شیوع بیماری و گروههای قومی زبانی است. تسهیلات و خدمات مربوط به دسترسی ساکنان به زیرساخت ها و خدمات اجتماعی است. شاخص ها شامل دسترسی به بهداشت، آب و فاضلاب، برق، خدمات مالی، آموزش و امکانات تفریحی است.
۳٫۲٫ شاخص های جغرافیایی
بر اساس پیشنهادات کارشناسان، ما از دادههای جغرافیایی باز اخیر استفاده کردیم که برای سه شهر در بازه زمانی ۲۰۱۰ تا ۲۰۲۲ در دسترس است. با استفاده از رویکرد گلوله برفی، فهرست دادهها را گسترش دادیم. علاوه بر این، ما یک جستجوی هدفمند در سازمانهایی که علاقهمند به محرومیت هستند انجام دادیم. چنین سازمان هایی عبارتند از WorldPop، CIESIN، و NASA. ما سعی کردیم جدیدترین داده ها را با پوشش کامل برای کل منطقه مورد مطالعه پیدا کنیم.
میز ۱ شاخص، منبع داده، سال و توضیحات را ارائه می دهد.
۳٫۳٫ تولید لایه ژئوفضایی
لایههای مکانی پردازش شده و به وضوح فضایی ۳ قوس ثانیه (۰٫۰۰۰۸۳۳۳۳۳۳۳۳ درجه اعشار یا تقریباً ۱۰۰ متر) نمونهبرداری شدند تا دادهها را برای مدلسازی یادگیری ماشین هماهنگ کنند. شبکه پیکسلی ۳ قوس ثانیه ای وضوح فضایی مناسبی را ارائه می دهد که امکان منطقی سازی و هماهنگ سازی مجموعه داده ها را با وضوح های متفاوت برای مدل سازی و تحلیل مفید می دهد. این اجازه می دهد تا تعادل بین دقت مکانی و ادغام داده ها از منابع مختلف برقرار شود [
۲۹]. همچنین یک ذخیره سازی و سربار محاسباتی معقول برای تجزیه و تحلیل منطقه بزرگ و مقیاس جهانی ارائه می دهد [
۴۵]. علاوه بر این، بسیار مهم است که اذعان کنیم که نقشه برداری از مناطق محروم یک مشکل اجتماعی-تکنیکی مملو از خطر عواقب ناخواسته است. بنابراین، انتخاب عمدی ۳ قوس ثانیه با به حداقل رساندن شناسایی مناطق در معرض خطر برای اخراج، به ملاحظات اخلاقی پایبند است.
معیارهای زیر برای انتخاب دادههای مکانی مورد استفاده قرار گرفت.
-
باید منطقه مورد علاقه را پوشش دهد.
-
باید داده های فضایی برداری یا شطرنجی باشد.
-
باید تا حد امکان دارای وضوح فضایی خوب باشد، معمولاً ۱۰۰ متر یا ریزتر.
-
وضوح زمانی باید تا حد امکان نزدیک باشد.
-
باید برای هر سه شهر موجود باشد.
شکل ۳ گردش کار برای استانداردسازی و ادغام لایههای مکانی را نشان میدهد. این شامل استانداردسازی و نمونهبرداری مجدد دادههای جغرافیایی شطرنجی و برداری برای دستیابی به وضوح فضایی یکنواخت ۱۰۰ متری است. برای دادههای شطرنجی، ما مجموعههای داده را استاندارد و مجدداً به یک شبکه با وضوح فضایی ۱۰۰ متر نمونهسازی کردیم.
برای داده های برداری (نقطه، چند خط، چند ضلعی)، ما از روش های تجمع (به عنوان مثال، شمارش یا چگالی) و روش های دسترسی (مثلاً اندازه گیری فاصله اقلیدسی) استفاده کردیم. این مطالعه از گردش کار مشابهی استفاده کرد که در آن بحث شد [
۴۵,
۴۶]. چند ضلعی های متراکم، مانند ساختمان ها، از اندازه گیری چگالی استفاده می کنند. چند خطوط پراکنده، مانند رودخانه ها و جاده های اولیه، از معیارهای فاصله اقلیدسی استفاده می کردند. نقاط دیدنی پراکنده، مانند ادارات دولتی، مکانهای عبادت، مدارس و بانکها، از معیارهای فاصله اقلیدسی استفاده میکردند. و نقاط متراکم یا چند خط، مانند گره های تقاطع جاده ها و جاده های فرعی و سوم، از معیارهای تراکم و شمارش استفاده می کردند. خروجی های برداری شطرنجی شده و به همان شبکه در وضوح فضایی ۱۰۰ متر نمونه برداری شدند. برای اطمینان از همپوشانی دقیق، همه دادهها به همان سیستم مرجع مختصات (طرحنمایی Mollweide) بازپخش شدند.
۳٫۴٫ ویژگی های ورودی برای مدل سازی
ما با دو مجموعه از ویژگی های ورودی آزمایش کردیم. اولین مجموعه ویژگی های ورودی از همه ۵۳ ویژگی استفاده می کرد. این برای آزمایش توانایی مدل ها برای پیش بینی با مجموعه داده های ورودی بزرگ با دامنه های مختلف کیفیت بود. همچنین برای شناسایی بینش های جدید در مورد مناطق محروم و تعیین اینکه آیا همه این داده ها مورد نیاز است یا خیر.
مجموعه دوم انتخاب دستی از ۱۱ ویژگی پس از تجزیه و تحلیل اکتشافی دقیق توسط کارشناسان و ارزیابی بصری کیفیت داده برای ROI بود. در بقیه تحلیل ها به این ویژگی های تعریف شده توسط کاربر گفته می شود. ویژگی های تعریف شده توسط کاربر شامل تعداد ساختمان، تراکم ساختمان، خطر آب و هوا (بارندگی)، بهبود مسکن، حداکثر دمای زمین، تعداد جمعیت، شیب، طبقه بندی شهری/روستایی، و نور شبانه است. انتخاب انتخاب دستی ویژگیها به کارشناسان محله فقیر نشین اجازه داد تا از تخصص و درک خود از مشکل استفاده کنند. انتخاب دستی به انتخاب ویژگی هایی کمک می کند که آموزنده و با کیفیت هستند و به مدل های قابل تفسیر بیشتری منجر می شوند. ما تصدیق می کنیم که رویکردهای انتخاب ویژگی ML در حال حاضر مورد توجه زیادی قرار گرفته است [
۴۷]. با این حال، ما همچنین مشاهده کردیم که نمونههای آموزشی که عمدتاً از داخل شهر به دست میآیند، با توجه به هدف ما از ترسیم یک منطقه بزرگ، میتوانند به طور بالقوه برخی سوگیریها را در فرآیند انتخاب ویژگی معرفی کنند. همچنین، بخش بزرگی از دادههای آموزشی و اعتبارسنجی بازگشت سرمایه ما از خارج از شهرهای داخلی استخراج شده است.
۳٫۵٫ طرح طبقه بندی و نمونه گیری
این مطالعه از یک طرح طبقه بندی باینری – محروم و غیر محروم استفاده کرد. طبقه محروم شامل «زاغهها»، سکونتگاههای غیررسمی و مناطقی با شرایط زندگی محروم است. داده های مرجع برای کلاس محروم از چندین منبع با تعاریف عملیات متفاوت و وضوح زمانی به دست آمد. این منابع شامل Slum Dwellers International، Field Data از IDEAMAPS، Frontier Development Lab و Mahabir GitHub Repository هستند. بنابراین، ارزیابی بصری توسط کارشناسان نقشه برداری زاغه با استفاده از Google Satellite Image و Google Street View Image، همراه با دانش متخصص محلی، برای ایجاد دستی داده های مرجع طبقه محروم اضافی استفاده شد. دیجیتالیسازی در Google Earth Pro پیادهسازی شد – یک نرمافزار رایگان که امکان تجسم، ارزیابی، ایجاد و پوشش دادههای GIS را فراهم میکند. [
۴۸]. فقط مناطق توافق بین کارشناسان محله های فقیر نشین و کارشناسان محلی برای مدل سازی استفاده شد.
طبقه غیر محروم شامل مناطق مسکونی غیر محروم مانند مسکونی رسمی، تجاری، صنعتی، تفریحی است. طبقه غیر ساخته شده شامل پوشش گیاهی، فضاهای باز، آب، زمین های توسعه نیافته، جنگل و زمین های کشاورزی است. داده های مرجع عمدتاً از OpenStreetMap (OSM) به دست آمده است. لایههای OSM بر روی تصاویر ماهوارهای گوگل پوشانده شدند و به صورت بصری ارزیابی شدند تا اطمینان حاصل شود که فقط از نمونههای دقت استفاده شده است. تمام داده های نمونه گیری در سال ۲۰۲۲ به دست آمد.
ما از کاشی های ۶۰۰ × ۶۰۰ متر برای لاگوس، ۸۰۰ × ۸۰۰ متر برای نایروبی و ۲۰۰۰ × ۲۰۰۰ متر برای آکرا برای ایجاد نمونه های آموزشی استفاده کردیم. این کاشی ها به طور عمدی از مناطق مختلف شهر گرفته شده و انواع مختلف محروم و غیر محروم را به نسبت نسبی به تصویر می کشد. اندازه کاشی ها به دلیل اندازه های مختلف مناطق محروم در سراسر شهرها و برای به حداقل رساندن عدم تعادل طبقاتی و تأثیر همبستگی خودکار فضایی متفاوت است. [
۴۹]. نمونه ها به شبکه ای با وضوح مکانی ۱۰۰ متر شطرنجی شدند.
جدول ۲ تعداد ۱۰۰ متر پیکسل داده های مرجع را برای هر شهر نشان می دهد.
نمونهگیری تصادفی برای تقسیم کاشیها به آموزش، اعتبارسنجی و آزمایش برای اطمینان از تخمین بیطرفانه استفاده شد. [
۵۰]. ما بهطور تصادفی کاشیها را به ۶۰ درصد برای آموزش و ۴۰ درصد برای آزمایش تقسیم کردیم تا تعمیمپذیری مدل را آزمایش کنیم. ما بیشتر کاشی های آموزشی را به ۷۰٪ برای آموزش و ۳۰٪ برای اعتبار سنجی تقسیم کردیم. کاشی های اعتبار سنجی برای تنظیم پارامترهای فوق برای بهینه سازی مدل ها استفاده شد. در همین حال، مجموعه دادههای آزمایشی هرگز توسط مدلها دیده نشد تا اطمینان حاصل شود که نتایج آماری ارائهشده بعداً با دنیای واقعی صادق است.
برای مدل تعمیمیافته، از نمونهگیری تصادفی طبقهای برای تقسیم کاشیها به آموزش، اعتبار سنجی و آزمایش استفاده شد. طبقه بندی در سطح شهر با ۶۰ درصد برای آموزش و ۴۰ درصد برای آزمایش انجام شد. کاشی های آموزشی را به ۷۰ درصد برای آموزش و ۳۰ درصد برای اعتبار سنجی تقسیم کردیم.
۳٫۶٫ مدل سازی
سه الگوریتم یادگیری ماشین برای کار طبقه بندی استفاده شد – جنگل تصادفی (RF) [
51]پرسپترون چند لایه (MLP) [
52] و افزایش شیب شدید (XGBoost) [
53]. این روش های طبقه بندی به دقت پیش بینی بالایی در نقشه برداری کاربری اراضی و نقشه برداری زاغه دست یافته اند [
۵۴,
۵۵]. RF نیاز به تعریف تعداد درخت (ntree) و تعداد ویژگی های ورودی (mtry) دارد که در هر تقسیم گره در نظر گرفته شود. جنگل تصادفی نسبتاً کاربرپسند است و تمایل به دستیابی به دقت بالایی در وظایف طبقه بندی دارد [
۵۶]. می تواند ابعاد بزرگ داده را مدیریت کند و با بیش از حد برازش مقابله کند. MLP یک شبکه عصبی پیشخور است که از لایه ورودی به لایه خروجی در جهت رو به جلو انتقال میدهد [
۵۷]. استفاده از آن با پارامترهای کمتر نسبتاً ساده است و می تواند روی مجموعه داده های بزرگ کار کند. XGBoost یک تقریب تابع حریصانه است، بنابراین خطاها را به حداقل می رساند و قادر به ثبت الگوهای پیچیده در داده ها است. [
۵۸]. ثابت شده است که نتایج پیشرفته ای را در بسیاری از وظایف طبقه بندی ارائه می دهد و برای مدیریت داده های پراکنده مناسب است. [
۵۹]. الگوریتمهای تقویت سنتی از نظر محاسباتی کند هستند و اغلب برای نقشهبرداری با مساحت بزرگ مناسب نیستند. XGBoost این شکاف را پر کرده است. آنها برای پردازش مجموعه داده های بزرگ کارآمد و انعطاف پذیر هستند [
۵۳]. آنها نسبتا کاربر پسند هستند، به پارامترهای کمی نیاز دارند، به راحتی می توان ویژگی های مهم را به دست آورد، و دقت پیش بینی بالایی دارند. علاوه بر این، آنها منبع باز و از نظر محاسباتی سریع هستند، و آنها را برای نقشه برداری با منطقه بزرگ مناسب می کند.
مدل ها در هر شهر جداگانه آموزش و آزمایش شدند. این به ارزیابی مقیاس پذیری مدل ها برای کاربردهای بزرگ کمک می کند. دوم، ما یک مدل شهر به شهر را برای ارزیابی نحوه عملکرد مدلها در زمینههای جدید جغرافیایی، مورفولوژیکی، اجتماعی و محیطی آزمایش کردیم. در نهایت، ما یک مدل تعمیم یافته را ایجاد کردیم که در آن نمونه های آموزشی از هر یک از سه شهر ترکیب شده و برای آموزش و ارزیابی استفاده می شود. این به ما امکان می دهد توانایی خود را در نقشه برداری از شهرهای مختلف ارزیابی کنیم، با این فرض که نمونه های آموزشی از هر شهر داریم.
۳٫۷٫ ارزیابی مدل
برای ارزیابی عملکرد طبقهبندی، از معیارهای کمی و کیفی استفاده شد. معیار کیفیت شامل بازرسی کامل بصری طبقه بندی توسط تیم تحقیقاتی است. نقشه های طبقه بندی شده بر روی تصاویر ماهواره ای با وضوح بالا از گوگل پوشانده شده و به صورت بصری بازرسی شدند. ما توانایی مدل را برای نقشهبرداری انواع محروم شناساییشده در مناطق مختلف که دادههای مرجع محدودی داریم، به صورت بصری ارزیابی کردیم.
برای اطمینان از ثبات در ارزیابی بصری، ما با کارشناسان زاغه برای تعریف پنج نوع محروم همکاری کردیم. این انواع محروم اطلاعات سطح زمین را از نمای خیابان Google و تصاویر هوایی با وضوح بالا از Google Earth Pro یکپارچه می کنند. [
۴۸]. این مناطق محروم به شرح زیر است: بزرگ بدون ساختار، بزرگ ساختار یافته، کوچک بدون ساختار، ترکیبی بدون ساختار و زاغه های جیبی. به طور خلاصه، مناطق بزرگ بدون ساختار دارای الگوهای نامنظم با سقفهای نسبتاً بزرگ، عمدتاً ورقهای آهنی، معمولاً شامل انواع خانههای چند خانواده و مصالح ساختمانی بتنی (مثلاً برای دیوارها) هستند. مناطق بزرگ ساختاری دارای الگوهای منظم با سقف های بزرگ، عمدتاً ورق های آهنی، انواع خانه های چند خانواده و مصالح بتنی است. مناطق کوچک بدون ساختار دارای الگوهای نامنظم با سقف های کوچک، عمدتاً ورق های آهنی، خانه های مستقل، ورق های آهنی و مصالح دیواری چوبی هستند. مناطق مخلوط بدون ساختار دارای الگوهای نامنظم با ترکیبی از سقفهای بزرگ و کوچک، ترکیبی از انواع خانههای چندخانواره، جداشده و نیمه جدا، ترکیبی از بتن، ورقهای آهنی و مصالح دیواری چوبی هستند. زاغههای جیبی دارای الگوهای نامنظم با انواع ساختمانهای بسیار کوچک (معمولاً کیوسکها)، ماهیت زمانی هستند که از ورق آهن و مصالح ساختمانی چوبی تشکیل شدهاند. جزئیات مربوط به انواع محرومیت را می توان در اینجا یافت [
۶۰].
اندازه گیری کمی شامل دقت، یادآوری، امتیاز F1 محروم و امتیاز F1 کلان است. Recall اندازه گیری می کند که مدل چقدر یک کلاس را که به عنوان محروم تعریف شده است بازیابی می کند [
۶۱]. دقت، قابلیت اطمینان مناطق محروم شناسایی شده را اندازه گیری می کند [
۶۲]. امتیاز کلان F1 میانگین وزنی نمرات F1 محاسبه شده در هر کلاس را محاسبه می کند، در حالی که امتیاز F1 نشان دهنده میانگین هارمونیک بین دقت و یادآوری کلاس محروم است. [
۶۳]. این معیارها برای به حداقل رساندن اثر عدم تعادل کلاس و ارزیابی دقیق مجموعه آزمون مستقل استفاده شد. برای ارزیابی کمی از آستانه احتمال پیشفرض ۵۰:۵۰ استفاده شد.
۳٫۸٫ تجزیه و تحلیل ویژگی های مهم
این مطالعه بررسی کرد که کدام ویژگیها مهم هستند و چقدر به مدل کمک میکنند. این برای تعیین اینکه کدام ویژگی ها باید به جمع آوری ادامه دهند تا از نقشه برداری مناطق محروم جهانی پشتیبانی شود، انجام شد. این مطالعه از ناخالصی جینی برای محاسبه ویژگیهای مهم استفاده کرد و سهم نسبی آنها را تحلیل کرد. ناخالصی جینی میزان دفعات اینکه یک نمونه تصادفی انتخاب شده از کلاس هدف، اگر به طور تصادفی بر اساس توزیع برچسبها در زیر مجموعه برچسبگذاری شود، به اشتباه طبقهبندی میشود را اندازهگیری میکند. [
۵۱]. در چندین کار طبقه بندی شهری یادگیری ماشین استفاده شده است [
۴۷]. این تخمین های دقیق خوبی را با ارزیابی های مدل پایین ارائه می دهد.
۵٫ بحث
این مقاله شواهد تجربی ارائه میکند که دادههای مکانی باز و یادگیری ماشینی میتوانند نقشهها و ویژگیهای مناطق محروم را با وضوح بالا ارائه دهند. رویکرد مبتنی بر ML ما برای نقشهبرداری مناطق محروم، هم مقیاسپذیر و هم قابل انتقال است و میتواند برای تولید نقشههای با وضوح بالا در شهرها با استفاده از دادههای فضایی باز رایج در دسترس استفاده شود. نتایج نشان میدهد که دادههای فضایی باز امکان مدلسازی و درک بسیاری از ویژگیهای فیزیکی و اجتماعی کلیدی مناطق محروم در سراسر شهرها را فراهم میکند، و دیدی جامعتر از مناطق محروم ارائه میدهد، که انتقاد عمدهای از روشهای موجود مبتنی بر رصد زمین بوده است. تا آنجا که ما می دانیم، مطالعه ما اولین مطالعه ای است که نقشه برداری مناطق محروم را به مناطق پرتراکم و کمتر متراکم حومه شهری با استفاده از داده های مکانی باز گسترش می دهد. این مناطق حاشیه شهری رشد سریع شهری را تجربه می کنند و مناطق رشد آتی این شهرها خواهند بود.
برخلاف سایر مطالعاتی که بر مجموعه دادههای تجاری متکی هستند، رویکرد ما فقط از دادههای در دسترس استفاده میکند و مقیاس آن در شهرها تقریباً بدون هزینه است. دقت مدل ما، اگر بالاتر نباشد، در مقایسه با سایر مطالعات با استفاده از مجموعه دادههای تجاری اختصاصی مشابه است. ارزیابی دقت در تمام شهرها نشان داد که دادههای فضایی باز برای تعمیم نقشهبرداری مناطق محروم امیدوارکننده هستند.
قابل توجه است، ما نشان دادهایم که وقتی مدلی که در یک شهر آموزش دیده برای پیشبینی در شهر دیگر استفاده میشود، قدرت پیشبینی مدل ما به طور متوسط کاهش یافته است (بیش از ۶۵٪ امتیاز F1). علیرغم تفاوتها در ویژگیهای مناطق محروم، به نظر میرسد ویژگیهای مشتقشده از مدل، مشترکات را در بین شهرها شناسایی میکنند. این نشان میدهد که رویکرد ما میتواند شکافهای بزرگ دادهها را به دلیل پوشش ضعیف نظرسنجی پر کند و میتواند تخمین خامی از مناطق محروم با اطلاعات کمی در مورد یک شهر ارائه دهد.
مدل تعمیمیافته با استفاده از نمونههای آموزشی از همه شهرها، دقت مدل را برای آکرا و نایروبی در مقایسه با هر شهر جداگانه بهبود بخشید. این نشان می دهد که این شهرها ممکن است مورفولوژی شهری مشابهی داشته باشند و این مدل ها می توانند از هر یک از شهرها برای بهبود نتایج کلی یاد بگیرند. این دلگرمکننده است زیرا نشان میدهد که ممکن است راههایی برای طبقهبندی شهرها و استفاده از دادههای آموزشی از یک شهر برای نقشهبرداری از شهر دیگر بر اساس نمونههای آموزشی ناحیه مورفولوژیکی که از آن مشتق شدهاند وجود داشته باشد. مطالعات با استفاده از تصاویر ماهوارهای اغلب به این نتیجه میرسند که تنوع زیاد مناطق محروم در هر شهر، مدلسازی را پیچیده میکند و در نتیجه منجر به عملکرد پایین میشود. [
۵۴,
۶۲]. ما گمان میکنیم که واریانس کم در ویژگیهای ورودی مدل ما به دلیل اشتراکات عمومی در بین شهرها، به این نتایج کمک کرده است.
عملکرد مدل همه ویژگی ها و تعریف شده توسط کاربر برای هر شهر نزدیک بود. با این حال، ویژگیهای تعریفشده توسط کاربر نتایج نسبتاً بالایی در مدل شهر به شهر به دست آوردند، که نشاندهنده ارتباط ویژگیهای ورودی کوچک برای مدلسازی است. همچنین نشان می دهد که چگونه بسیاری از ویژگی ها ممکن است گیج کننده باشند، به خصوص با آموزش محدود و داده های اعتبارسنجی برای بهینه سازی.
در حالی که نتایج ما امیدوارکننده است، این رویکرد دارای محدودیتهای مهمی است. درک روندهای زمانی ویژگی های مناطق محروم برای محققان و سیاست گذاران برای برنامه ریزی مداخلات و نظارت بر پیشرفت بسیار مهم است. با این حال، داده های باز اغلب وضوح زمانی پایینی دارند و فقط در شهرها یا کشورهای خاصی در دسترس هستند. علاوه بر این، ما هنوز قادر به ارزیابی توانایی مدل برای پیشبینی تغییرات در طول زمان نبودهایم. پیشرفت در داده های سنجش از دور (مثلاً Sentinel-2 به طور رایگان در دسترس) را می توان با داده های مکانی باز ترکیب کرد تا تغییرات زمانی را ترسیم کند. تصاویر ماهوارهای میتوانند دادههای سری زمانی را ارائه دهند که احتمالاً میتوانند برای تکمیل شاخصهای اجتماعی-اقتصادی بهدستآمده از دادههای فضایی باز استفاده شوند.
علاوه بر این، بیشتر داده های مرجع از درون شهرها استخراج شده و محدود هستند. قضاوت در مورد اینکه آیا مناطق محروم شناسایی شده در مدل در حومه شهری واقعاً بازتابی از آنچه در واقع روی زمین بود، دشوار بود. کار آینده شامل بازدید و بررسی این مناطق و جمع آوری داده های بیشتر برای آموزش خواهد بود، زیرا تعداد ویژگی ها و پیچیدگی مدل ها نسبتاً کم است. تنوع منحصر به فرد درون شهری مناطق محروم به داده های آموزشی بیشتری نیاز دارد که همه پویایی ها را هم در مرکز شهر و هم در حومه پوشش می دهد.
مناطق پیرامون شهری دارای ویژگی های مورفولوژیکی و اجتماعی-فرهنگی منحصر به فردی هستند که نیازمند بررسی دقیق است. ما در مطالعه مشاهده کردیم که مناطق محروم در داخل شهر بسیار متراکم هستند و کمتر از ۱ درصد مناطق دارای پوشش گیاهی هستند. مناطق حومه شهری تمایل به ترکیب پوشش گیاهی بالاتری دارند (بین ۱۰ تا ۲۰ درصد پوشش گیاهی). کارهای آینده این ویژگی های منحصر به فرد را بررسی کرده و مدل های قوی تری را توسعه خواهند داد.
این مطالعه فرض میکند که ویژگیهای ما نماینده وضوح زمانی است زیرا مناطق شهری به سرعت تغییر نمیکنند. فاصله زمانی داده ها ۱۰ سال بود. در حالی که این معقول است، ما تصدیق می کنیم که تفاوت های زمانی ممکن است بر عملکرد مدل تاثیر بگذارد. به عنوان مثال، زاغه های تخلیه شده به حساب نمی آمدند. شایان ذکر است که خطاهای ذاتی در داده های مکانی باز در مدل منتشر می شود و پیچیدگی های مدل سازی را افزایش می دهد.