پایداری | متن کامل رایگان | پیش‌بینی‌های خشکسالی فضایی با ادغام یک ماشین یادگیری افراطی پیشرفته و قوی با داده‌های شبکه‌بندی شده: مطالعه موردی حوضه زمین اصلی، بریتیش کلمبیا، کانادا - شهرساز | سایت تخصصی شهرسازی با هوش مصنوعی | شهرساز

بهترین آموزش های کاربردی در شهرسازی

بهترین آموزش های کاربردی در شهرسازی را از Urbanity.ir بخواهید

تکنیک درخت حل مسائل: راهی جهت حل مسائل پیچیده

ادامه ...

عضو کانال انجمن شهرسازی ایران در واتس اپ شوید :https://whatsapp.com/channel/0029…

ادامه ...

Monday, 6 May , 2024
امروز : دوشنبه, ۱۷ اردیبهشت , ۱۴۰۳

آخرین اخبار »

شناسه خبر : 7532

ارسال

پرینتخانه » مقالات تاریخ انتشار : 21 آوریل 2024 - 3:30 | 13 بازدید | ارسال توسط : riazat

پایداری | متن کامل رایگان | پیش‌بینی‌های خشکسالی فضایی با ادغام یک ماشین یادگیری افراطی پیشرفته و قوی با داده‌های شبکه‌بندی شده: مطالعه موردی حوضه زمین اصلی، بریتیش کلمبیا، کانادا

۱٫ معرفی خشکسالی، یک بلایای طبیعی پیچیده و کم‌شناخته است که در دهه‌های اخیر به طور فزاینده‌ای شیوع پیدا کرده است و مدیریت مؤثر و استراتژی‌های حفظ منابع را ضروری می‌کند. [۱,۲]. اثرات خشکسالی بر کشاورزی، منابع آب، اکوسیستم ها و سکونتگاه های انسانی شدید است و در سطح جهانی در حال افزایش است. فعالیت‌های […]

۱٫ معرفی

خشکسالی، یک بلایای طبیعی پیچیده و کم‌شناخته است که در دهه‌های اخیر به طور فزاینده‌ای شیوع پیدا کرده است و مدیریت مؤثر و استراتژی‌های حفظ منابع را ضروری می‌کند. [۱,۲]. اثرات خشکسالی بر کشاورزی، منابع آب، اکوسیستم ها و سکونتگاه های انسانی شدید است و در سطح جهانی در حال افزایش است. فعالیت‌های انسان‌زایی که پویایی جو را مختل می‌کنند، به تشدید فراوانی و شدت رویدادهای خشکسالی کمک می‌کنند. [۳]. کاهش این اثرات به ابزارهای هشدار اولیه کارآمد برای کمک به جوامع روستایی در آماده سازی نیاز دارد [۴]. خشکسالی ها که به دلیل عوامل اقلیمی، توپوگرافی و تقاضای آب قابل توجه است، چالش بزرگی را ایجاد می کند که باعث خسارات اقتصادی، زیست محیطی و اجتماعی می شود. طول مدت طولانی آنها مستلزم نظارت و پیش بینی دقیق، ادغام داده های هواشناسی و سنجش از دور است. [۵].

پیش بینی خشکسالی برای توسعه پایدار و کاهش خطر بلایا بسیار مهم است. روش‌های هوش مصنوعی (AI)، با بهره‌گیری از تکنیک‌های هوش محاسباتی، در پیش‌بینی سری‌های زمانی هواشناسی و افزایش قابلیت‌های پیش‌بینی خشکسالی قدرتمند ثابت شده‌اند. [۶,۷,۸,۹]. سهم هوش مصنوعی در توسعه محیط زیست، به ویژه در مدیریت ریسک بلایا، قابل توجه است [۱۰]. برخلاف مدل‌های سنتی، مدل‌های هوش مصنوعی با در نظر گرفتن متغیرهای متعدد و روابط غیرخطی، دقت پیش‌بینی پیشرفته‌تری را ارائه می‌کنند. [۱۱]. پیش بینی خشکسالی در مدیریت پیشگیرانه منابع آب، استراتژی کشاورزی و آمادگی در برابر بلایا مهم است. پیشرفت تکنیک‌های هوش مصنوعی شور و شوق فزاینده‌ای را برای استفاده از پتانسیل آن‌ها برای افزایش دقت در پیش‌بینی خشکسالی برانگیخته است. [۱۰].

دیکشیت و همکاران [۱۲] مطالعه ای را با هدف پیش بینی خشکسالی در نیو ساوت ولز استرالیا انجام داد. آنها از شاخص استاندارد تبخیر و تعرق بارش (SPEI) به دلیل محاسبه جامع آن استفاده کردند که دما و بارندگی را در نظر می گیرد و پیش بینی خشکسالی را بهبود می بخشد. با استفاده از داده های واحد تحقیقات آب و هوا، این شاخص در دوره های مختلف (۱، ۳، ۶ و ۱۲ ماه) ساخته شد. تجزیه و تحلیل آنها ۱۳ پیش بینی کننده، از جمله دمای سطح دریا، عوامل آب و هوا، و متغیرهای متنوع هواشناسی را شامل می شود. آنها با استفاده از مدل‌های پیش‌بینی شبکه عصبی مصنوعی (ANN) و ماشین بردار پشتیبان (SVM) که بر روی داده‌های سال‌های ۱۹۰۱ تا ۲۰۱۰ آموزش دیده‌اند، عملکرد مدل‌ها را در طول هشت سال (۲۰۱۱-۲۰۱۸) ارزیابی کردند. نتایج عملکرد برتر ANN را نشان داد (R² = 0.86) در مقایسه با SVM (R² = 0.75) در پیش بینی الگوهای خشکسالی موقت. جالب توجه است، این مطالعه حداقل تأثیر شاخص‌های آب و هوایی (به عنوان مثال، نوسان ده ساله اقیانوس آرام) و دمای سطح دریا را بر خشکسالی‌های موقتی نشان داد. ژانگ و همکاران [۱۳] یک مدل متمایز پیش‌بینی خشکسالی با استفاده از اندازه‌گیری‌های هواشناسی، شاخص‌های خشکسالی و سیگنال‌های آب و هوایی از ۳۲ ایستگاه در استان شانشی چین ابداع کرد. آنها از تابع همبستگی متقاطع استفاده کردند و تکنیک‌های مدل غیرخطی تاخیر (DLNM) را برای انتخاب پیش‌بینی‌کننده‌ها و تعیین مدت تاخیر آن‌ها توزیع کردند. مدل‌های DLNM، ANN و XGBoost برای پیش‌بینی SPEI برای ۱ تا ۶ ماه در مقابل یکدیگر قرار گرفتند. مدل XGBoost به عنوان پیشتاز ظاهر شد و R² مقادیر ۰٫۶۸-۰٫۹۵ در زمان های مختلف (۳، ۶، ۹ و ۱۲ ماه) و نمایش دقت برتر در پیش بینی خشکسالی کلی، متوسط، شدید و شدید. آچیت و همکاران [۱۴] چندین تکنیک یادگیری ماشین (ML) -ANN، ANFIS، SVM و درخت تصمیم (DT) – برای پیش‌بینی خشکسالی هیدرولوژیکی در حوضه Wadi Ouahrane در الجزایر به کار گرفته شد. نویسندگان مدل ها را با استفاده از معیارهای ارزیابی ارزیابی کردند و دریافتند که SVM موثرترین در پیش بینی دقیق خشکسالی های هیدرولوژیکی است. قابل ذکر است که مدل SVM به ضریب تعیین ۰٫۹۵ برای مقیاس زمانی ۱۲ ماهه دست یافت که کارایی آن را در بازه های زمانی مختلف نشان می دهد. لی و همکاران [۱۵] یک استراتژی جدید پیش‌بینی خشکسالی هواشناسی را با ترکیب الگوی نوسانات SST قبلی (ASFP) و تکنیک‌های ML مانند SVR، ماشین یادگیری شدید (ELM) و جنگل تصادفی (RF) بررسی کرد. آنها این رویکرد را برای چهار حوضه رودخانه مستعد خشکسالی در سطح جهان اعمال کردند و از دوره های سرب ۱ و ۳ ماهه برای پیش بینی SPEI استفاده کردند. یافته‌های آنها برتری مدل ASFP-ELM را در پیش‌بینی تکامل خشکسالی مکانی-زمانی برجسته کرد. تحقیقات بیشتر به مدل‌های ترکیبی ML تقویت‌شده با الگوریتم‌های بهینه‌سازی برای پیش‌بینی خشکسالی افزایش یافته است. محمدی و همکاران [۱۶] استفاده از مدل‌های SVM، شبکه تابع پایه شعاعی (RBFNN)، ANFIS، و پرسپترون چندلایه (MLP) برای پیش‌بینی خشکسالی‌های اقلیمی در ایران با استفاده از داده‌های گستره از سال ۱۹۸۰ تا ۲۰۱۴٫ ترکیب الگوریتم مردم عشایر (NPA)، خفاش، ازدحام سالپ، و کریل الگوریتم‌ها دقت و سرعت همگرایی مدل‌های محاسباتی نرم را تقویت کردند. در مورد آنها، مدل‌های ترکیبی ML عملکرد بهبود یافته‌ای را نشان دادند، و در پیش‌بینی شاخص بارش استاندارد شده ۳ ماهه، از مدل‌های مستقل بهتر عمل کردند. نبی پور و همکاران [۱۷] ترکیبی از مدل‌های شبکه عصبی مصنوعی و الگوریتم‌های بهینه‌سازی مانند الگوریتم بهینه‌سازی ملخ (GOA)، الگوریتم ازدحام سالپ (SSA)، بهینه‌سازی ازدحام ذرات (PSO) و بهینه‌سازی مبتنی بر جغرافیای زیستی (BBO) را برای پیش‌بینی کوتاه‌مدت خشکسالی هیدرولوژیکی اتخاذ کرد. مدل‌های ترکیبی آن‌ها، به‌ویژه مدل ANN همراه با الگوریتم PSO، از مدل‌های ANN معمولی بهتر عمل کردند و دقت پیش‌بینی‌کننده‌ای را برای شاخص‌های مختلف خشکسالی در مقیاس‌های زمانی مشخص نشان دادند.

در حالی که خشکسالی گریبانگیر بریتیش کلمبیا شده است، تحقیقات موجود فاقد ابزارهای ML مناسب برای پیش‌بینی خشکسالی هیدرولوژیکی است. این مطالعه پیشگام ماشین یادگیری افراطی پیشرفته Outlier Robust (IORELM)، یک تکنیک جدید ML، برای ساخت مدل‌های پیش‌بینی قوی در استان است. برخلاف مطالعات قبلی، IORELM با تجزیه و تحلیل دقیق ترکیب‌های ورودی مختلف بر اساس شاخص خشکسالی استاندارد چند متغیره (MSDI) فراتر از چارچوب‌های موجود می‌رود تا مطمئن‌ترین مدل را برای پیش‌بینی خشکسالی‌های آینده شناسایی کند.

این رویکرد جدید وعده غلبه بر محدودیت‌های فعلی در پیش‌بینی خشکسالی را می‌دهد و راه را برای بهبود قابل توجه استراتژی‌های مدیریت آب هموار می‌کند. با فعال کردن پیش‌بینی‌های دقیق، IORELM می‌تواند اجرای پروتکل‌های نظارتی قوی و شیوه‌های مصرف پایدار آب را تقویت کند. این به نوبه خود، تلاش‌های کاهش و حفاظت از منابع آب را در بریتیش کلمبیا تقویت می‌کند.

علاوه بر این، این مطالعه با بررسی موارد زیر زمینه جدیدی را ایجاد می کند:

اثربخشی IORELM برای پیش‌بینی خشکسالی: این نشان‌دهنده اولین کاربرد IORELM برای خشکسالی در بریتیش کلمبیا است که یک گام مهم به جلو را نشان می‌دهد.
ترکیب‌های ورودی بهینه: تجزیه و تحلیل ترکیب‌های مختلف بر اساس پارامترهای MSDI، مطمئن‌ترین مدل را انتخاب می‌کند که منجر به بهبود دقت پیش‌بینی می‌شود.
داده‌های تحلیل مجدد شبکه‌ای در پیش‌بینی خشکسالی: این رویکرد نوآورانه پتانسیل افزایش بیشتر قابلیت‌های پیش‌بینی را دارد.

با کاوش در این مسیرهای ناشناخته، این مطالعه یک رویکرد پیشگامانه برای پیش بینی خشکسالی در بریتیش کلمبیا ارائه می دهد که در نهایت به آینده ای پایدارتر برای منابع آبی استان کمک می کند.

۳٫ نتایج

پیروی از روش شناسی ذکر شده در مرجع [۳۰,۳۱,۳۴]SPI و شاخص استاندارد رطوبت خاک (SSI) با استفاده از مجموعه داده‌های مربوط به بارش و رطوبت خاک محاسبه می‌شوند. برای بررسی MSDI در یک مقیاس زمانی (روزانه)، SPI و SSI برای مدت زمان یکسان محاسبه می‌شوند تا امکان مقایسه متقابل فراهم شود. در مناطق مختلف شبکه، سه تابع جفت (فرانک، گامبل، و کلیتون) انتخاب می‌شوند، زیرا این توابع کوپولا معمولاً در مطالعات خشکسالی استفاده می‌شوند. [۴۲,۴۳,۴۴].

اثربخشی مدل‌های مختلف کوپولا در نمایش دقیق رابطه بین بارندگی و رطوبت خاک. در میان گزینه ها، گامبل کوپولا به عنوان انتخاب ارجح برای اکثر موارد ظاهر می شود، همانطور که توسط مسعود و همکاران ارائه شده است. [۴۵]. اگر مقدار p متناظر آن برابر یا بالاتر از ۰٫۰۵ (سطح معناداری ۵٪) باشد، یک مدل کوپولا حفظ می شود. این تست ها برای حفظ سازگاری با تجزیه و تحلیل SPI و SSI انجام می شود.

در این مطالعه، در مجموع ۱۴ ورودی، همانطور که در جدول ۲، در ترکیبات مختلف مورد استفاده قرار گرفتند. تعداد کل داده ها برای هر ورودی ۱۵۲۳ بود. داده ها برای پیش بینی خشکسالی با استفاده از تکنیک ML کافی بود. [۱۰,۴۰]. این ورودی ها یک مجموعه داده جامع شامل ۱۶۳۸۳ ترکیب مجزا برای اهداف مدل سازی ایجاد کردند. در میان این ورودی‌ها، تمرکز اولیه روی دو پارامتر کلیدی MSDI قرار گرفت که شامل بارش (Pتی)) و رطوبت خاک (SM(تی)) متغیرها. این پارامترها با استفاده از محدوده‌ای از فواصل تاخیر، از یک تاخیر یک روزه تا یک تاخیر شش روزه (Pتی – i) و SM(تی – i)). هدف این مطالعه به دست آوردن روابط زمانی متغیر بین متغیرهای ورودی و پیامدهای هدف با ترکیب فواصل تاخیری مختلف بود. این کاوش گسترده از ترکیب‌های ورودی، بررسی کامل عملکرد پیش‌بینی مدل‌های ML را در مجموعه‌ای متنوع از شرایط محیطی و زمینه‌های زمانی تسهیل کرد.

فرآیند مدل‌سازی شامل طبقه‌بندی مقادیر MSDI برای چهار ایستگاه مجزا با استفاده از ترکیب‌های مختلف ورودی‌های فهرست‌شده در جدول ۲. در این جدول P(تی – i) تاخیر یکم کل بارش را نشان می دهد و SM(تی – i) یکمین تاخیر رطوبت خاک است. این ترکیب ها از استفاده از یک ورودی تا ترکیب هر ۱۴ ورودی به طور همزمان متغیر بودند. هر ورودی نشان دهنده یک متغیر خاص مربوط به MSDI است، مانند بارش و رطوبت خاک، با تغییرات در فواصل زمانی ثبت شده در فواصل تاخیر از یک ماه تا شش روز. با کاوش در این ترکیب‌های ورودی متنوع، این مطالعه با هدف تجزیه و تحلیل جامع چگونگی تأثیر ترکیب‌های مختلف متغیرها و روابط زمانی بر طبقه‌بندی مقادیر MSDI در چهار ایستگاه انجام شد. این رویکرد امکان بررسی کامل قابلیت‌های پیش‌بینی مدل‌های ML را تحت سناریوهای مختلف فراهم می‌کند و بینش‌هایی را در مورد تأثیرگذارترین عوامل مؤثر بر طبقه‌بندی MSDI در زمینه‌های مکانی و زمانی مختلف ممکن می‌سازد.

برای ارزیابی عملکرد طبقه‌بندی ML با در نظر گرفتن بهترین مجموعه‌های آماری ورودی‌ها و ارزیابی کارآمدی این مدل‌ها می‌توانند شاخص خشکسالی MSDI را با استفاده از داده‌های بارش و رطوبت خاک پیش‌بینی کنند، از پنج آزمون ارزیابی (دقت، CA، یادآوری، AUC و F1- استفاده کردیم. نمره). در اینجا توضیح مختصری از هر یک از معیارهای پنج ارزیابی مورد استفاده ارائه شده است.

متریک دقیق، نسبت شناسایی های مثبتی را که واقعاً درست بوده اند، اندازه گیری می کند. تعداد مثبت‌های واقعی تقسیم بر تعداد کل پیش‌بینی‌های مثبت (مجموع مثبت‌های درست و مثبت کاذب) است. [۴۶]. یادآوری (حساسیت) نسبت موارد مثبت واقعی را که به درستی شناسایی شده اند ارزیابی می کند. با تقسیم تعداد مثبت های واقعی بر مجموع مثبت های واقعی و منفی های کاذب محاسبه می شود [۴۷]. این معیار زمانی حیاتی است که هزینه از دست دادن یک مثبت واقعی قابل توجه باشد. F1-Score میانگین هارمونیک Precision و Recall است [۴۸]. این تعادل بین معیارهای دقت و یادآوری را نشان می‌دهد و یک امتیاز واحد را ارائه می‌کند که نشان‌دهنده قوی بودن توانایی مدل برای طبقه‌بندی صحیح موارد مثبت است. به ویژه زمانی مفید است که فرد نیاز دارد هم مثبت کاذب و هم منفی کاذب را در نظر بگیرد. CA درصد کلی پیش‌بینی‌های صحیح، هم مثبت و هم منفی واقعی، در میان تعداد کل موارد بررسی شده است. [۴۹]. این شهودی ترین معیار عملکرد است، صرفاً نسبتی از مشاهدات پیش بینی شده درست به کل مشاهدات. AUC یک معیار کلی از عملکرد در تمام آستانه های طبقه بندی ممکن را ارائه می دهد. توانایی مدل را برای تمایز بین طبقات مثبت و منفی اندازه گیری می کند [۵۰]. AUC 1 نشان دهنده پیش بینی کامل است، در حالی که AUC 0.5 نشان دهنده عدم قدرت تمایز است. [۵۱]. علاوه بر این، نتایج بهینه هر پنج آزمایش برای چهار ایستگاه در منطقه مورد مطالعه نیز مورد ارزیابی قرار گرفت، که امکان ارزیابی جامع از دقت نتایج طبقه‌بندی را فراهم کرد.

در بخش زیر، ارزیابی هر یک از نتایج آزمون برای چهار ایستگاه واقع در منطقه مورد مطالعه به تصویر کشیده شده است. شکل ۴. این ارقام با ارائه مقدار متوسط هر متریک که از مدل‌سازی در مرحله آزمایش به دست می‌آید، یک نمای کلی جامع ارائه می‌کند. عملکرد هر ایستگاه به طور جداگانه مورد بحث قرار می گیرد و امکان تجزیه و تحلیل دقیق کارایی مدل را در مکان های مختلف در منطقه مورد مطالعه فراهم می کند.

از نتایج آزمون دقت برای چهار ایستگاه بر اساس شکل ۴الف، می‌توانیم استنباط کنیم که ایستگاه Pitt Meadows بالاترین امتیاز دقت را دارد، که نشان می‌دهد، برای آن ایستگاه خاص، مدل از بین چهار طبقه‌بندی مرتبط‌ترین طبقه‌بندی را انجام داده است. کمترین امتیاز دقت مربوط به ایستگاه غربی ونکوور است، که نشان می‌دهد در مقایسه با سایرین، نقاط مثبت کاذب نسبتاً بیشتر یا مثبت‌های واقعی کمتری داشته است.

با توجه به موقعیت این ایستگاه ها در محدوده مورد مطالعه و اثرات نزدیکی به ویژگی های جغرافیایی مختلف مانند اقیانوس (به سمت جنوب غربی) یا حرکت به سمت شمال یا جنوب در داخل حوضه، ایستگاه های نزدیک به اقیانوس ممکن است تحت تأثیر پایداری بیشتر قرار گیرند. و شرایط رطوبت بالاتر به دلیل نزدیکی بدنه آبی. این به طور بالقوه می تواند بر شاخص خشکسالی MSDI تأثیر بگذارد زیرا عواملی مانند بارش و رطوبت خاک ممکن است الگوهای متفاوتی در نزدیکی مناطق ساحلی در مقایسه با مناطق داخلی داشته باشند. [۵۲,۵۳]. علاوه بر این، ایستگاه های واقع در بخش شمالی منطقه مورد مطالعه ممکن است الگوهای آب و هوایی متفاوتی را تحت تأثیر زمین و فاصله از اقیانوس تجربه کنند، که می تواند منجر به تغییرات در میزان بارش و رطوبت خاک شود. به طور مشابه، این عوامل همچنین می‌توانند بر مناطقی در بخش جنوبی مطالعه موردی، همراه با فعالیت‌های انسانی بالقوه که ممکن است بر شرایط آب و هوایی محلی تأثیر بگذارند، تأثیر بگذارند.

برای ارزیابی میانگین نتایج مقادیر آزمون CA برای چهار ایستگاه، ما آنالیز کردیم شکل ۴b، که میانگین مقادیر CA ارائه شده را نشان می دهد. میانگین مقدار CA برای چهار ایستگاه تقریباً ۰٫۷۰۲ است. میانگین CA بالاتر نشان می دهد که مدل دارای نرخ پیش بینی کلی خوبی است [۵۴]. با این حال، ذکر این نکته ضروری است که اگرچه CA بالا مطلوب است، اما تنها معیاری نیست که باید در نظر گرفته شود، به ویژه در مجموعه داده هایی که ممکن است عدم تعادل بین کلاس ها داشته باشند. معیارهای دیگر مانند Precision، Recall، F1 امتیاز و AUC می‌توانند درک دقیق‌تری از عملکرد مدل ارائه دهند، به‌ویژه از نظر توانایی آن در مدیریت مثبت‌ها و منفی‌های کاذب.

با مقادیر CA ارائه شده، می‌توانیم مشاهده کنیم که آنها بالا هستند، که نشان می‌دهد مدل دارای قابلیت پیش‌بینی مناسبی در سراسر منطقه مورد مطالعه برای شاخص خشکسالی MSDI است که از بارش و رطوبت خاک به عنوان ورودی استفاده می‌کند. [۵۵]. همچنین برای به دست آوردن دید جامعی از عملکرد مدل، نگاهی به معیارهای دیگر مفید خواهد بود.

که در شکل ۴ج، AUC نشان دهنده درجه ای از تفکیک پذیری است. این نشان می دهد که مدل تا چه حد قادر به تمایز بین کلاس ها است. مقادیر بالاتر AUC معمولاً عملکرد بهتر مدل را نشان می دهد [۵۰]. میانگین مقدار AUC برای چهار ایستگاه ۰٫۷۴۵ است. برای تجزیه و تحلیل مقادیر AUC در رابطه با موقعیت جغرافیایی ایستگاه ها، ایستگاه های نزدیک به اقیانوس (ایستگاه های ونکوور غربی و ونکوور) مقادیر AUC بالاتری دارند. این بدان معناست که مناطق ساحلی ممکن است الگوهای ثابت تری از بارش و رطوبت خاک به دلیل نفوذ دریا داشته باشند. این می‌تواند منجر به سیگنال سازگارتر در داده‌هایی شود که مدل ML می‌تواند از آن بیاموزد، که به طور بالقوه منجر به مقادیر AUC بالاتر می‌شود. از این رو، یک مقدار AUC بالاتر، تفکیک پذیری بهتر بین طبقات را نشان می دهد، که نشان می دهد که مدل می تواند به خوبی بین شرایط خشکسالی و غیر خشکی تمایز قائل شود. این می تواند به دلیل الگوهای واضح تر در داده های آب و هوایی در نزدیکی ساحل باشد.

علاوه بر این، ایستگاه‌های نزدیک‌تر به شمال یا جنوب (دور از اقیانوس)، ممکن است مقادیر AUC متنوع‌تری را به دلیل ریزاقلیم‌های متنوع و طیف وسیع‌تری از تأثیرات بر بارش و رطوبت خاک، مانند ارتفاع، زمین، و فاصله از اقیانوس‌های معتدل نشان دهند. اثرات به طور خلاصه، مقادیر AUC نشان می‌دهد که مدل طبقه‌بندی در تمایز بین کلاس‌ها در سراسر ایستگاه‌های منطقه مورد مطالعه نسبتاً خوب است. تفاوت های جزئی در مقادیر AUC ممکن است منعکس کننده تأثیرات ظریف جغرافیای محلی و آب و هوا باشد. این مدل باید بر روی داده‌های متنوعی آموزش داده شود که طیف کامل شرایط را در سراسر منطقه مورد مطالعه ثبت کند تا عملکرد بالا در همه مکان‌ها حفظ شود.

شکل ۴d شامل مقادیر آزمون فراخوان برای چهار ایستگاه در منطقه مورد مطالعه، حوضه زمین اصلی در بریتیش کلمبیا است. میانگین مقدار Recall برای چهار ایستگاه تقریباً ۰٫۳۶۱ است. برای تجزیه و تحلیل مقادیر فراخوان در رابطه با موقعیت جغرافیایی ایستگاه‌ها، ایستگاه‌های نزدیک به اقیانوس (ایستگاه‌های ونکوور غربی و ونکوور) الگوهای رطوبتی قابل پیش‌بینی‌تری به دلیل نزدیکی به حجم‌های بزرگ آبی دارند که می‌تواند منجر به فراخوان بیشتر شود. زیرا مدل ممکن است رویدادهای واقعی خشکسالی را بهتر شناسایی کند. با این حال، فرض کنید الگوهای خشکسالی به دلیل آب و هوای دریایی کمتر رایج است. در آن صورت، Recall ممکن است کمتر باشد، زیرا رویدادهای خشکسالی کمتری برای شناسایی وجود دارد، که می‌تواند بر توانایی مدل برای یادگیری از چنین رویدادهایی تأثیر بگذارد. علاوه بر این، آن ایستگاه‌هایی که از اقیانوس دور هستند ممکن است الگوهای آب و هوایی متغیرتری را تجربه کنند و به طور بالقوه سطوح رطوبت خاک قابل پیش‌بینی کمتری را به دلیل زمین و ارتفاع داشته باشند، که اگر مدل نتواند همه موارد مثبت را شناسایی کند منجر به یادآوری کمتری می‌شود.

متناوباً، وضعیتی را در نظر بگیرید که در آن وقوع خشکسالی مکرر است، و این مدل به اندازه کافی بر روی یک مجموعه داده قابل توجهی آموزش داده شده است که به دقت این شرایط را نشان می دهد. این بدان معنی است که مدل در طول مرحله آموزش خود در معرض موارد زیادی از رویدادهای خشکسالی قرار گرفته است. در نتیجه، درک کاملی از الگوها و ویژگی های مرتبط با خشکسالی دارد. این آموزش پیشرفته، مدل را قادر می‌سازد تا پدیده‌های مرتبط با خشکسالی را بهتر پیش‌بینی و تجزیه و تحلیل کند، و بینش‌های ارزشمندی را در مورد علل، تأثیرات و استراتژی‌های کاهش احتمالی آن‌ها ارائه دهد. در آن صورت، فراخوان ممکن است بالاتر باشد زیرا مدل یاد می‌گرفت که نشانه‌های خشکسالی را به طور مؤثرتری شناسایی کند. مقادیر فراخوان نسبتاً پایین در سراسر ایستگاه ها نشان می دهد که مدل ممکن است تعداد قابل توجهی از رویدادهای خشکسالی واقعی را از دست داده باشد. این می تواند به دلیل عوامل مختلفی از جمله مجموعه داده های نامتعادل (که در آن تعداد رویدادهای غیر خشکسالی بسیار بیشتر از رویدادهای خشکسالی است)، نمایش ناکافی ویژگی های خشکسالی در ویژگی های مورد استفاده برای آموزش، یا تعاملات پیچیده بین متغیرهای آب و هوایی که مدل گرفتن نیست [۵۶].

شکل ۴e شامل مقادیر آزمون F1-Score برای چهار ایستگاه در منطقه مورد مطالعه است. میانگین مقدار F1-Score برای چهار ایستگاه تقریباً ۰٫۵۸۳ است. با توجه به شکل ۴e، ایستگاه‌های نزدیک‌تر به اقیانوس، الگوهای بارش و رطوبت خاک سازگارتر و قابل اندازه‌گیری‌تری دارند، به دلیل تأثیر دریایی، که منجر به الگوهای واضح‌تری برای مدل ML می‌شود تا از آنها یاد بگیرد. این به دلیل دقت مدل و فراخوانی بهتر، به طور بالقوه می تواند منجر به امتیازات F1 بالاتر شود.

به عنوان ابزار بصری اولیه در این مطالعه، از نمودارهای ویولن برای نشان دادن توزیع مقادیر شاخص در تمامی ایستگاه ها و مدل ها استفاده شده است. این تصمیم با توانایی منحصر به فرد نمودارها برای ارائه یک نمای کلی جامع از داده ها، ادغام بینش در گرایش ها و پراکندگی مرکزی، مشخصه نمودارهای جعبه، با اطلاعات شکل توزیعی ارائه شده توسط نمودارهای چگالی است. [۲۸,۲۹]. به تصویر کشیدن تخمین‌های چگالی در هر دو طرف نمودار جعبه مرکزی اهمیت ویژه‌ای دارد، که چندوجهی یا چولگی بالقوه را در داده‌ها آشکار می‌کند – جزئیات ظریفی که ممکن است تحت روش‌های ترسیم جایگزین پنهان بماند. چنین ویژگی در تحلیل تطبیقی در بین گروه‌های مختلف مدل‌ها، که در آن تشخیص و نشان دادن تفاوت‌ها و شباهت‌های توزیعی با فوریت و وضوح بسیار مهم است، ارزشمند تلقی می‌شود. [۳۰,۳۶]. علی‌رغم نگرانی‌ها در مورد افزونگی احتمالی در نمایش داده‌ها، ادعا می‌شود که این جنبه از طرح‌های ویولن در واقع انتقال واضح‌تر اشکال توزیع به خوانندگان را تسهیل می‌کند، که ممکن است به طور گسترده با نمودارهای چگالی آشنا نباشند. [۳۰]. علاوه بر این، استفاده از یک روش بوت استرپ در استخراج این توزیع‌های احتمال برجسته شده است، با تاکید بر استحکام رویکرد و اطمینان از اینکه تخمین‌های ویژگی‌های توزیعی به خوبی بر اساس شواهد تجربی استوار است. [۲۸,۲۹]. بنابراین، با توضیح بیشتر در مورد منطق انتخاب و مبانی آماری تجزیه و تحلیل، هر گونه احتیاط در مورد استفاده از توطئه های ویولن در نظر گرفته شده است که از اثربخشی آنها در افزایش کارایی و وضوح مطالعه مقایسه ای ما حمایت می کند.

شکل ۵ نمودارهای ویولن را نشان می دهد که توزیع معیارهای مختلف را در ایستگاه های مختلف نشان می دهد. این نمودارها از منحنی‌های چگالی برای نشان دادن توزیع داده‌های عددی در هر گروه استفاده می‌کنند، با عرض منحنی‌ها منعکس کننده فرکانس تقریبی نقاط داده در مناطق مربوطه. [۵۷]. با استفاده از منحنی‌های چگالی، این نمودارها تصویری بصری از گسترش و تمرکز داده‌ها را ارائه می‌دهند و به شناسایی الگوها و نقاط پرت در ایستگاه‌ها کمک می‌کنند. علاوه بر این، یک نوع نمودار روکش‌شده، مانند نمودار جعبه، اغلب برای ارائه بینش‌های بیشتر همراه با هر منحنی چگالی گنجانده می‌شود. این ترکیب درک جامعی از تمایل و تنوع مرکزی داده ها را فراهم می کند، تجزیه و تحلیل مقایسه ای و تصمیم گیری آگاهانه در مورد عملکرد و ویژگی های ایستگاه را تسهیل می کند. [۵۸].

که در شکل ۵هر طرح ویولن توزیع خطای پیش‌بینی را برای ترکیب‌های ورودی مختلف در طول مرحله آزمایش نشان می‌دهد. اعداد نمایش داده شده در نمودارهای ویولن نشان دهنده مقادیر معیارهای عملکرد، از جمله دقت، یادآوری، دقت، امتیاز F1 و AUC است. محور x کرت ها به چهار نقطه مختصات تقسیم می شود که نشان دهنده چهار ایستگاه مجزا است. با بررسی توزیع خطای پیش‌بینی در این ایستگاه‌ها، می‌توان بینشی در مورد تغییرات عملکرد در ترکیب‌های ورودی در زمینه‌های فضایی مختلف به‌دست آورد. نمودارهای ویولن نشان می‌دهند که چگونه ترکیب‌های مختلف متغیرهای ورودی بر دقت پیش‌بینی و تغییرپذیری در ایستگاه‌ها تأثیر می‌گذارند. با تجزیه و تحلیل شکل و گسترش نمودارهای ویولن، الگوها و روندهای توزیع خطای پیش‌بینی را می‌توان شناسایی کرد که به ارزیابی و مقایسه عملکرد مدل در شرایط ورودی مختلف کمک می‌کند. این تجسم جامع درک عمیق‌تری از قابلیت‌های پیش‌بینی مدل‌ها و تأثیر ترکیب‌های ورودی بر عملکرد آنها در مکان‌های مختلف ایستگاه را تسهیل می‌کند.

شکل ۵a متریک دقیق را در چهار ایستگاه از طریق طرح ویولن بررسی می کند. مقادیر دقت میانه، که نشان دهنده نقطه میانی توزیع داده ها است، در سراسر ایستگاه ها ثابت می ماند و بین ۰٫۶ و ۰٫۶۳ شناور است. ایستگاه پیت دارای بالاترین دقت متوسط است، در حالی که غرب ونکوور کمترین را نشان می دهد. توزیع نقاط داده در اطراف میانه و چارک اول (Q1) از یک الگوی مشابه در سراسر ایستگاه ها پیروی می کند، که نشان دهنده خوشه بندی مقادیر در این محدوده است. با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر چارک سوم (Q3)، حداکثر و حداقل هستیم که ۱٫۵ برابر محدوده بین چارکی (IQR) است. این نشان‌دهنده کاهش تنوع در طول این مسیر است. جالب توجه است که لنگلی با حداکثر مقدار Q1 در ۰٫۵۵ برجسته است، در حالی که West Vancouver کمترین مقدار را با ۰٫۵۱ ثبت می کند. با وجود این تنوع، مقادیر Q1 به طور کلی نسبتاً ثابت باقی می مانند. با مقایسه تفاوت‌های بین Q1 و Q3، متوجه یک الگوی ثابت در پیت و ونکوور می‌شویم، در حالی که وست ونکوور تفاوت قابل‌توجهی تقریباً ۰٫۱۱ را نشان می‌دهد که نشان‌دهنده تنوع بیشتر در این ایستگاه است. مقادیر حداکثر (Q4) و حداقل (Q0) روند مشابهی را در تمام ایستگاه ها دنبال می کنند که از ۰٫۸ تا ۰٫۷۶ برای Q4 و از ۰٫۴ تا ۰٫۳۶ برای Q0 متغیر است. وست ونکوور دارای بالاترین ارزش Q4 است، در حالی که ونکوور بالاترین Q0 را ثبت می کند. از سوی دیگر، لنگلی کمترین مقادیر را برای این چارک ها نشان می دهد. این یافته‌ها بینش‌های ارزشمندی را در مورد توزیع معیارهای دقیق در سراسر ایستگاه‌ها ارائه می‌دهند و تغییرات در عملکرد و تنوع را برجسته می‌کنند. درک این الگوها می تواند به شناسایی عواملی که بر عملکرد مدل تأثیر می گذارند کمک کند و تصمیمات را برای بهبود قابلیت های پیش بینی راهنمایی کند.

شکل ۵b نمودار ویولن را نشان می دهد که معیار فراخوان را در چهار ایستگاه نشان می دهد. مقادیر متوسط فراخوان در ایستگاه‌ها ثابت می‌ماند و از ۰٫۳۵ تا ۰٫۳۷ متغیر است. مانند Precision، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که ونکوور کمترین را نشان می دهد. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند که نشان دهنده یک الگوی مشترک در بین ایستگاه ها است. با این حال، ونکوور یک انحراف با داده های توزیع شده در اطراف میانه و Q3 نشان می دهد. با حرکت از پیت به لنگلی، تغییراتی را در مقادیر Q3، حداکثر و حداقل مشاهده می کنیم که ۱٫۵ برابر IQR است. حداکثر این مقدار در پیت مشاهده می شود، در حالی که ونکوور و لنگلی حداقل را نشان می دهند. با این حال، حداکثر Q1 در پیت (۰٫۳۵) رخ می دهد که ونکوور کمترین آن را با ۰٫۳۲ ثبت کرده است. تفاوت بین Q1 و Q3 در ایستگاه ها متفاوت است. در پیت و وست ونکوور، این تفاوت از ۰٫۳۴ تا ۰٫۳۹ متغیر است، در حالی که ونکوور بیشترین تفاوت را تقریباً ۰٫۱۶ نشان می دهد. مقادیر حداکثر (Q4) و حداقل (Q0) از یک الگوی ثابت در سراسر ایستگاه ها پیروی می کنند که از ۰٫۴۸ تا ۰٫۵۵ برای Q4 و ۰٫۲۵ تا ۰٫۳ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که ونکوور بالاترین Q0 را نشان می دهد. برعکس، ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این بینش‌ها، توزیع معیارهای فراخوان را در ایستگاه‌ها روشن می‌کند و تغییرات در عملکرد و تنوع را برجسته می‌کند. درک این الگوها می‌تواند راهنمایی ارزشمندی برای بهبود عملکرد مدل و قابلیت‌های پیش‌بینی در زمینه‌های فضایی مختلف ارائه دهد.

شکل ۵c متریک دقت را در چهار ایستگاه از طریق طرح ویولن بررسی می کند. مقادیر میانگین دقت در ایستگاه‌ها متفاوت است و از ۰٫۶۸ تا ۰٫۷۳ متغیر است. بار دیگر، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که وست ونکوور کمترین را نشان می دهد و الگوهای مشاهده شده در Precision را منعکس می کند. اکثر نقاط داده در اطراف میانه و Q1 در Pitt، West Vancouver و Langley جمع می شوند. با این حال، ونکوور الگوی متفاوتی را با مقادیری که حول میانه و Q3 توزیع می‌شوند، نشان می‌دهد. با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر Q3، حداکثر و حداقل هستیم که ۱٫۵ برابر IQR است. حداکثر این مقدار در پیت مشاهده می شود، در حالی که کمترین آن در غرب ونکوور است. حداکثر Q1 در پیت (۰٫۷۱) رخ می دهد که وست ونکوور با ۰٫۶۶ کمترین آن را ثبت کرده است. تفاوت بین Q1 و Q3 تقریباً در پیت و ونکوور ثابت می ماند، اما وست ونکوور بیشترین تفاوت را نشان می دهد. مقادیر Q4 و Q0 از یک الگوی ثابت در سراسر ایستگاه ها پیروی می کنند که از ۰٫۸۱ تا ۰٫۷۸ برای Q4 و از ۰٫۵۹ تا ۰٫۶۶ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که وست ونکوور بالاترین Q0 را نشان می دهد. برعکس، وست ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این بینش‌ها اطلاعات ارزشمندی را در مورد توزیع معیارهای دقت در ایستگاه‌ها ارائه می‌دهند و تغییرات در عملکرد و تنوع را برجسته می‌کنند. درک این الگوها می تواند به عنوان راهنمای بهبود عملکرد مدل و قابلیت های پیش بینی در زمینه های مختلف فضایی باشد.

شکل ۵d نمودار ویولن را نشان می دهد که معیار امتیاز F1 را در چهار ایستگاه نشان می دهد. مقادیر میانگین امتیاز F1 ثابت می ماند و از ۰٫۵۹ تا ۰٫۶ متغیر است. مشابه معیارهای قبلی، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که وست ونکوور کمترین را نشان می دهد. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند که نشان دهنده یک الگوی ثابت در سراسر ایستگاه ها است. اما با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر Q3، حداکثر و حداقل هستیم که ۱٫۵ برابر IQR است. با وجود این، ایستگاه پیت حداکثر مقدار Q1 (0.68) را نشان می دهد، در حالی که West Vancouver کمترین مقدار را با ۰٫۵۴ ثبت می کند. تفاوت بین Q1 و Q3 در ونکوور و ونکوور غربی نسبتاً ثابت است اما در پیت و لنگلی کمی متفاوت است و دامنه آنها کمتر از ونکوور و ونکوور غربی است. ونکوور بیشترین تفاوت را تقریباً ۰٫۰۸ نشان می دهد. مقادیر Q4 و Q0 الگوهای متنوعی را در تمام ایستگاه‌ها نشان می‌دهند که از ۰٫۷۴ تا ۰٫۸ برای Q4 و از ۰٫۴۱ تا ۰٫۵۶ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که وست ونکوور بالاترین Q0 را نشان می دهد. برعکس، ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این مشاهدات بینش‌هایی را در مورد توزیع معیارهای امتیاز F1 در ایستگاه‌ها ارائه می‌کنند و تغییرات در عملکرد و تنوع را برجسته می‌کنند. درک این الگوها می‌تواند راهبردهایی را برای افزایش عملکرد مدل و قابلیت‌های پیش‌بینی در زمینه‌های فضایی مختلف ارائه دهد.

شکل ۵e نمودار ویولن را نشان می دهد که متریک AUC را در چهار ایستگاه نشان می دهد. مشابه سایر معیارها، مقادیر AUC میانه ثابت می ماند و از ۰٫۶۴ تا ۰٫۶۶ متغیر است. جالب اینجاست که ایستگاه وست ونکوور بالاترین میانه را نشان می دهد، در حالی که ونکوور کمترین را ثبت می کند. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند، که نشان دهنده یک الگوی ثابت در سراسر ایستگاه ها است. با این حال، همانطور که از Pitt به Langley حرکت می کنیم، متوجه کاهش تدریجی مقادیر Q3، حداکثر و حداقل می شویم که ۱٫۵ برابر IQR است. یک استثنا در ایستگاه غربی ونکوور مشاهده می شود، جایی که حداکثر مقدار Q3 رخ می دهد. Q1 نسبتاً ثابت باقی می ماند و از ۰٫۷ تا ۰٫۷۲ متغیر است، با Pitt و West Vancouver بالاترین مقادیر و Vancouver و Langley کمترین مقدار را نشان می دهند. تفاوت بین Q1 و Q3 در تمام ایستگاه ها نسبتا ثابت باقی می ماند. مقادیر Q4 و Q0 از یک الگوی ثابت در تمام ایستگاه ها پیروی می کنند. این یافته‌ها بینش‌هایی در مورد توزیع معیارهای AUC در بین ایستگاه‌ها ارائه می‌دهند که نشان‌دهنده تغییرات در عملکرد و تنوع است. درک این الگوها می‌تواند راهبردهایی را برای افزایش عملکرد مدل و قابلیت‌های پیش‌بینی در زمینه‌های فضایی مختلف ارائه دهد.

نتایج ارائه شده در جدول ۳ بینش ارزشمندی را در مورد بهترین ترکیب های ورودی برای هر ایستگاه ارائه می دهد و عملکرد مدل را بهینه می کند.

در Pitt Meadows، ترکیبی که شامل مقادیر بارندگی گذشته در تاخیرهای زمانی خاص است (تی – ۲، تی – ۴) و مقادیر رطوبت خاک در وقفه های زمانی مجاور (تی – ۱، تی – ۳، تی – ۴، تی – ۵، تی – ۶)، همراه با بارش فعلی، بر اهمیت داده های تاریخی اخیر و مرتبط در پیش بینی دقیق شرایط خشکسالی تأکید می کند. به طور مشابه، در ونکوور و غرب ونکوور، تمرکز بر مقادیر اخیر رطوبت خاک در وقفه‌های زمانی متعدد و یک مقدار بارندگی گذشته، نقش حیاتی داده‌های رطوبت خاک از دوره‌های مختلف اخیر را در پیش‌بینی شرایط خشکسالی برجسته می‌کند. این تاکید بر داده های اخیر رطوبت خاک بر اهمیت آن ها در پیش بینی دقیق شرایط خشکسالی تاکید می کند. برعکس، در لنگلی، ترکیب بهینه شامل مقادیر بارندگی گذشته در وقفه های زمانی خاص است.تی – ۵)، همراه با مقادیر رطوبت خاک در وقفه های زمانی مجاور (تی – ۱، تی – ۳، تی – ۴، تی – ۵، تی – ۶) و بارش فعلی. این ترکیبی از داده‌های بارش گذشته و رطوبت خاک، با تأکید بر دوره‌های اخیر، به پیش‌بینی دقیق خشکسالی در لنگلی کمک می‌کند. به طور کلی، ترکیب‌های ورودی انتخاب‌شده بر اهمیت ترکیب داده‌های بارش و رطوبت خاک در بازه‌های زمانی مختلف برای پیش‌بینی مؤثر خشکسالی در ایستگاه‌های مختلف تأکید می‌کنند. این یافته‌ها بینش‌های ارزشمندی را برای افزایش عملکرد مدل و توانایی آن برای کاهش اثرات خشکسالی در این مناطق ارائه می‌کند.

برای کارهای طبقه‌بندی در ML، تنها با تکیه بر متریک دقیق نمی‌توان نمای کلی را ارائه کرد. [۵۹,۶۰]. برای تعیین عملکرد کلی مدل، باید در چارچوب معیارهای دیگر مانند Recall، F1-score، CA و AUC ارزیابی شود. هر یک از این معیارها بینش های متفاوتی را در مورد مثبت های واقعی، مثبت های کاذب، منفی های واقعی و منفی های کاذب و چگونگی ارتباط آنها با آستانه های مختلف مورد استفاده در فرآیند طبقه بندی می دهد. به عنوان مثال، یک ایستگاه با دقت بالا اما یادآوری کم ممکن است زمانی که کلاس خاصی را پیش‌بینی می‌کند، اما نمی‌تواند تمام نمونه‌های واقعی آن کلاس را شناسایی کند، بسیار دقیق است. [۶۱]. در مقابل، یک امتیاز F1 بالا نشان دهنده تعادل بین دقت و یادآوری است [۴۹].

شکل ۶ نشان دهنده بهترین مقادیر آزمون از هر پنج معیار ارزیابی برای چهار ایستگاه Lower Mainland Basin، بریتیش کلمبیا است. مقادیر نشان داده شده بر روی نقشه برای بهترین مقادیر تست هر ایستگاه در نشان داده شده است جدول ۴:

معیارهای عملکرد ارائه شده در جدول ۴ بینش های ارزشمندی را در مورد اثربخشی سیستم تشخیص در ایستگاه های نظارتی مختلف ارائه می دهد. وست ونکوور و ونکوور با مقادیر فراخوان بالاتر به ترتیب ۰٫۴۵۳ و ۰٫۴۱۳ متمایز هستند که نشان دهنده توانایی برتر آنها برای شناسایی صحیح موارد مثبت رویداد نظارت شده است. در مقابل، Pitt Meadows و Lanfley مقادیر یادآوری کمتری را نشان می‌دهند، که نشان‌دهنده پتانسیل از دست دادن تعداد قابل توجهی از نمونه‌های مثبت است. در مورد CA، وست ونکوور با CA 0.764 پیشتاز است، و پس از آن Lanfley با ۰٫۷۶۱ قرار دارد. این ایستگاه‌ها دقت نسبتاً بالاتری را در طبقه‌بندی موارد مثبت و منفی نشان می‌دهند. در مقابل، Pitt Meadows کمترین CA را در ۰٫۵۳۳ نشان می دهد که نشان دهنده دقت کلی پایین تر در طبقه بندی است. با توجه به AUC، وست ونکوور و ونکوور مقادیر بالاتری را به ترتیب ۰٫۸۶۹ و ۰٫۸۴۳ نشان می دهند که نشان دهنده عملکرد کلی بهتر در تشخیص موارد مثبت و منفی است. برعکس، Pitt Meadows و Lanfley مقادیر AUC کمتری را نشان می‌دهند که نشان‌دهنده توانایی تشخیص ضعیف‌تر در این ایستگاه‌ها است. امتیاز F1، که دقت و یادآوری را متعادل می کند، برای وست ونکوور (۰٫۷۸۹) بالاترین میزان را دارد و پس از آن ونکوور (۰٫۷۵۳) قرار دارد. این ایستگاه ها به تعادل بهتری بین شناسایی موارد مثبت واقعی و به حداقل رساندن مثبت کاذب دست می یابند. Pitt Meadows و Lanfley امتیازهای F1 پایین تری را نشان می دهند که نشان دهنده یک مبادله بین Precision و Recall است که می تواند بر عملکرد کلی تأثیر بگذارد. علاوه بر این، وست ونکوور و ونکوور مقادیر دقت بالاتری را نشان می‌دهند که نشان‌دهنده نرخ مثبت کاذب پایین‌تری در مقایسه با پیت میدوز و لانفلی است. این نشان می‌دهد که سیستم‌های تشخیص در این ایستگاه‌ها در شناسایی دقیق نمونه‌های مثبت واقعی بدون طبقه‌بندی اشتباه نمونه‌های منفی بهتر هستند.

با تجزیه و تحلیل مقادیر هر پنج معیار در شکل ۶ما دریافتیم که ایستگاه‌های نزدیک‌تر به اقیانوس احتمالاً به دلیل تأثیر تعدیل‌کننده آب، الگوهای آب‌وهوای شدیدتر و قابل پیش‌بینی‌تری دارند، که می‌تواند منجر به مقادیر بالاتر در AUC و CA شود. این معیارها ممکن است منعکس کننده توانایی بهتر مدل برای تمایز بین کلاس ها و طبقه بندی دقیق وضعیت فعلی به دلیل تنوع کمتر در داده های ورودی باشد. با این حال، مقادیر دقت و یادآوری ممکن است بسته به ویژگی های آب و هوایی خاص تحت تأثیر اقیانوس متفاوت باشد. به عنوان مثال، اگر رویدادهای خشکسالی به دلیل آب و هوای دریایی کمتر باشد، ممکن است یادآوری کمتر باشد، زیرا موارد مثبت کمتری برای پیش‌بینی وجود دارد. علاوه بر این، ایستگاه‌هایی که در داخل خشکی (شمال یا جنوب) واقع شده‌اند، ممکن است دامنه بیشتری از شرایط آب و هوایی داشته باشند، که به طور بالقوه منجر به نمرات آزمون‌های متنوع‌تر می‌شود. اگر مدل در تعمیم شرایط مختلف موجود در این مکان‌ها مشکل داشته باشد، AUC و CA ممکن است کمتر باشند.

در نتیجه، تجزیه و تحلیل بر تغییرات عملکرد در ایستگاه‌های نظارتی مختلف تأکید می‌کند، با وست ونکوور و ونکوور عملکرد نسبتا قوی‌تری را در مقیاس‌های چندگانه در مقایسه با پیت میدوز و لانفلی نشان می‌دهند. این یافته‌ها بر اهمیت در نظر گرفتن عملکرد خاص ایستگاه هنگام ارزیابی سیستم‌های تشخیص تأکید می‌کنند و ممکن است تلاش‌های آینده را برای بهینه‌سازی قابلیت‌های نظارت در مکان‌های خاص راهنمایی کنند. وقوع خاص شرایط خشکسالی ممکن است بر دقت تأثیر بگذارد. اگر رویدادهای خشکسالی به دلیل تأثیر کمتر دریایی در داخل خشکی با وضوح بیشتری تعریف شوند، دقت می تواند هنگام پیش بینی این رویدادها بیشتر باشد.

شکل ۷ نمودار ویولن اهداف و خروجی بهترین مدل را برای هر ایستگاه نشان می دهد.

شکل ۷a-d نمودارهای ویولن را نشان می دهد که اهداف و خروجی های بهترین مدل را برای هر ایستگاه نشان می دهد. مقادیر نشان‌داده‌شده در این پلات‌ها با سه کلاس ۳، ۴ و ۵ مطابقت دارد که نشان‌دهنده شدت خشک‌سالی در هر ایستگاه در بازه زمانی مشخص‌شده است. در تمام ایستگاه‌ها، مقدار Q1 به طور مداوم ۳ است که به عنوان میانه نیز عمل می‌کند. این سازگاری از ماهیت مقادیر هدف و خروجی ناشی می‌شود، که فقط می‌توانند یکی از سه مقدار را در نظر بگیرند: ۳، ۴ یا ۵٫ بنابراین، ممکن است میانه با مرزهای محدوده بین چارکی مطابقت داشته باشد. ماهیت گسسته داده ها علاوه بر این، برش ناگهانی توزیع برای مقادیر بالای متغیر تصادفی به دلیل محدودیت در روش نیست، بلکه به دلیل ماهیت گسسته داده‌ها است. از آنجایی که مقادیر به ۳ تا ۵ محدود می‌شوند، هر گونه مقادیر پرت یا شدید فراتر از این محدوده در توزیع وجود نخواهد داشت. در پیت، ونکوور و لنگلی، تفاوت قابل توجهی بین Q1 و Q3 در مقادیر خروجی و هدف وجود دارد، که نشان می‌دهد مدل در طول مرحله آزمایش تمایل به تخمین بیش از حد دارد. با این حال، این موضوع در ایستگاه غربی ونکوور کمتر برجسته است. علاوه بر این، در همه ایستگاه‌ها، مقدار Q0 خروجی‌ها از اهداف فراتر می‌رود، که نشان‌دهنده تمایل مدل برای پیش‌بینی سطوح شدت بالاتر از مشاهده‌شده است. توزیع داده ها در اطراف Q1، که دارای همان مقدار میانه است، از یک الگوی قابل پیش بینی پیروی می کند [۵۸,۶۲,۶۳]. این توزیع به دلیل محدوده محدود برچسب‌های کلاس، انتظار می‌رود که منجر به خوشه‌بندی اکثر نقاط داده در اطراف این مقادیر در همه ایستگاه‌ها شود. این یافته ها بینش هایی را در مورد عملکرد مدل در پیش بینی سطوح شدت خشکسالی در ایستگاه های مختلف ارائه می دهد. گرایش های مشاهده شده به سمت تخمین بیش از حد و توزیع ثابت نقاط داده، مناطقی را برای اصلاح بالقوه در قابلیت های پیش بینی مدل برجسته می کند. کاهش دقت مدل ML در پیش‌بینی خشکسالی نشان می‌دهد که داده‌های مربوط به خشکسالی را به اندازه نمونه‌های آموزشی غیر خشکسالی به طور مؤثر درک نکرده است. در نتیجه، تمایل به برآورد بیش از حد شرایط خشکسالی داشت [۴۰,۶۴]. برای کاهش تمایل مدل به برآورد بیش از حد سطوح شدت خشکسالی و تقویت قابلیت اطمینان یافته های ما، یک راه حل بالقوه جامع می تواند اصلاح فرآیند انتخاب ویژگی و بهینه سازی معماری مدل باشد. تنظیم پارامتر در کاهش تخمین بیش از حد نوید می دهد، همانطور که با اضافه کردن تاخیر داده ها به عنوان ورودی های جدید انجام دادیم، و تعریف پیچیده ترین معماری شبکه می تواند موثر باشد. علاوه بر این، کاوش الگوریتم‌های مختلف، ادغام تکنیک‌های تصحیح سوگیری یا روش‌های پس پردازش در مدل‌سازی می‌تواند انجام شود. [۱۴,۱۵,۱۶].

منبع:
۱- shahrsaz.ir , پایداری | متن کامل رایگان | پیش‌بینی‌های خشکسالی فضایی با ادغام یک ماشین یادگیری افراطی پیشرفته و قوی با داده‌های شبکه‌بندی شده: مطالعه موردی حوضه زمین اصلی، بریتیش کلمبیا، کانادا
,۲۰۲۴-۰۴-۲۱ ۰۳:۳۰:۰۰
۲- https://www.mdpi.com/2071-1050/16/8/3461

۱٫ معرفی

۳٫ نتایج

لغو پاسخ