۱٫ معرفی
خشکسالی، یک بلایای طبیعی پیچیده و کمشناخته است که در دهههای اخیر به طور فزایندهای شیوع پیدا کرده است و مدیریت مؤثر و استراتژیهای حفظ منابع را ضروری میکند. [
۱,
۲]. اثرات خشکسالی بر کشاورزی، منابع آب، اکوسیستم ها و سکونتگاه های انسانی شدید است و در سطح جهانی در حال افزایش است. فعالیتهای انسانزایی که پویایی جو را مختل میکنند، به تشدید فراوانی و شدت رویدادهای خشکسالی کمک میکنند. [
۳]. کاهش این اثرات به ابزارهای هشدار اولیه کارآمد برای کمک به جوامع روستایی در آماده سازی نیاز دارد [
۴]. خشکسالی ها که به دلیل عوامل اقلیمی، توپوگرافی و تقاضای آب قابل توجه است، چالش بزرگی را ایجاد می کند که باعث خسارات اقتصادی، زیست محیطی و اجتماعی می شود. طول مدت طولانی آنها مستلزم نظارت و پیش بینی دقیق، ادغام داده های هواشناسی و سنجش از دور است. [
۵].
پیش بینی خشکسالی برای توسعه پایدار و کاهش خطر بلایا بسیار مهم است. روشهای هوش مصنوعی (AI)، با بهرهگیری از تکنیکهای هوش محاسباتی، در پیشبینی سریهای زمانی هواشناسی و افزایش قابلیتهای پیشبینی خشکسالی قدرتمند ثابت شدهاند. [
۶,
۷,
۸,
۹]. سهم هوش مصنوعی در توسعه محیط زیست، به ویژه در مدیریت ریسک بلایا، قابل توجه است [
۱۰]. برخلاف مدلهای سنتی، مدلهای هوش مصنوعی با در نظر گرفتن متغیرهای متعدد و روابط غیرخطی، دقت پیشبینی پیشرفتهتری را ارائه میکنند. [
۱۱]. پیش بینی خشکسالی در مدیریت پیشگیرانه منابع آب، استراتژی کشاورزی و آمادگی در برابر بلایا مهم است. پیشرفت تکنیکهای هوش مصنوعی شور و شوق فزایندهای را برای استفاده از پتانسیل آنها برای افزایش دقت در پیشبینی خشکسالی برانگیخته است. [
۱۰].
دیکشیت و همکاران [
۱۲] مطالعه ای را با هدف پیش بینی خشکسالی در نیو ساوت ولز استرالیا انجام داد. آنها از شاخص استاندارد تبخیر و تعرق بارش (SPEI) به دلیل محاسبه جامع آن استفاده کردند که دما و بارندگی را در نظر می گیرد و پیش بینی خشکسالی را بهبود می بخشد. با استفاده از داده های واحد تحقیقات آب و هوا، این شاخص در دوره های مختلف (۱، ۳، ۶ و ۱۲ ماه) ساخته شد. تجزیه و تحلیل آنها ۱۳ پیش بینی کننده، از جمله دمای سطح دریا، عوامل آب و هوا، و متغیرهای متنوع هواشناسی را شامل می شود. آنها با استفاده از مدلهای پیشبینی شبکه عصبی مصنوعی (ANN) و ماشین بردار پشتیبان (SVM) که بر روی دادههای سالهای ۱۹۰۱ تا ۲۰۱۰ آموزش دیدهاند، عملکرد مدلها را در طول هشت سال (۲۰۱۱-۲۰۱۸) ارزیابی کردند. نتایج عملکرد برتر ANN را نشان داد (R
2 = 0.86) در مقایسه با SVM (R
2 = 0.75) در پیش بینی الگوهای خشکسالی موقت. جالب توجه است، این مطالعه حداقل تأثیر شاخصهای آب و هوایی (به عنوان مثال، نوسان ده ساله اقیانوس آرام) و دمای سطح دریا را بر خشکسالیهای موقتی نشان داد. ژانگ و همکاران [
۱۳] یک مدل متمایز پیشبینی خشکسالی با استفاده از اندازهگیریهای هواشناسی، شاخصهای خشکسالی و سیگنالهای آب و هوایی از ۳۲ ایستگاه در استان شانشی چین ابداع کرد. آنها از تابع همبستگی متقاطع استفاده کردند و تکنیکهای مدل غیرخطی تاخیر (DLNM) را برای انتخاب پیشبینیکنندهها و تعیین مدت تاخیر آنها توزیع کردند. مدلهای DLNM، ANN و XGBoost برای پیشبینی SPEI برای ۱ تا ۶ ماه در مقابل یکدیگر قرار گرفتند. مدل XGBoost به عنوان پیشتاز ظاهر شد و R
2 مقادیر ۰٫۶۸-۰٫۹۵ در زمان های مختلف (۳، ۶، ۹ و ۱۲ ماه) و نمایش دقت برتر در پیش بینی خشکسالی کلی، متوسط، شدید و شدید. آچیت و همکاران [
۱۴] چندین تکنیک یادگیری ماشین (ML) -ANN، ANFIS، SVM و درخت تصمیم (DT) – برای پیشبینی خشکسالی هیدرولوژیکی در حوضه Wadi Ouahrane در الجزایر به کار گرفته شد. نویسندگان مدل ها را با استفاده از معیارهای ارزیابی ارزیابی کردند و دریافتند که SVM موثرترین در پیش بینی دقیق خشکسالی های هیدرولوژیکی است. قابل ذکر است که مدل SVM به ضریب تعیین ۰٫۹۵ برای مقیاس زمانی ۱۲ ماهه دست یافت که کارایی آن را در بازه های زمانی مختلف نشان می دهد. لی و همکاران [
۱۵] یک استراتژی جدید پیشبینی خشکسالی هواشناسی را با ترکیب الگوی نوسانات SST قبلی (ASFP) و تکنیکهای ML مانند SVR، ماشین یادگیری شدید (ELM) و جنگل تصادفی (RF) بررسی کرد. آنها این رویکرد را برای چهار حوضه رودخانه مستعد خشکسالی در سطح جهان اعمال کردند و از دوره های سرب ۱ و ۳ ماهه برای پیش بینی SPEI استفاده کردند. یافتههای آنها برتری مدل ASFP-ELM را در پیشبینی تکامل خشکسالی مکانی-زمانی برجسته کرد. تحقیقات بیشتر به مدلهای ترکیبی ML تقویتشده با الگوریتمهای بهینهسازی برای پیشبینی خشکسالی افزایش یافته است. محمدی و همکاران [
۱۶] استفاده از مدلهای SVM، شبکه تابع پایه شعاعی (RBFNN)، ANFIS، و پرسپترون چندلایه (MLP) برای پیشبینی خشکسالیهای اقلیمی در ایران با استفاده از دادههای گستره از سال ۱۹۸۰ تا ۲۰۱۴٫ ترکیب الگوریتم مردم عشایر (NPA)، خفاش، ازدحام سالپ، و کریل الگوریتمها دقت و سرعت همگرایی مدلهای محاسباتی نرم را تقویت کردند. در مورد آنها، مدلهای ترکیبی ML عملکرد بهبود یافتهای را نشان دادند، و در پیشبینی شاخص بارش استاندارد شده ۳ ماهه، از مدلهای مستقل بهتر عمل کردند. نبی پور و همکاران [
۱۷] ترکیبی از مدلهای شبکه عصبی مصنوعی و الگوریتمهای بهینهسازی مانند الگوریتم بهینهسازی ملخ (GOA)، الگوریتم ازدحام سالپ (SSA)، بهینهسازی ازدحام ذرات (PSO) و بهینهسازی مبتنی بر جغرافیای زیستی (BBO) را برای پیشبینی کوتاهمدت خشکسالی هیدرولوژیکی اتخاذ کرد. مدلهای ترکیبی آنها، بهویژه مدل ANN همراه با الگوریتم PSO، از مدلهای ANN معمولی بهتر عمل کردند و دقت پیشبینیکنندهای را برای شاخصهای مختلف خشکسالی در مقیاسهای زمانی مشخص نشان دادند.
در حالی که خشکسالی گریبانگیر بریتیش کلمبیا شده است، تحقیقات موجود فاقد ابزارهای ML مناسب برای پیشبینی خشکسالی هیدرولوژیکی است. این مطالعه پیشگام ماشین یادگیری افراطی پیشرفته Outlier Robust (IORELM)، یک تکنیک جدید ML، برای ساخت مدلهای پیشبینی قوی در استان است. برخلاف مطالعات قبلی، IORELM با تجزیه و تحلیل دقیق ترکیبهای ورودی مختلف بر اساس شاخص خشکسالی استاندارد چند متغیره (MSDI) فراتر از چارچوبهای موجود میرود تا مطمئنترین مدل را برای پیشبینی خشکسالیهای آینده شناسایی کند.
این رویکرد جدید وعده غلبه بر محدودیتهای فعلی در پیشبینی خشکسالی را میدهد و راه را برای بهبود قابل توجه استراتژیهای مدیریت آب هموار میکند. با فعال کردن پیشبینیهای دقیق، IORELM میتواند اجرای پروتکلهای نظارتی قوی و شیوههای مصرف پایدار آب را تقویت کند. این به نوبه خود، تلاشهای کاهش و حفاظت از منابع آب را در بریتیش کلمبیا تقویت میکند.
علاوه بر این، این مطالعه با بررسی موارد زیر زمینه جدیدی را ایجاد می کند:
-
اثربخشی IORELM برای پیشبینی خشکسالی: این نشاندهنده اولین کاربرد IORELM برای خشکسالی در بریتیش کلمبیا است که یک گام مهم به جلو را نشان میدهد.
-
ترکیبهای ورودی بهینه: تجزیه و تحلیل ترکیبهای مختلف بر اساس پارامترهای MSDI، مطمئنترین مدل را انتخاب میکند که منجر به بهبود دقت پیشبینی میشود.
-
دادههای تحلیل مجدد شبکهای در پیشبینی خشکسالی: این رویکرد نوآورانه پتانسیل افزایش بیشتر قابلیتهای پیشبینی را دارد.
با کاوش در این مسیرهای ناشناخته، این مطالعه یک رویکرد پیشگامانه برای پیش بینی خشکسالی در بریتیش کلمبیا ارائه می دهد که در نهایت به آینده ای پایدارتر برای منابع آبی استان کمک می کند.
۳٫ نتایج
پیروی از روش شناسی ذکر شده در مرجع [
۳۰,
۳۱,
۳۴]SPI و شاخص استاندارد رطوبت خاک (SSI) با استفاده از مجموعه دادههای مربوط به بارش و رطوبت خاک محاسبه میشوند. برای بررسی MSDI در یک مقیاس زمانی (روزانه)، SPI و SSI برای مدت زمان یکسان محاسبه میشوند تا امکان مقایسه متقابل فراهم شود. در مناطق مختلف شبکه، سه تابع جفت (فرانک، گامبل، و کلیتون) انتخاب میشوند، زیرا این توابع کوپولا معمولاً در مطالعات خشکسالی استفاده میشوند. [
۴۲,
۴۳,
۴۴].
اثربخشی مدلهای مختلف کوپولا در نمایش دقیق رابطه بین بارندگی و رطوبت خاک. در میان گزینه ها، گامبل کوپولا به عنوان انتخاب ارجح برای اکثر موارد ظاهر می شود، همانطور که توسط مسعود و همکاران ارائه شده است. [
۴۵]. اگر مقدار p متناظر آن برابر یا بالاتر از ۰٫۰۵ (سطح معناداری ۵٪) باشد، یک مدل کوپولا حفظ می شود. این تست ها برای حفظ سازگاری با تجزیه و تحلیل SPI و SSI انجام می شود.
در این مطالعه، در مجموع ۱۴ ورودی، همانطور که در
جدول ۲، در ترکیبات مختلف مورد استفاده قرار گرفتند. تعداد کل داده ها برای هر ورودی ۱۵۲۳ بود. داده ها برای پیش بینی خشکسالی با استفاده از تکنیک ML کافی بود. [
۱۰,
۴۰]. این ورودی ها یک مجموعه داده جامع شامل ۱۶۳۸۳ ترکیب مجزا برای اهداف مدل سازی ایجاد کردند. در میان این ورودیها، تمرکز اولیه روی دو پارامتر کلیدی MSDI قرار گرفت که شامل بارش (P
تی)) و رطوبت خاک (SM(
تی)) متغیرها. این پارامترها با استفاده از محدودهای از فواصل تاخیر، از یک تاخیر یک روزه تا یک تاخیر شش روزه (P
تی – i) و SM(
تی – i)). هدف این مطالعه به دست آوردن روابط زمانی متغیر بین متغیرهای ورودی و پیامدهای هدف با ترکیب فواصل تاخیری مختلف بود. این کاوش گسترده از ترکیبهای ورودی، بررسی کامل عملکرد پیشبینی مدلهای ML را در مجموعهای متنوع از شرایط محیطی و زمینههای زمانی تسهیل کرد.
فرآیند مدلسازی شامل طبقهبندی مقادیر MSDI برای چهار ایستگاه مجزا با استفاده از ترکیبهای مختلف ورودیهای فهرستشده در
جدول ۲. در این جدول P(
تی – i) تاخیر یکم کل بارش را نشان می دهد و SM(
تی – i) یکمین تاخیر رطوبت خاک است. این ترکیب ها از استفاده از یک ورودی تا ترکیب هر ۱۴ ورودی به طور همزمان متغیر بودند. هر ورودی نشان دهنده یک متغیر خاص مربوط به MSDI است، مانند بارش و رطوبت خاک، با تغییرات در فواصل زمانی ثبت شده در فواصل تاخیر از یک ماه تا شش روز. با کاوش در این ترکیبهای ورودی متنوع، این مطالعه با هدف تجزیه و تحلیل جامع چگونگی تأثیر ترکیبهای مختلف متغیرها و روابط زمانی بر طبقهبندی مقادیر MSDI در چهار ایستگاه انجام شد. این رویکرد امکان بررسی کامل قابلیتهای پیشبینی مدلهای ML را تحت سناریوهای مختلف فراهم میکند و بینشهایی را در مورد تأثیرگذارترین عوامل مؤثر بر طبقهبندی MSDI در زمینههای مکانی و زمانی مختلف ممکن میسازد.
برای ارزیابی عملکرد طبقهبندی ML با در نظر گرفتن بهترین مجموعههای آماری ورودیها و ارزیابی کارآمدی این مدلها میتوانند شاخص خشکسالی MSDI را با استفاده از دادههای بارش و رطوبت خاک پیشبینی کنند، از پنج آزمون ارزیابی (دقت، CA، یادآوری، AUC و F1- استفاده کردیم. نمره). در اینجا توضیح مختصری از هر یک از معیارهای پنج ارزیابی مورد استفاده ارائه شده است.
متریک دقیق، نسبت شناسایی های مثبتی را که واقعاً درست بوده اند، اندازه گیری می کند. تعداد مثبتهای واقعی تقسیم بر تعداد کل پیشبینیهای مثبت (مجموع مثبتهای درست و مثبت کاذب) است. [
۴۶]. یادآوری (حساسیت) نسبت موارد مثبت واقعی را که به درستی شناسایی شده اند ارزیابی می کند. با تقسیم تعداد مثبت های واقعی بر مجموع مثبت های واقعی و منفی های کاذب محاسبه می شود [
۴۷]. این معیار زمانی حیاتی است که هزینه از دست دادن یک مثبت واقعی قابل توجه باشد. F1-Score میانگین هارمونیک Precision و Recall است [
۴۸]. این تعادل بین معیارهای دقت و یادآوری را نشان میدهد و یک امتیاز واحد را ارائه میکند که نشاندهنده قوی بودن توانایی مدل برای طبقهبندی صحیح موارد مثبت است. به ویژه زمانی مفید است که فرد نیاز دارد هم مثبت کاذب و هم منفی کاذب را در نظر بگیرد. CA درصد کلی پیشبینیهای صحیح، هم مثبت و هم منفی واقعی، در میان تعداد کل موارد بررسی شده است. [
۴۹]. این شهودی ترین معیار عملکرد است، صرفاً نسبتی از مشاهدات پیش بینی شده درست به کل مشاهدات. AUC یک معیار کلی از عملکرد در تمام آستانه های طبقه بندی ممکن را ارائه می دهد. توانایی مدل را برای تمایز بین طبقات مثبت و منفی اندازه گیری می کند [
۵۰]. AUC 1 نشان دهنده پیش بینی کامل است، در حالی که AUC 0.5 نشان دهنده عدم قدرت تمایز است. [
۵۱]. علاوه بر این، نتایج بهینه هر پنج آزمایش برای چهار ایستگاه در منطقه مورد مطالعه نیز مورد ارزیابی قرار گرفت، که امکان ارزیابی جامع از دقت نتایج طبقهبندی را فراهم کرد.
در بخش زیر، ارزیابی هر یک از نتایج آزمون برای چهار ایستگاه واقع در منطقه مورد مطالعه به تصویر کشیده شده است.
شکل ۴. این ارقام با ارائه مقدار متوسط هر متریک که از مدلسازی در مرحله آزمایش به دست میآید، یک نمای کلی جامع ارائه میکند. عملکرد هر ایستگاه به طور جداگانه مورد بحث قرار می گیرد و امکان تجزیه و تحلیل دقیق کارایی مدل را در مکان های مختلف در منطقه مورد مطالعه فراهم می کند.
از نتایج آزمون دقت برای چهار ایستگاه بر اساس
شکل ۴الف، میتوانیم استنباط کنیم که ایستگاه Pitt Meadows بالاترین امتیاز دقت را دارد، که نشان میدهد، برای آن ایستگاه خاص، مدل از بین چهار طبقهبندی مرتبطترین طبقهبندی را انجام داده است. کمترین امتیاز دقت مربوط به ایستگاه غربی ونکوور است، که نشان میدهد در مقایسه با سایرین، نقاط مثبت کاذب نسبتاً بیشتر یا مثبتهای واقعی کمتری داشته است.
با توجه به موقعیت این ایستگاه ها در محدوده مورد مطالعه و اثرات نزدیکی به ویژگی های جغرافیایی مختلف مانند اقیانوس (به سمت جنوب غربی) یا حرکت به سمت شمال یا جنوب در داخل حوضه، ایستگاه های نزدیک به اقیانوس ممکن است تحت تأثیر پایداری بیشتر قرار گیرند. و شرایط رطوبت بالاتر به دلیل نزدیکی بدنه آبی. این به طور بالقوه می تواند بر شاخص خشکسالی MSDI تأثیر بگذارد زیرا عواملی مانند بارش و رطوبت خاک ممکن است الگوهای متفاوتی در نزدیکی مناطق ساحلی در مقایسه با مناطق داخلی داشته باشند. [
۵۲,
۵۳]. علاوه بر این، ایستگاه های واقع در بخش شمالی منطقه مورد مطالعه ممکن است الگوهای آب و هوایی متفاوتی را تحت تأثیر زمین و فاصله از اقیانوس تجربه کنند، که می تواند منجر به تغییرات در میزان بارش و رطوبت خاک شود. به طور مشابه، این عوامل همچنین میتوانند بر مناطقی در بخش جنوبی مطالعه موردی، همراه با فعالیتهای انسانی بالقوه که ممکن است بر شرایط آب و هوایی محلی تأثیر بگذارند، تأثیر بگذارند.
برای ارزیابی میانگین نتایج مقادیر آزمون CA برای چهار ایستگاه، ما آنالیز کردیم
شکل ۴b، که میانگین مقادیر CA ارائه شده را نشان می دهد. میانگین مقدار CA برای چهار ایستگاه تقریباً ۰٫۷۰۲ است. میانگین CA بالاتر نشان می دهد که مدل دارای نرخ پیش بینی کلی خوبی است [
۵۴]. با این حال، ذکر این نکته ضروری است که اگرچه CA بالا مطلوب است، اما تنها معیاری نیست که باید در نظر گرفته شود، به ویژه در مجموعه داده هایی که ممکن است عدم تعادل بین کلاس ها داشته باشند. معیارهای دیگر مانند Precision، Recall، F1 امتیاز و AUC میتوانند درک دقیقتری از عملکرد مدل ارائه دهند، بهویژه از نظر توانایی آن در مدیریت مثبتها و منفیهای کاذب.
با مقادیر CA ارائه شده، میتوانیم مشاهده کنیم که آنها بالا هستند، که نشان میدهد مدل دارای قابلیت پیشبینی مناسبی در سراسر منطقه مورد مطالعه برای شاخص خشکسالی MSDI است که از بارش و رطوبت خاک به عنوان ورودی استفاده میکند. [
۵۵]. همچنین برای به دست آوردن دید جامعی از عملکرد مدل، نگاهی به معیارهای دیگر مفید خواهد بود.
که در
شکل ۴ج، AUC نشان دهنده درجه ای از تفکیک پذیری است. این نشان می دهد که مدل تا چه حد قادر به تمایز بین کلاس ها است. مقادیر بالاتر AUC معمولاً عملکرد بهتر مدل را نشان می دهد [
۵۰]. میانگین مقدار AUC برای چهار ایستگاه ۰٫۷۴۵ است. برای تجزیه و تحلیل مقادیر AUC در رابطه با موقعیت جغرافیایی ایستگاه ها، ایستگاه های نزدیک به اقیانوس (ایستگاه های ونکوور غربی و ونکوور) مقادیر AUC بالاتری دارند. این بدان معناست که مناطق ساحلی ممکن است الگوهای ثابت تری از بارش و رطوبت خاک به دلیل نفوذ دریا داشته باشند. این میتواند منجر به سیگنال سازگارتر در دادههایی شود که مدل ML میتواند از آن بیاموزد، که به طور بالقوه منجر به مقادیر AUC بالاتر میشود. از این رو، یک مقدار AUC بالاتر، تفکیک پذیری بهتر بین طبقات را نشان می دهد، که نشان می دهد که مدل می تواند به خوبی بین شرایط خشکسالی و غیر خشکی تمایز قائل شود. این می تواند به دلیل الگوهای واضح تر در داده های آب و هوایی در نزدیکی ساحل باشد.
علاوه بر این، ایستگاههای نزدیکتر به شمال یا جنوب (دور از اقیانوس)، ممکن است مقادیر AUC متنوعتری را به دلیل ریزاقلیمهای متنوع و طیف وسیعتری از تأثیرات بر بارش و رطوبت خاک، مانند ارتفاع، زمین، و فاصله از اقیانوسهای معتدل نشان دهند. اثرات به طور خلاصه، مقادیر AUC نشان میدهد که مدل طبقهبندی در تمایز بین کلاسها در سراسر ایستگاههای منطقه مورد مطالعه نسبتاً خوب است. تفاوت های جزئی در مقادیر AUC ممکن است منعکس کننده تأثیرات ظریف جغرافیای محلی و آب و هوا باشد. این مدل باید بر روی دادههای متنوعی آموزش داده شود که طیف کامل شرایط را در سراسر منطقه مورد مطالعه ثبت کند تا عملکرد بالا در همه مکانها حفظ شود.
شکل ۴d شامل مقادیر آزمون فراخوان برای چهار ایستگاه در منطقه مورد مطالعه، حوضه زمین اصلی در بریتیش کلمبیا است. میانگین مقدار Recall برای چهار ایستگاه تقریباً ۰٫۳۶۱ است. برای تجزیه و تحلیل مقادیر فراخوان در رابطه با موقعیت جغرافیایی ایستگاهها، ایستگاههای نزدیک به اقیانوس (ایستگاههای ونکوور غربی و ونکوور) الگوهای رطوبتی قابل پیشبینیتری به دلیل نزدیکی به حجمهای بزرگ آبی دارند که میتواند منجر به فراخوان بیشتر شود. زیرا مدل ممکن است رویدادهای واقعی خشکسالی را بهتر شناسایی کند. با این حال، فرض کنید الگوهای خشکسالی به دلیل آب و هوای دریایی کمتر رایج است. در آن صورت، Recall ممکن است کمتر باشد، زیرا رویدادهای خشکسالی کمتری برای شناسایی وجود دارد، که میتواند بر توانایی مدل برای یادگیری از چنین رویدادهایی تأثیر بگذارد. علاوه بر این، آن ایستگاههایی که از اقیانوس دور هستند ممکن است الگوهای آب و هوایی متغیرتری را تجربه کنند و به طور بالقوه سطوح رطوبت خاک قابل پیشبینی کمتری را به دلیل زمین و ارتفاع داشته باشند، که اگر مدل نتواند همه موارد مثبت را شناسایی کند منجر به یادآوری کمتری میشود.
متناوباً، وضعیتی را در نظر بگیرید که در آن وقوع خشکسالی مکرر است، و این مدل به اندازه کافی بر روی یک مجموعه داده قابل توجهی آموزش داده شده است که به دقت این شرایط را نشان می دهد. این بدان معنی است که مدل در طول مرحله آموزش خود در معرض موارد زیادی از رویدادهای خشکسالی قرار گرفته است. در نتیجه، درک کاملی از الگوها و ویژگی های مرتبط با خشکسالی دارد. این آموزش پیشرفته، مدل را قادر میسازد تا پدیدههای مرتبط با خشکسالی را بهتر پیشبینی و تجزیه و تحلیل کند، و بینشهای ارزشمندی را در مورد علل، تأثیرات و استراتژیهای کاهش احتمالی آنها ارائه دهد. در آن صورت، فراخوان ممکن است بالاتر باشد زیرا مدل یاد میگرفت که نشانههای خشکسالی را به طور مؤثرتری شناسایی کند. مقادیر فراخوان نسبتاً پایین در سراسر ایستگاه ها نشان می دهد که مدل ممکن است تعداد قابل توجهی از رویدادهای خشکسالی واقعی را از دست داده باشد. این می تواند به دلیل عوامل مختلفی از جمله مجموعه داده های نامتعادل (که در آن تعداد رویدادهای غیر خشکسالی بسیار بیشتر از رویدادهای خشکسالی است)، نمایش ناکافی ویژگی های خشکسالی در ویژگی های مورد استفاده برای آموزش، یا تعاملات پیچیده بین متغیرهای آب و هوایی که مدل گرفتن نیست [
۵۶].
شکل ۴e شامل مقادیر آزمون F1-Score برای چهار ایستگاه در منطقه مورد مطالعه است. میانگین مقدار F1-Score برای چهار ایستگاه تقریباً ۰٫۵۸۳ است. با توجه به
شکل ۴e، ایستگاههای نزدیکتر به اقیانوس، الگوهای بارش و رطوبت خاک سازگارتر و قابل اندازهگیریتری دارند، به دلیل تأثیر دریایی، که منجر به الگوهای واضحتری برای مدل ML میشود تا از آنها یاد بگیرد. این به دلیل دقت مدل و فراخوانی بهتر، به طور بالقوه می تواند منجر به امتیازات F1 بالاتر شود.
به عنوان ابزار بصری اولیه در این مطالعه، از نمودارهای ویولن برای نشان دادن توزیع مقادیر شاخص در تمامی ایستگاه ها و مدل ها استفاده شده است. این تصمیم با توانایی منحصر به فرد نمودارها برای ارائه یک نمای کلی جامع از داده ها، ادغام بینش در گرایش ها و پراکندگی مرکزی، مشخصه نمودارهای جعبه، با اطلاعات شکل توزیعی ارائه شده توسط نمودارهای چگالی است. [
۲۸,
۲۹]. به تصویر کشیدن تخمینهای چگالی در هر دو طرف نمودار جعبه مرکزی اهمیت ویژهای دارد، که چندوجهی یا چولگی بالقوه را در دادهها آشکار میکند – جزئیات ظریفی که ممکن است تحت روشهای ترسیم جایگزین پنهان بماند. چنین ویژگی در تحلیل تطبیقی در بین گروههای مختلف مدلها، که در آن تشخیص و نشان دادن تفاوتها و شباهتهای توزیعی با فوریت و وضوح بسیار مهم است، ارزشمند تلقی میشود. [
۳۰,
۳۶]. علیرغم نگرانیها در مورد افزونگی احتمالی در نمایش دادهها، ادعا میشود که این جنبه از طرحهای ویولن در واقع انتقال واضحتر اشکال توزیع به خوانندگان را تسهیل میکند، که ممکن است به طور گسترده با نمودارهای چگالی آشنا نباشند. [
۳۰]. علاوه بر این، استفاده از یک روش بوت استرپ در استخراج این توزیعهای احتمال برجسته شده است، با تاکید بر استحکام رویکرد و اطمینان از اینکه تخمینهای ویژگیهای توزیعی به خوبی بر اساس شواهد تجربی استوار است. [
۲۸,
۲۹]. بنابراین، با توضیح بیشتر در مورد منطق انتخاب و مبانی آماری تجزیه و تحلیل، هر گونه احتیاط در مورد استفاده از توطئه های ویولن در نظر گرفته شده است که از اثربخشی آنها در افزایش کارایی و وضوح مطالعه مقایسه ای ما حمایت می کند.
شکل ۵ نمودارهای ویولن را نشان می دهد که توزیع معیارهای مختلف را در ایستگاه های مختلف نشان می دهد. این نمودارها از منحنیهای چگالی برای نشان دادن توزیع دادههای عددی در هر گروه استفاده میکنند، با عرض منحنیها منعکس کننده فرکانس تقریبی نقاط داده در مناطق مربوطه. [
۵۷]. با استفاده از منحنیهای چگالی، این نمودارها تصویری بصری از گسترش و تمرکز دادهها را ارائه میدهند و به شناسایی الگوها و نقاط پرت در ایستگاهها کمک میکنند. علاوه بر این، یک نوع نمودار روکششده، مانند نمودار جعبه، اغلب برای ارائه بینشهای بیشتر همراه با هر منحنی چگالی گنجانده میشود. این ترکیب درک جامعی از تمایل و تنوع مرکزی داده ها را فراهم می کند، تجزیه و تحلیل مقایسه ای و تصمیم گیری آگاهانه در مورد عملکرد و ویژگی های ایستگاه را تسهیل می کند. [
۵۸].
که در
شکل ۵هر طرح ویولن توزیع خطای پیشبینی را برای ترکیبهای ورودی مختلف در طول مرحله آزمایش نشان میدهد. اعداد نمایش داده شده در نمودارهای ویولن نشان دهنده مقادیر معیارهای عملکرد، از جمله دقت، یادآوری، دقت، امتیاز F1 و AUC است. محور x کرت ها به چهار نقطه مختصات تقسیم می شود که نشان دهنده چهار ایستگاه مجزا است. با بررسی توزیع خطای پیشبینی در این ایستگاهها، میتوان بینشی در مورد تغییرات عملکرد در ترکیبهای ورودی در زمینههای فضایی مختلف بهدست آورد. نمودارهای ویولن نشان میدهند که چگونه ترکیبهای مختلف متغیرهای ورودی بر دقت پیشبینی و تغییرپذیری در ایستگاهها تأثیر میگذارند. با تجزیه و تحلیل شکل و گسترش نمودارهای ویولن، الگوها و روندهای توزیع خطای پیشبینی را میتوان شناسایی کرد که به ارزیابی و مقایسه عملکرد مدل در شرایط ورودی مختلف کمک میکند. این تجسم جامع درک عمیقتری از قابلیتهای پیشبینی مدلها و تأثیر ترکیبهای ورودی بر عملکرد آنها در مکانهای مختلف ایستگاه را تسهیل میکند.
شکل ۵a متریک دقیق را در چهار ایستگاه از طریق طرح ویولن بررسی می کند. مقادیر دقت میانه، که نشان دهنده نقطه میانی توزیع داده ها است، در سراسر ایستگاه ها ثابت می ماند و بین ۰٫۶ و ۰٫۶۳ شناور است. ایستگاه پیت دارای بالاترین دقت متوسط است، در حالی که غرب ونکوور کمترین را نشان می دهد. توزیع نقاط داده در اطراف میانه و چارک اول (Q1) از یک الگوی مشابه در سراسر ایستگاه ها پیروی می کند، که نشان دهنده خوشه بندی مقادیر در این محدوده است. با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر چارک سوم (Q3)، حداکثر و حداقل هستیم که ۱٫۵ برابر محدوده بین چارکی (IQR) است. این نشاندهنده کاهش تنوع در طول این مسیر است. جالب توجه است که لنگلی با حداکثر مقدار Q1 در ۰٫۵۵ برجسته است، در حالی که West Vancouver کمترین مقدار را با ۰٫۵۱ ثبت می کند. با وجود این تنوع، مقادیر Q1 به طور کلی نسبتاً ثابت باقی می مانند. با مقایسه تفاوتهای بین Q1 و Q3، متوجه یک الگوی ثابت در پیت و ونکوور میشویم، در حالی که وست ونکوور تفاوت قابلتوجهی تقریباً ۰٫۱۱ را نشان میدهد که نشاندهنده تنوع بیشتر در این ایستگاه است. مقادیر حداکثر (Q4) و حداقل (Q0) روند مشابهی را در تمام ایستگاه ها دنبال می کنند که از ۰٫۸ تا ۰٫۷۶ برای Q4 و از ۰٫۴ تا ۰٫۳۶ برای Q0 متغیر است. وست ونکوور دارای بالاترین ارزش Q4 است، در حالی که ونکوور بالاترین Q0 را ثبت می کند. از سوی دیگر، لنگلی کمترین مقادیر را برای این چارک ها نشان می دهد. این یافتهها بینشهای ارزشمندی را در مورد توزیع معیارهای دقیق در سراسر ایستگاهها ارائه میدهند و تغییرات در عملکرد و تنوع را برجسته میکنند. درک این الگوها می تواند به شناسایی عواملی که بر عملکرد مدل تأثیر می گذارند کمک کند و تصمیمات را برای بهبود قابلیت های پیش بینی راهنمایی کند.
شکل ۵b نمودار ویولن را نشان می دهد که معیار فراخوان را در چهار ایستگاه نشان می دهد. مقادیر متوسط فراخوان در ایستگاهها ثابت میماند و از ۰٫۳۵ تا ۰٫۳۷ متغیر است. مانند Precision، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که ونکوور کمترین را نشان می دهد. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند که نشان دهنده یک الگوی مشترک در بین ایستگاه ها است. با این حال، ونکوور یک انحراف با داده های توزیع شده در اطراف میانه و Q3 نشان می دهد. با حرکت از پیت به لنگلی، تغییراتی را در مقادیر Q3، حداکثر و حداقل مشاهده می کنیم که ۱٫۵ برابر IQR است. حداکثر این مقدار در پیت مشاهده می شود، در حالی که ونکوور و لنگلی حداقل را نشان می دهند. با این حال، حداکثر Q1 در پیت (۰٫۳۵) رخ می دهد که ونکوور کمترین آن را با ۰٫۳۲ ثبت کرده است. تفاوت بین Q1 و Q3 در ایستگاه ها متفاوت است. در پیت و وست ونکوور، این تفاوت از ۰٫۳۴ تا ۰٫۳۹ متغیر است، در حالی که ونکوور بیشترین تفاوت را تقریباً ۰٫۱۶ نشان می دهد. مقادیر حداکثر (Q4) و حداقل (Q0) از یک الگوی ثابت در سراسر ایستگاه ها پیروی می کنند که از ۰٫۴۸ تا ۰٫۵۵ برای Q4 و ۰٫۲۵ تا ۰٫۳ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که ونکوور بالاترین Q0 را نشان می دهد. برعکس، ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این بینشها، توزیع معیارهای فراخوان را در ایستگاهها روشن میکند و تغییرات در عملکرد و تنوع را برجسته میکند. درک این الگوها میتواند راهنمایی ارزشمندی برای بهبود عملکرد مدل و قابلیتهای پیشبینی در زمینههای فضایی مختلف ارائه دهد.
شکل ۵c متریک دقت را در چهار ایستگاه از طریق طرح ویولن بررسی می کند. مقادیر میانگین دقت در ایستگاهها متفاوت است و از ۰٫۶۸ تا ۰٫۷۳ متغیر است. بار دیگر، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که وست ونکوور کمترین را نشان می دهد و الگوهای مشاهده شده در Precision را منعکس می کند. اکثر نقاط داده در اطراف میانه و Q1 در Pitt، West Vancouver و Langley جمع می شوند. با این حال، ونکوور الگوی متفاوتی را با مقادیری که حول میانه و Q3 توزیع میشوند، نشان میدهد. با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر Q3، حداکثر و حداقل هستیم که ۱٫۵ برابر IQR است. حداکثر این مقدار در پیت مشاهده می شود، در حالی که کمترین آن در غرب ونکوور است. حداکثر Q1 در پیت (۰٫۷۱) رخ می دهد که وست ونکوور با ۰٫۶۶ کمترین آن را ثبت کرده است. تفاوت بین Q1 و Q3 تقریباً در پیت و ونکوور ثابت می ماند، اما وست ونکوور بیشترین تفاوت را نشان می دهد. مقادیر Q4 و Q0 از یک الگوی ثابت در سراسر ایستگاه ها پیروی می کنند که از ۰٫۸۱ تا ۰٫۷۸ برای Q4 و از ۰٫۵۹ تا ۰٫۶۶ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که وست ونکوور بالاترین Q0 را نشان می دهد. برعکس، وست ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این بینشها اطلاعات ارزشمندی را در مورد توزیع معیارهای دقت در ایستگاهها ارائه میدهند و تغییرات در عملکرد و تنوع را برجسته میکنند. درک این الگوها می تواند به عنوان راهنمای بهبود عملکرد مدل و قابلیت های پیش بینی در زمینه های مختلف فضایی باشد.
شکل ۵d نمودار ویولن را نشان می دهد که معیار امتیاز F1 را در چهار ایستگاه نشان می دهد. مقادیر میانگین امتیاز F1 ثابت می ماند و از ۰٫۵۹ تا ۰٫۶ متغیر است. مشابه معیارهای قبلی، ایستگاه پیت بالاترین میانه را ثبت می کند، در حالی که وست ونکوور کمترین را نشان می دهد. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند که نشان دهنده یک الگوی ثابت در سراسر ایستگاه ها است. اما با حرکت از پیت به لنگلی، شاهد کاهش تدریجی مقادیر Q3، حداکثر و حداقل هستیم که ۱٫۵ برابر IQR است. با وجود این، ایستگاه پیت حداکثر مقدار Q1 (0.68) را نشان می دهد، در حالی که West Vancouver کمترین مقدار را با ۰٫۵۴ ثبت می کند. تفاوت بین Q1 و Q3 در ونکوور و ونکوور غربی نسبتاً ثابت است اما در پیت و لنگلی کمی متفاوت است و دامنه آنها کمتر از ونکوور و ونکوور غربی است. ونکوور بیشترین تفاوت را تقریباً ۰٫۰۸ نشان می دهد. مقادیر Q4 و Q0 الگوهای متنوعی را در تمام ایستگاهها نشان میدهند که از ۰٫۷۴ تا ۰٫۸ برای Q4 و از ۰٫۴۱ تا ۰٫۵۶ برای Q0 متغیر است. ایستگاه پیت بالاترین ارزش Q4 را ثبت می کند، در حالی که وست ونکوور بالاترین Q0 را نشان می دهد. برعکس، ونکوور کمترین مقادیر را برای این چارک ها نشان می دهد. این مشاهدات بینشهایی را در مورد توزیع معیارهای امتیاز F1 در ایستگاهها ارائه میکنند و تغییرات در عملکرد و تنوع را برجسته میکنند. درک این الگوها میتواند راهبردهایی را برای افزایش عملکرد مدل و قابلیتهای پیشبینی در زمینههای فضایی مختلف ارائه دهد.
شکل ۵e نمودار ویولن را نشان می دهد که متریک AUC را در چهار ایستگاه نشان می دهد. مشابه سایر معیارها، مقادیر AUC میانه ثابت می ماند و از ۰٫۶۴ تا ۰٫۶۶ متغیر است. جالب اینجاست که ایستگاه وست ونکوور بالاترین میانه را نشان می دهد، در حالی که ونکوور کمترین را ثبت می کند. اکثر نقاط داده در اطراف میانه و Q1 جمع می شوند، که نشان دهنده یک الگوی ثابت در سراسر ایستگاه ها است. با این حال، همانطور که از Pitt به Langley حرکت می کنیم، متوجه کاهش تدریجی مقادیر Q3، حداکثر و حداقل می شویم که ۱٫۵ برابر IQR است. یک استثنا در ایستگاه غربی ونکوور مشاهده می شود، جایی که حداکثر مقدار Q3 رخ می دهد. Q1 نسبتاً ثابت باقی می ماند و از ۰٫۷ تا ۰٫۷۲ متغیر است، با Pitt و West Vancouver بالاترین مقادیر و Vancouver و Langley کمترین مقدار را نشان می دهند. تفاوت بین Q1 و Q3 در تمام ایستگاه ها نسبتا ثابت باقی می ماند. مقادیر Q4 و Q0 از یک الگوی ثابت در تمام ایستگاه ها پیروی می کنند. این یافتهها بینشهایی در مورد توزیع معیارهای AUC در بین ایستگاهها ارائه میدهند که نشاندهنده تغییرات در عملکرد و تنوع است. درک این الگوها میتواند راهبردهایی را برای افزایش عملکرد مدل و قابلیتهای پیشبینی در زمینههای فضایی مختلف ارائه دهد.
نتایج ارائه شده در
جدول ۳ بینش ارزشمندی را در مورد بهترین ترکیب های ورودی برای هر ایستگاه ارائه می دهد و عملکرد مدل را بهینه می کند.
در Pitt Meadows، ترکیبی که شامل مقادیر بارندگی گذشته در تاخیرهای زمانی خاص است (تی – ۲، تی – ۴) و مقادیر رطوبت خاک در وقفه های زمانی مجاور (تی – ۱، تی – ۳، تی – ۴، تی – ۵، تی – ۶)، همراه با بارش فعلی، بر اهمیت داده های تاریخی اخیر و مرتبط در پیش بینی دقیق شرایط خشکسالی تأکید می کند. به طور مشابه، در ونکوور و غرب ونکوور، تمرکز بر مقادیر اخیر رطوبت خاک در وقفههای زمانی متعدد و یک مقدار بارندگی گذشته، نقش حیاتی دادههای رطوبت خاک از دورههای مختلف اخیر را در پیشبینی شرایط خشکسالی برجسته میکند. این تاکید بر داده های اخیر رطوبت خاک بر اهمیت آن ها در پیش بینی دقیق شرایط خشکسالی تاکید می کند. برعکس، در لنگلی، ترکیب بهینه شامل مقادیر بارندگی گذشته در وقفه های زمانی خاص است.تی – ۵)، همراه با مقادیر رطوبت خاک در وقفه های زمانی مجاور (تی – ۱، تی – ۳، تی – ۴، تی – ۵، تی – ۶) و بارش فعلی. این ترکیبی از دادههای بارش گذشته و رطوبت خاک، با تأکید بر دورههای اخیر، به پیشبینی دقیق خشکسالی در لنگلی کمک میکند. به طور کلی، ترکیبهای ورودی انتخابشده بر اهمیت ترکیب دادههای بارش و رطوبت خاک در بازههای زمانی مختلف برای پیشبینی مؤثر خشکسالی در ایستگاههای مختلف تأکید میکنند. این یافتهها بینشهای ارزشمندی را برای افزایش عملکرد مدل و توانایی آن برای کاهش اثرات خشکسالی در این مناطق ارائه میکند.
برای کارهای طبقهبندی در ML، تنها با تکیه بر متریک دقیق نمیتوان نمای کلی را ارائه کرد. [
۵۹,
۶۰]. برای تعیین عملکرد کلی مدل، باید در چارچوب معیارهای دیگر مانند Recall، F1-score، CA و AUC ارزیابی شود. هر یک از این معیارها بینش های متفاوتی را در مورد مثبت های واقعی، مثبت های کاذب، منفی های واقعی و منفی های کاذب و چگونگی ارتباط آنها با آستانه های مختلف مورد استفاده در فرآیند طبقه بندی می دهد. به عنوان مثال، یک ایستگاه با دقت بالا اما یادآوری کم ممکن است زمانی که کلاس خاصی را پیشبینی میکند، اما نمیتواند تمام نمونههای واقعی آن کلاس را شناسایی کند، بسیار دقیق است. [
۶۱]. در مقابل، یک امتیاز F1 بالا نشان دهنده تعادل بین دقت و یادآوری است [
۴۹].
شکل ۶ نشان دهنده بهترین مقادیر آزمون از هر پنج معیار ارزیابی برای چهار ایستگاه Lower Mainland Basin، بریتیش کلمبیا است. مقادیر نشان داده شده بر روی نقشه برای بهترین مقادیر تست هر ایستگاه در نشان داده شده است
جدول ۴:
معیارهای عملکرد ارائه شده در
جدول ۴ بینش های ارزشمندی را در مورد اثربخشی سیستم تشخیص در ایستگاه های نظارتی مختلف ارائه می دهد. وست ونکوور و ونکوور با مقادیر فراخوان بالاتر به ترتیب ۰٫۴۵۳ و ۰٫۴۱۳ متمایز هستند که نشان دهنده توانایی برتر آنها برای شناسایی صحیح موارد مثبت رویداد نظارت شده است. در مقابل، Pitt Meadows و Lanfley مقادیر یادآوری کمتری را نشان میدهند، که نشاندهنده پتانسیل از دست دادن تعداد قابل توجهی از نمونههای مثبت است. در مورد CA، وست ونکوور با CA 0.764 پیشتاز است، و پس از آن Lanfley با ۰٫۷۶۱ قرار دارد. این ایستگاهها دقت نسبتاً بالاتری را در طبقهبندی موارد مثبت و منفی نشان میدهند. در مقابل، Pitt Meadows کمترین CA را در ۰٫۵۳۳ نشان می دهد که نشان دهنده دقت کلی پایین تر در طبقه بندی است. با توجه به AUC، وست ونکوور و ونکوور مقادیر بالاتری را به ترتیب ۰٫۸۶۹ و ۰٫۸۴۳ نشان می دهند که نشان دهنده عملکرد کلی بهتر در تشخیص موارد مثبت و منفی است. برعکس، Pitt Meadows و Lanfley مقادیر AUC کمتری را نشان میدهند که نشاندهنده توانایی تشخیص ضعیفتر در این ایستگاهها است. امتیاز F1، که دقت و یادآوری را متعادل می کند، برای وست ونکوور (۰٫۷۸۹) بالاترین میزان را دارد و پس از آن ونکوور (۰٫۷۵۳) قرار دارد. این ایستگاه ها به تعادل بهتری بین شناسایی موارد مثبت واقعی و به حداقل رساندن مثبت کاذب دست می یابند. Pitt Meadows و Lanfley امتیازهای F1 پایین تری را نشان می دهند که نشان دهنده یک مبادله بین Precision و Recall است که می تواند بر عملکرد کلی تأثیر بگذارد. علاوه بر این، وست ونکوور و ونکوور مقادیر دقت بالاتری را نشان میدهند که نشاندهنده نرخ مثبت کاذب پایینتری در مقایسه با پیت میدوز و لانفلی است. این نشان میدهد که سیستمهای تشخیص در این ایستگاهها در شناسایی دقیق نمونههای مثبت واقعی بدون طبقهبندی اشتباه نمونههای منفی بهتر هستند.
با تجزیه و تحلیل مقادیر هر پنج معیار در
شکل ۶ما دریافتیم که ایستگاههای نزدیکتر به اقیانوس احتمالاً به دلیل تأثیر تعدیلکننده آب، الگوهای آبوهوای شدیدتر و قابل پیشبینیتری دارند، که میتواند منجر به مقادیر بالاتر در AUC و CA شود. این معیارها ممکن است منعکس کننده توانایی بهتر مدل برای تمایز بین کلاس ها و طبقه بندی دقیق وضعیت فعلی به دلیل تنوع کمتر در داده های ورودی باشد. با این حال، مقادیر دقت و یادآوری ممکن است بسته به ویژگی های آب و هوایی خاص تحت تأثیر اقیانوس متفاوت باشد. به عنوان مثال، اگر رویدادهای خشکسالی به دلیل آب و هوای دریایی کمتر باشد، ممکن است یادآوری کمتر باشد، زیرا موارد مثبت کمتری برای پیشبینی وجود دارد. علاوه بر این، ایستگاههایی که در داخل خشکی (شمال یا جنوب) واقع شدهاند، ممکن است دامنه بیشتری از شرایط آب و هوایی داشته باشند، که به طور بالقوه منجر به نمرات آزمونهای متنوعتر میشود. اگر مدل در تعمیم شرایط مختلف موجود در این مکانها مشکل داشته باشد، AUC و CA ممکن است کمتر باشند.
در نتیجه، تجزیه و تحلیل بر تغییرات عملکرد در ایستگاههای نظارتی مختلف تأکید میکند، با وست ونکوور و ونکوور عملکرد نسبتا قویتری را در مقیاسهای چندگانه در مقایسه با پیت میدوز و لانفلی نشان میدهند. این یافتهها بر اهمیت در نظر گرفتن عملکرد خاص ایستگاه هنگام ارزیابی سیستمهای تشخیص تأکید میکنند و ممکن است تلاشهای آینده را برای بهینهسازی قابلیتهای نظارت در مکانهای خاص راهنمایی کنند. وقوع خاص شرایط خشکسالی ممکن است بر دقت تأثیر بگذارد. اگر رویدادهای خشکسالی به دلیل تأثیر کمتر دریایی در داخل خشکی با وضوح بیشتری تعریف شوند، دقت می تواند هنگام پیش بینی این رویدادها بیشتر باشد.
شکل ۷ نمودار ویولن اهداف و خروجی بهترین مدل را برای هر ایستگاه نشان می دهد.
شکل ۷a-d نمودارهای ویولن را نشان می دهد که اهداف و خروجی های بهترین مدل را برای هر ایستگاه نشان می دهد. مقادیر نشاندادهشده در این پلاتها با سه کلاس ۳، ۴ و ۵ مطابقت دارد که نشاندهنده شدت خشکسالی در هر ایستگاه در بازه زمانی مشخصشده است. در تمام ایستگاهها، مقدار Q1 به طور مداوم ۳ است که به عنوان میانه نیز عمل میکند. این سازگاری از ماهیت مقادیر هدف و خروجی ناشی میشود، که فقط میتوانند یکی از سه مقدار را در نظر بگیرند: ۳، ۴ یا ۵٫ بنابراین، ممکن است میانه با مرزهای محدوده بین چارکی مطابقت داشته باشد. ماهیت گسسته داده ها علاوه بر این، برش ناگهانی توزیع برای مقادیر بالای متغیر تصادفی به دلیل محدودیت در روش نیست، بلکه به دلیل ماهیت گسسته دادهها است. از آنجایی که مقادیر به ۳ تا ۵ محدود میشوند، هر گونه مقادیر پرت یا شدید فراتر از این محدوده در توزیع وجود نخواهد داشت. در پیت، ونکوور و لنگلی، تفاوت قابل توجهی بین Q1 و Q3 در مقادیر خروجی و هدف وجود دارد، که نشان میدهد مدل در طول مرحله آزمایش تمایل به تخمین بیش از حد دارد. با این حال، این موضوع در ایستگاه غربی ونکوور کمتر برجسته است. علاوه بر این، در همه ایستگاهها، مقدار Q0 خروجیها از اهداف فراتر میرود، که نشاندهنده تمایل مدل برای پیشبینی سطوح شدت بالاتر از مشاهدهشده است. توزیع داده ها در اطراف Q1، که دارای همان مقدار میانه است، از یک الگوی قابل پیش بینی پیروی می کند [
۵۸,
۶۲,
۶۳]. این توزیع به دلیل محدوده محدود برچسبهای کلاس، انتظار میرود که منجر به خوشهبندی اکثر نقاط داده در اطراف این مقادیر در همه ایستگاهها شود. این یافته ها بینش هایی را در مورد عملکرد مدل در پیش بینی سطوح شدت خشکسالی در ایستگاه های مختلف ارائه می دهد. گرایش های مشاهده شده به سمت تخمین بیش از حد و توزیع ثابت نقاط داده، مناطقی را برای اصلاح بالقوه در قابلیت های پیش بینی مدل برجسته می کند. کاهش دقت مدل ML در پیشبینی خشکسالی نشان میدهد که دادههای مربوط به خشکسالی را به اندازه نمونههای آموزشی غیر خشکسالی به طور مؤثر درک نکرده است. در نتیجه، تمایل به برآورد بیش از حد شرایط خشکسالی داشت [
۴۰,
۶۴]. برای کاهش تمایل مدل به برآورد بیش از حد سطوح شدت خشکسالی و تقویت قابلیت اطمینان یافته های ما، یک راه حل بالقوه جامع می تواند اصلاح فرآیند انتخاب ویژگی و بهینه سازی معماری مدل باشد. تنظیم پارامتر در کاهش تخمین بیش از حد نوید می دهد، همانطور که با اضافه کردن تاخیر داده ها به عنوان ورودی های جدید انجام دادیم، و تعریف پیچیده ترین معماری شبکه می تواند موثر باشد. علاوه بر این، کاوش الگوریتمهای مختلف، ادغام تکنیکهای تصحیح سوگیری یا روشهای پس پردازش در مدلسازی میتواند انجام شود. [
۱۴,
۱۵,
۱۶].