امروز : دوشنبه, ۱۱ تیر , ۱۴۰۳
پایداری | متن کامل رایگان | تجزیه و تحلیل پیشبینی کیفیت آب در دلتای رودخانه یانگ تسه تحت سیستم اصلی رودخانه
۱٫ معرفی آب یک منبع حیاتی برای بقا و توسعه انسان است. با این حال، آلودگی آب به یک معضل زیست محیطی جهانی تبدیل شده است و آسیب جدی به اکوسیستم ها و جامعه انسانی وارد می کند. در چین، تودههای آبی پراکنده در مناطق مختلف، بهعنوان منابع مهم اقتصادی و زیستمحیطی، به طور فزایندهای […]
۱٫ معرفی
در عین حال، با الهام از مدیریت مشترک آب های توزیع شده توسط سیستم طول رودخانه در چین، متوجه شدیم که همبستگی خاصی بین کیفیت آب آب های توزیع شده وجود دارد، یعنی اطلاعات مکانی و زمانی غنی موجود در بدنه های آبی توزیع شده به طور کامل مورد استفاده قرار نگرفته است. برای این وضعیت، یک روش پیشبینی کیفیت آب توزیعشده بر اساس همبستگی مکانی-زمانی پیشنهاد شد، یک سیستم پیشبینی کیفیت آب توزیعشده ساخته شد، و یک مدل پیشبینی مشترک CNN-LSTM و الگوریتم آموزشی و ساختار داده ورودی-خروجی آن طراحی شد. نتایج تحقیق نشان می دهد که سیستم پیشنهادی در این مقاله دارای مزایای قابل توجهی در پیش بینی کیفیت آب می باشد.
۲٫ مواد و روشها
۲٫۱٫ مقدمه ای بر ویژگی های کیفی آب
۲٫۲٫ تحلیل همبستگی مکانی-زمانی ویژگی های کیفی آب
به طور خلاصه، سیال بودن بدنه های آبی طبیعی، اطلاعات مکانی و زمانی قابل توجهی را به ویژگی های کیفی آب بدنه های آبی مجاور می دهد. این اطلاعات مکانی-زمانی ریشه در تغییرات دینامیکی بدنههای آبی در مکانهای جغرافیایی و مقیاسهای زمانی دارد که منعکسکننده مفاهیم غنی روندهای جریان سیستم آب است. در این زمینه، همبستگی مکانی-زمانی بین ویژگیهای بدنه آبی را میتوان استخراج کرد تا روابط متقابل و مکانیسمهای محرک بین ویژگیهای کیفیت آب در مقیاسهای مکانی و زمانی مختلف را آشکار کند، و پشتیبانی مؤثری برای مدلهای پیشبینی کیفیت آب توزیعشده در بدنههای آبی مجاور ارائه دهد.
۲٫۳٫ مدل سنتی پیش بینی
حافظه کوتاه مدت بلند مدت (LSTM) یک ساختار شبکه عصبی بازگشتی خاص (RNN) است که بر خلاف RNN های استاندارد، می تواند به طور موثر مشکلات وابستگی طولانی مدت را مدیریت کند. در RNN استاندارد، ورودی هر مرحله زمانی و حالت پنهان مرحله زمانی قبلی به مرحله زمانی بعدی داده می شود. این می تواند به شبکه کمک کند تا اطلاعات قبلی را به خاطر بسپارد، اما اگر توالی بیش از حد طولانی باشد، حفظ موثر حافظه از اطلاعات گذشته برای شبکه دشوار خواهد بود. LSTM این مشکل را با معرفی مکانیسمهای دروازهای حل میکند و به آن امکان میدهد وابستگیهای بلندمدت را بهتر به خاطر بسپارد. علاوه بر این، مدل استاندارد RNN نیز مستعد مشکلات ناپدید شدن یا انفجار گرادیان است که اثر یادگیری را محدود میکند. بنابراین، این مقاله شامل LSTM به عنوان مدل پیشبینی سری زمانی است.
۲٫۴٫ مدل CNN-LSTM
اطلاعات کیفیت آب دورهای را در طول زمان نشان میدهد و تحت تأثیر عوامل متعددی قرار میگیرد که روندی غیرخطی را نشان میدهد. با این حال، استفاده از مدل LSTM به تنهایی ممکن است منجر به معرفی نویز غیرمرتبط با پیشبینی کیفیت آب شود و ممکن است باعث شود مدل تحت تأثیر مقادیر بزرگتر و کوچکتر در سریهای زمانی قرار گیرد و در نتیجه بر عملکرد پیشبینی تأثیر بگذارد. از سوی دیگر، اگرچه استفاده مستقل از مدلهای CNN میتواند به طور موثر ویژگیهای محلی را از اطلاعات کیفیت آب استخراج کند، اما آنها حساسیتی نسبت به ترتیب زمانی اطلاعات کیفیت آب ندارند.
ورودی داده های آموزشی برای مدل CNN-LSTM یک ماتریس اطلاعات جامع در زمان واقعی است Dj (j = ک، ک – ۱، …، ک – n + 1) که شامل مشخصات کیفی آب تمام نقاط اندازه گیری آب توزیع شده است. n تعداد ماتریس های اطلاعاتی است که هر بار آموزش داده می شوند و ک تعداد کل ماتریس های اطلاعات فعلی است. عرض ماتریس اطلاعات تعداد نقاط اندازه گیری موجود در داده های ورودی و ارتفاع تعداد ویژگی های داده های ورودی است. هسته CNN یک گروه کانولوشن است که از لایه های کانولوشن و لایه های ادغام تشکیل شده است. در این مقاله، چندین گروه کانولوشن برای استخراج متوالی ویژگیهای سطح عمیق و کاهش ابعاد ماتریس اطلاعات ورودی ساخته شدهاند. برای استفاده کامل از دادههای هر نقطه اندازهگیری آب، ارتفاع میدان پذیرنده گروه پیچیدگی طوری تنظیم میشود که با ارتفاع ماتریس اطلاعات سازگار باشد. بعد از درگیر شدن Dj (j = ک، ک – ۱، …، ک – n + 1) از طریق چند گروه پیچیدگی، ویژگی عمیق افj (j = ک، ک – ۱، …، ک – n + 1) بدست می آید. برای برآورده کردن الزامات ورودی LSTM، یک لایه بازگشایی تنظیم شده است تا ویژگیهای عمیق را به بردارهای ویژگی یکبعدی متصل کرده و باز کند. ایکسj (j = ک، ک – ۱، …، ک – n + 1) در ردیف ها به عنوان ورودی LSTM. در میان آنها، برای اولین سلول در گروه سلول های پشت سر هم LSTM، وضعیت سلولی آن سیj-1 و خروجی سلول قبلی اچj-1 معمولاً روی ۰ تنظیم می شوند. در نهایت خروجی اچj از گروه پشت سر هم سلول LSTM به لایه کاملا متصل وارد می شود و مقادیر توالی پیش بینی کیفیت آب از طریق لایه کاملاً متصل نگاشت می شوند.
۲٫۵٫ معماری سیستم پیش بینی ویژگی کیفیت آب توزیع شده
سیستم پیشبینی عمدتاً شامل یک ماژول پیشپردازش داده، یک ماژول ذخیرهسازی داده، یک ماژول آموزش مدل و یک ماژول پیشبینی توان است.
توضیحات خاص در مورد عملکردهای هر ماژول به شرح زیر است:
ماژول پیش پردازش داده ها داده های مشخصه کیفیت آب توزیع شده را دریافت و شفاف می کند، داده ها را عادی می کند و مجموعه داده را برای تشکیل یک ماتریس اطلاعات بلادرنگ تقسیم می کند، که سپس به ماژول ذخیره سازی داده ها منتقل می شود.
ماژول ذخیره سازی داده، ماتریس اطلاعات تاریخی را ذخیره می کند و آن را در زمان واقعی به روز می کند و در عین حال مجموعه داده مورد نیاز را برای آموزش مدل و پیش بینی توان بر اساس درخواست های ماژول آموزش مدل و ماژول پیش بینی توان ارائه می دهد.
در ماژول آموزش مدل، پردازنده ثانویه پردازش ثانویه را بر روی داده های آموزشی انجام می دهد، که سپس برای آموزش مدل به مربی مدل وارد می شود. هر نقطه نظارت آب توزیع شده می تواند یک مدل پیش بینی را آموزش دهد که برای ذخیره سازی یکپارچه به ماژول پیش بینی کیفیت آب منتقل می شود.
در ماژول پیشبینی کیفیت آب، پیشبینیکننده کیفیت آب درخواستهای پیشبینی ارسال شده توسط سکوی پایش آب توزیعشده را دریافت میکند، مدل پیشبینی را بر اساس شماره توالی آب استخراج میکند و آخرین مجموعه ماتریس اطلاعات جامع را پس از پردازش ثانویه دریافت میکند. توالی ارزش پیش بینی کیفیت آب محاسبه شده و به سکوی نظارت منتقل می شود.
۲٫۶٫ پیش پردازش داده ها
این مطالعه شامل دادههای کیفیت آب از گزارش نظارت هفتگی خودکار ارائهشده توسط ایستگاه نظارت بر محیطزیست چین در حوضه رودخانه یانگ تسه از ۱ ژانویه ۲۰۱۶ تا ۳۰ دسامبر ۲۰۱۸ به عنوان دادههای آزمایش مدل است. فرکانس جمع آوری این داده ها یک بار در هفته است.
برای اطمینان از صحت داده های آموزشی مدل، لازم است منبع داده را تمیز و نرمال سازی کنید، مجموعه داده را پارتیشن بندی کنید و در نهایت پردازش بازیابی داده ها را انجام دهید. مراحل دقیق به شرح زیر است.
- (۱)
-
پاکسازی داده ها
با توجه به اینکه دادههای بهدستآمده ممکن است از بین بروند یا دارای ناهنجاریهایی باشند که باعث خطای پیشبینی شود، ابتدا دادهها پیش پردازش میشوند. درون یابی برای پر کردن بخشهای گمشده دادهها استفاده میشود و معیار Rayda عمدتاً برای رسیدگی به موارد پرت استفاده میشود. داده های تکراری حذف می شوند.
- (۲)
-
نرمال سازی داده ها
در فرمول، ایکسهنجار* شاخص نرمال شده است. ایکس نشان دهنده داده ها قبل از عادی سازی است. ایکسدقیقه حداقل مقدار کل نمونه است. ایکسحداکثر حداکثر مقدار کل نمونه است.
- (۳)
-
مجموعه داده پارتیشن
برای بهبود عملکرد مدل ارزیابی و جلوگیری از برازش بیش از حد، تقسیم مجموعههای آموزشی و اعتبارسنجی به نسبت ۹:۱ به معنای استفاده از ۹۰ درصد دادههای نمونه برای آموزش مدل و ۱۰ درصد باقیمانده برای اعتبارسنجی عملکرد مدل است.
- (۴)
-
بازیابی داده ها
به منظور ارزیابی بهتر عملکرد پیشبینی مدل، این مقاله از شاخصهای ارزیابی مدل رگرسیون رایج از جمله میانگین خطای مطلق استفاده میکند.MAE، ریشه میانگین مربعات خطا (RMSE) و حسن تناسب (R-square، آر۲) برای ارزیابی نتایج تجربی.
۳٫ نتایج
۳٫۱٫ انتخاب شاخص ها
از جدول می توان دریافت که ضرایب همبستگی پیرسون از pH، انجام دادن، و COD شاخصها با افزایش حجم دادهها دستخوش تغییرات قابلتوجهی شدهاند و عموماً در سطح پایینی قرار دارند که نشاندهنده پایداری ضعیف سه شاخص فوق و همبستگی کم با شاخصهای کیفیت آب و دسته بهداشتی است. از سوی دیگر، NH4 شاخص با افزایش حجم داده ها تغییرات معنی داری نشان نداد و عموماً در سطح بالایی (بین ۶۳/۰ تا ۶۸/۰) باقی ماند که نشان دهنده پایداری قوی و همبستگی قوی با شاخص های کیفیت آب و رده بهداشتی است. به طور خلاصه، این مقاله شامل NH4 شاخص به عنوان شاخص کلیدی مشخصه کیفیت آب برای تحقیقات پیشبینی کیفیت آب بعدی.
۳٫۲٫ پیش بینی نتایج و تجزیه و تحلیل
بر اساس فرآیند واقعی آموزش، این مقاله پارامترهای آموزشی را برای مدل CNN-LSTM به صورت زیر تنظیم میکند: تعداد کل دورهها برای آموزش ۶۰۰ دوره، اندازه دستهای برای یک آموزش واحد دو، نرخ یادگیری اولیه ۰٫۰۰۱ و الگوریتم بهینه سازی از الگوریتم آدام (الگوریتم بهینه سازی آدام) استفاده می کند.
از بعد داده، می توان دریافت که MAPE و RMSE مدل CNN-LSTM بسیار کمتر از مدل CNN و مدل LSTM است (حدود ۱/۴ از دو مورد اخیر). مدل CNN شبیه مدل LSTM است. در همین حال، آر۲ CNN-LSTM به اندازه ۰٫۹۹ است و هر دو مدل CNN و LSTM حدود ۰٫۹۲ هستند. بدیهی است که داده های فوق برتری مدل CNN-LSTM را در پیش بینی کیفیت آب توزیع شده تایید می کند. در همان زمان، مدل CNN-LSTM با استفاده از داده های توزیع شده از چندین سایت آبی برای پیش بینی، اثر پیش بینی بهتری را نسبت به مدل CNN-LSTM با استفاده از داده های یک سایت واحد نشان می دهد. این نشان می دهد که در مقایسه با روش سنتی، اطلاعات کیفیت آب سایر ایستگاه های توزیع شده در روش پیش بینی در این مقاله با اثر پیش بینی تداخلی ندارد. در مقابل، دقت پیشبینی با تجزیه و تحلیل اطلاعات همبستگی مکانی-زمانی موجود در آن به طور قابلتوجهی بهبود مییابد.
منبع:
۱- shahrsaz.ir , پایداری | متن کامل رایگان | تجزیه و تحلیل پیشبینی کیفیت آب در دلتای رودخانه یانگ تسه تحت سیستم اصلی رودخانه
,۲۰۲۴-۰۶-۲۹ ۰۳:۳۰:۰۰
۲- https://www.mdpi.com/2071-1050/16/13/5578
آب , اصلی , پایداری , پیشبینی , تجزیه , تحت , تحلیل , تسه , در , دلتای , رایگان , رودخانه , سیستم , کامل , کیفیت , متن , یانگ
- دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
- پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.