امروز : چهارشنبه, ۱۳ تیر , ۱۴۰۳
علوم شهری | متن کامل رایگان
۳٫۱٫ Panoptic DeepLab آموزش دیده بر روی مناظر شهری شکل ۲ نتایج Panoptic Deeplab اعمال شده در مجموعه داده Cityscapes را ارائه می دهد. مناظر شهری شامل انواع قابل توجهی از برچسب های متمایز است. با این حال، Panoptic Deeplab توانایی خود را در شناسایی و طبقه بندی موفقیت آمیز همه این برچسب ها، به […]
۳٫۱٫ Panoptic DeepLab آموزش دیده بر روی مناظر شهری
-
ماژولهای ASPP دوگانه و رمزگشای دوگانه، شبکه را قادر میسازد تا پیچیدگیهای تقسیمبندی معنایی (دستهبندی مناطق به کلاسهای گسترده) و تقسیمبندی نمونه (شناسایی نمونههای شی منفرد) را مدیریت کند.
-
ستون فقرات مشترک امکان استخراج ویژگی را می دهد که برای هر دو وظیفه تقسیم بندی مفید است و استفاده از ویژگی های آموخته شده را به حداکثر می رساند.
-
رگرسیون مرکز نمونه، رویکرد از پایین به بالا را برای تقسیمبندی به عنوان مثال، شناسایی اشیاء مجزا بدون نیاز به پیشنهادهای منطقه، تسهیل میکند.
-
عملیات ادغام کارآمد خروجیهای هر دو وظیفه تقسیمبندی را برای ایجاد یک نقشه تقسیمبندی پانوپتیک منسجم، ترکیب میکند، که هر دو دسته «چیز» (اشیاء منفرد) و «مواد» (مناطق بیشکل مانند چمن یا آسمان) را ادغام میکند.
علاوه بر این، Panoptic-DeepLab با سادگی، سرعت، کارایی و عملکرد پیشرفته خود را متمایز می کند و معیار جدیدی را در زمینه تقسیم بندی پانوپتیک ایجاد می کند. معماری این مدل به طرز مبتکرانه ای ساخته شده است که کمتر پیچیده و در عین حال قوی باشد، و جایگزین ساده تری برای روش های پیچیده تر دو مرحله ای که معمولاً در تقسیم بندی تصویر یافت می شوند، ارائه می دهد. این سادگی نه تنها سهولت اجرا و اصلاح را تسهیل می کند، بلکه جذابیت آن را برای طیف وسیع تری از برنامه ها افزایش می دهد. نقطه قوت اصلی Panoptic-DeepLab در سرعت و کارایی آن نهفته است، ویژگی هایی که از ساختار ساده و استفاده از ستون فقرات مشترک ناشی می شود. این باعث میشود که برای برنامههای بلادرنگ مناسب باشد، جایی که پردازش سریع ضروری است. از نظر عملکرد، Panoptic-DeepLab برتر است و به طور مداوم به نتایج رقابتی یا پیشرو در معیارهای مختلف مختلف، از جمله Cityscapes، Mapillary Vistas و COCO دست می یابد. این سطح بالای عملکرد گواهی بر اثربخشی مدل در انجام وظایف تقسیم بندی متنوع است. علاوه بر این، رویکرد پایین به بالا آن در بخشبندی پانوپتیک، فرآیند را ساده میکند و در عین حال خروجی با کیفیت بالا را حفظ میکند.
عملکرد شبکههای عصبی، بهویژه در حوزه بینایی رایانه، اساساً با کالیبر و تنوع دادههای آموزشی که در معرض آن قرار میگیرند، مرتبط است. این اصل در مورد Panoptic DeepLab، یک مدل پیشرفته در زمینه تقسیمبندی پانوپتیک، نمونهای است. یکی از عوامل کلیدی موفقیت آن مجموعه داده Cityscapes است، مجموعه ای گسترده از توالی های ویدئویی استریو که به دقت در صحنه های خیابانی از ۵۰ محیط مختلف شهری ثبت شده است. این مجموعه داده نه تنها حجیم است، بلکه از نظر کیفیت و تنوع غنی است و شامل حاشیه نویسی در سطح پیکسل با کیفیت بالا با ۵۰۰۰ فریم به همراه مجموعه قابل توجهی از ۲۰۰۰۰ فریم با حاشیه نویسی ضعیف تر است. این مجموعه داده جامع طیف گسترده ای از طبقات اشیاء شهری، از جمله اتومبیل ها، عابران پیاده، دوچرخه ها، و ساختمان ها را در بر می گیرد که هر کدام چالش های منحصر به فردی را از نظر تقسیم بندی و تشخیص ارائه می کنند.
مجموعه داده های دقیق و متنوع Cityscapes به عنوان یک معیار اساسی برای توسعه و ارزیابی الگوریتم های تقسیم بندی معنایی پیشرفته عمل می کند. پیچیدگی و تنوع در دنیای واقعی مجموعه داده، آن را به مکانی ایدهآل برای مدلهایی تبدیل میکند که برای کارهای پیچیده در بینایی کامپیوتری در نظر گرفته شدهاند، مانند تقسیمبندی پانوپتیک و ردیابی شی. عمق و وسعت داده های آن به طور قابل توجهی به آموزش مدل ها کمک می کند و آنها را قادر می سازد تا طیف گسترده ای از اشیاء و سناریوهای معمولی مناظر شهری را یاد بگیرند و به طور دقیق شناسایی کنند.
۳٫۲٫ WSR
ساختار شبکه WaSR یک معماری یادگیری عمیق تخصصی است که برای تشخیص موانع دریایی، با چندین ویژگی و عملکرد متمایز طراحی شده است. در زیر به تفصیل ساختار شبکه، قابلیتها و مزایای آن اشاره شده است:
- ۱٫
-
معماری رمزگذار – رمزگشا:
- (آ)
-
رمزگذار: بر اساس ResNet101 با پیچیدگی های ترسناک برای استخراج ویژگی های بصری غنی.
- (ب)
-
رمزگشا: ویژگی های رمزگذار را ادغام می کند و آنها را برای ساخت نقشه تقسیم بندی نمونه برداری می کند. شامل چندین ماژول فیوژن برای رسیدگی به آب های مختلف.
- ۲٫
-
ماژول های فیوژن:
- ۳٫
-
ادغام واحد اندازه گیری اینرسی (IMU).:
- ۴٫
-
رمزگذاری کانال ویژگی IMU:
- (آ)
-
روش های رمزگذاری: رسم خط افق، رمزگذاری فاصله علامت دار از افق و ایجاد یک ماسک باینری در زیر افق.
- (ب)
-
این کانالهای کدگذاری شده برای بهبود دقت بخشبندی در رمزگشا ترکیب میشوند.
شبکه WaSR برای تقسیم بندی معنایی دقیق در محیط های دریایی، یک عملکرد محوری برای ناوبری و نظارت مستقل در تنظیمات دریایی، به دقت طراحی شده است. توانایی اصلی آن در مهارت آن در تشخیص عناصر مختلف در یک صحنه دریایی مانند آب، آسمان، کشتی ها و سایر اشیاء مربوطه نهفته است. این ویژگی بسیار مهم است، زیرا مستقیماً تصمیمات ناوبری را برای وسایل نقلیه دریایی بدون سرنشین اطلاع می دهد و ایمنی و کارایی در ناوبری را تضمین می کند.
یکی از جنبه های ضروری عملکرد WaSR، استحکام آن در مدیریت ظاهر پیچیده آب است. محیطهای دریایی ذاتاً پویا هستند، با شرایط مختلف مانند سناریوهای مختلف نور، بازتابها و بافتهای آب متنوع. معماری پیچیده WaSR میتواند این چالشها را پشت سر بگذارد و از تقسیمبندی دقیق حتی در این شرایط نوسانی اطمینان حاصل کند.
یکی از ویژگی های برجسته شبکه WaSR یکپارچه سازی داده ها از یک واحد اندازه گیری اینرسی (IMU) است. این ادغام فقط یک پیشرفت مکمل نیست، بلکه یک جنبه اصلی از عملکرد آن است. داده های IMU نقش مهمی در تعیین دقیق خط افق و جهت گیری دوربین نسبت به افق دارند. این امر به ویژه در شرایط بصری مبهم که اغلب در دریا با آن مواجه میشویم، مانند سناریوهای مهآلود یا تابش خیرهکننده، حیاتی است. با ادغام این دادههای اینرسی با نشانههای بصری، WaSR به سطح بالاتری از دقت در تشخیص و جهتیابی افق دست مییابد، که در تفسیر صحیح صحنههای دریایی مفید است.
یکی دیگر از مزایای قابل توجه WaSR قابلیت تعمیم چشمگیر آن است. این شبکه آزمایش شده است و عملکرد قابل ستایشی را در مجموعه داده های مختلف و تنظیمات سخت افزاری نشان داده است. این توانایی تعمیم تضمین می کند که WaSR به شرایط یا محیط های خاصی که آموزش داده شده محدود نمی شود و آن را به ابزاری همه کاره و قوی برای تشخیص موانع دریایی تبدیل می کند. WaSR چه بر روی انواع مختلف وسایل نقلیه سطحی بدون سرنشین و چه در مکان های جغرافیایی مختلف مستقر شود، سطح ثابتی از دقت و قابلیت اطمینان را حفظ می کند.
۳٫۳٫ مدل فیوژن
در تلاش خود برای اصلاح بخشبندی برای محیطهای آبی و زمینی، یک مدل همجوشی را ابداع کردیم که از نقاط قوت متمایز مدلهای WaSR و Panoptic DeepLab بهره میبرد. این مدل برای غلبه بر محدودیتهای خاص هر سیستم در هنگام برخورد با صحنههای پیچیده محیطی که شامل زمین و آب است، طراحی شده است.
مدل آبی در تقسیمبندی مناطق آبی برتری دارد، اما در ارائه جزئیات پیچیده برای بخشهای خشکی کوتاهی میکند. برعکس، Panoptic DeepLab که با مجموعه داده گسترده Cityscapes آموزش دیده است، برچسبگذاری جامعی را برای ویژگیهای زمین ارائه میکند اما نمیتواند مناطق آبی را به طور موثر تقسیمبندی کند. هدف مدل همجوشی ما این است که از این قابلیتهای متفاوت برای راهحل قطعهبندی قویتر استفاده کند.
این فرآیند با یک مرحله پیش پردازش استاندارد شروع می شود که در آن اندازه یک تصویر ورودی به یک بعد یکنواخت تغییر می کند و آن را با تجزیه و تحلیل توسط دو مدل سازگار می کند. مدل آبی تصویر را پردازش می کند تا آن را به سه دسته تقسیم کند: آبی، آسمان و غیره. پس از این، ما از یک ماسک سفارشی استفاده می کنیم که بخش های “آسمان” و “سایر” را فیلتر می کند و منطقه آبی را در تصویر جدا می کند. به طور همزمان، Panoptic DeepLab تقسیم بندی خود را انجام می دهد و نمودارهای نمونه تقسیم دقیق را بر اساس برچسب های آموزشی متمرکز بر زمین خود تولید می کند. با این حال، توجه به این نکته مهم است که خروجی Panoptic DeepLab برای مناطق آبی به دلیل عدم وجود چنین برچسبهایی در مجموعه آموزشی آن قابل اعتماد نیست.
سپس چالش در ادغام موثر این خروجی ها برای تولید یک نقشه منسجم بخش بندی شده نهفته است. برای پرداختن به این موضوع، مدل همجوشی ما در ابتدا بخش آبی را از خروجی Panoptic DeepLab کنار میگذارد و به عدم دقت ذاتی آن اذعان میکند. ما این بخش را با ماسک آبی تولید شده توسط نتیجه آبی جایگزین می کنیم و از ترسیم دقیق بدنه های آبی اطمینان می دهیم. با این حال، با توجه به عدم دقت آن در طبقهبندی مناطق آبی، یک مسئله حیاتی در استخراج بخشهای غیرآبی از خروجی Panoptic DeepLab مطرح میشود. برای حل این مشکل، یک تگ یاب ابتکاری مبتنی بر رنگ را معرفی می کنیم. این ابزار خروجی RGB از مدل WaSR را تجزیه و تحلیل میکند و بر شناسایی رنگهای آبی مربوط به مناطق آبی تمرکز میکند. با مشخص کردن دقیق این مناطق، میتوانیم به طور یکپارچه تقسیمبندی دقیق زمین از Panoptic DeepLab را با تقسیمبندی آبی از مدل دیگر ادغام کنیم.
از طریق این رویکرد همجوشی پیچیده، مدل ما به طور موثر تقسیمبندی دقیق زمینی Panoptic DeepLab را با ترسیم دقیق آبزی WaSR ترکیب میکند. این منجر به یک نمایش جامع و دقیق از محیط های خشکی و آبی می شود که به طور قابل توجهی قابلیت های تقسیم بندی و تجزیه و تحلیل محیطی را افزایش می دهد.
علاوه بر این، ما یک مرحله اصلاح رنگ را برای مناطق برچسبدار استخراجشده معرفی کردیم. این تغییر برای افزایش تمایز بصری این نواحی انجام می شود و مشاهده و تجزیه و تحلیل نتایج تقسیم شده را آسان تر می کند. با تغییر رنگ این نواحی، ما یک مرزبندی بصری واضحتر ارائه میکنیم، که به ویژه در برنامههایی که نیاز به شناسایی و تمایز سریع بخشهای مختلف دارند، مفید است.
به طور خلاصه، مدل همجوشی ما نشاندهنده پیشرفت قابلتوجهی در تقسیمبندی محیطی است، که دقت آبی نتیجه مدل آبی را با قابلیتهای گسترده برچسبگذاری زمین Panoptic DeepLab ترکیب میکند. این مدل نه تنها به دقت بالایی در بخشبندی محیطهای متنوع دست مییابد، بلکه نتایج را به شیوهای بصری بصری ارائه میکند، که هم قابلیت استفاده و هم کاربرد دادههای تقسیمبندی شده را افزایش میدهد.
منبع:
۱- shahrsaz.ir , علوم شهری | متن کامل رایگان
,۲۰۲۴-۰۳-۲۲ ۰۳:۳۰:۰۰
۲- https://www.mdpi.com/2413-8851/8/2/23
- دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
- پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.