شکل(۱- ۲۰): ساختار یک MLP سه لایه
۱-۸-۶- ترتیب ارائه داده ها به شبکه
ارائه داده های آموزش به شبکه به روش های مختلفی انجام میگیرد:
۱- داده ها به ترتیب به شبکه وارد میشوند.
۲- داده ها به صورت تصادفی به شبکه ارائه میشوند.
۳- یک داده مکرراً به شبکه ارائه میگردد تا هنگامی که معیار خطا به یک مقدار قابل قبول برسد، سپس داده بعدی وارد شبکه می شود.
از بین روش های ذکر شده، ارائه تصادفی داده ها به شبکه، بهترین نرخ همگرایی و کاهش خطا را در حین آموزش داراست. همچنین اصلاح وزنها می تواند بعد از ارائه کل داده های آموزش، یا بعد از ارائه هر داده و یا بعد از ارائه تعداد مشخصی داده به شبکه صورت گیرد.
۱-۸-۷- تابع انتقال
تابعی که ورودیهای یک نرون را تبدیل می کند، مستقیماً فرایند یادگیری را تحت تأثیر قرار میدهد. برای انتقال ورودیهای یک نرون از هر تابعی میتوان استفاده کرد، اما معمولاً توابع خطی، سیگموئید و تانژانت هایپربولیک به کار میرود.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
ساده ترین تابع، تابع خطی است که ورودیهای یک نرون را بدون تغییر به لایه بعدی یا به محیط انتقال میدهد، در نتیجه دامنه آن ∞- تا ∞+ میباشد. تابع خطی می تواند در لایه ورودی و یا لایه خروجی به کار رود، اما استفاده از آن در لایه مخفی فرایند یادگیری را مختل می کند.
اغلب برای شبکه های چند لایه ای از تابع انتقال سیگموئید استفاده می شود. تابع سیگموئید خروجی های بین (۱و۰) تولید می کند که درآن ورودیهای نرون از ∞- به سوی ∞+ میرود.
(۱-۴۹)
همچنین در بعضی موارد ممکن است از تابع انتقال تانژانت هایپربولیک استفاده شود.
(۱-۵۰)
شکل(۱- ۲۱): تابع انتقال سیگموئید
شکل(۱- ۲۲): تابع انتقال تانژانت هایپربولیک
این دو نوع تابع معرفی شده پر استفاده ترین توابع در شبکه های عصبی هستند. اما توابع انتقال مختلف دیگر میتوانند خلق شوند و اگر لازم باشد با الگوریتم پس انتشار مورد استفاده قرار گیرند.
۱-۸-۸- پایان آموزش
مسأله دیگری که در الگوریتم یادگیری مطرح است این است که چه هنگام باید آموزش خاتمه یابد. برای این کار یکی از سه روش زیر می تواند استفاده شود:
۱- یک مقدار ثابت برای تعداد دورهای (Epoch) ارائه کل داده ها به شبکه در نظر گرفته شود. اگر در انتهای آموزش نتایج رضایت بخش نبود، مراحل دوباره تکرار شود.
۲- در حین آموزش بعد از هر n دور ارائه داده ها به شبکه، آموزش موقتاً متوقف شده و عملکرد شبکه سنجیده شود. سنجش عملکرد شبکه می تواند در برابر سری داده های آموزش یا سری داده های Cross Validation صورت گیرد.
۳- دو روش بالا برای معیار خاتمه آموزش میتوانند ترکیب شوند.
عموماً عملکرد یک شبکه عصبی در برابر یک سری داده Cross Validation امتحان می شود تا نتایج آینده شبکه مورد قضاوت قرار گیرد و همچنین از آموزش بیش از حد شبکه جلوگیری شود.
۱-۸-۹- تعداد نرون در لایه ها
تعداد نرون در لایه ورودی به تعداد پارامترهای مستقل مؤثر بر پدیده مورد بررسی میباشد. همچنین تعداد نرون در لایه خروجی برابر با تعداد متغیرهایی است که باید پیش بینی شوند. تعداد نرون در لایه مخفی متغیری است که باید تعیین شود. معمولاً مقدار این متغیر بر پایه سعی و خطا با توجه به نتایج شبکه تعیین می شود، اما روش های تئوری متعددی نیز برای تعیین این متغیر وجود دارد[۲۵]. همچنین میتوان از روش های بهینه سازی مانند الگوریتم ژنتیک برای یافتن مقدار بهینه تعداد نرونها در لایه مخفی استفاده کرد.
۱-۸-۱۰- معیارهای نیکویی برازش
معمولاً از معیارهای آماری مختلفی برای سنجش عملکرد شبکه عصبی استفاده میشود که مهمترین آنها عبارتند از:
تحلیل رگرسیون
با بهره گرفتن از برازش میتوان نتایج پیشبینی شدهی شبکه را در برابر خروجی مطلوب در نموداری که بهعنوان نمودار تحلیل رگرسیون است (متغییر مستقل در مقابل متغییر وابسته رسم میشود) رسم کرد. مطابق رابطهی (۱-۵۳)، دو معیار a وb، را محاسبه کرد که هر چه مقدار b نزدیک به ۱ و هر چه مقدار a نزدیک به صفر باشد، بیانکنندهی مناسب بودن عملکرد بهکار رفته است.
(۱-۵۳)
ضریب همبستگی[۴۷]
ضریب همبستگی، بیانکنندهی میزان همبستگی بین نتایج پیشبینی شدهی شبکه و دادههای واقعی میباشد و بهعبارتی از تقسیم کوواریانس متغیرهای مستقل و وابسته، بر انحراف معیار آنها بهدست میآید. مطابق رابطهی (۱-۵۴)، میتوان ضریب همبستگی را محاسبه کرد. بدیهی است که هر چه مقدار این ضریب به عدد ۱ نزدیکتر باشد، نشاندهندهی نزدیکی بیشتر مقادیر پیشبینی شده با مقادیر واقعی است.
(۱-۵۴)
که در آن:
: مقادیر مشاهده شده (واقعی).
: میانگین مقادیر مشاهده شده (واقعی).
: مقادیر تخمینی (خروجی شبکه).
: میانگین مقادیر تخمینی (خروجی شبکه)، میباشد.
مجذور میانگین مربعات خطا[۴۸]
یک شاخص مناسبتر که میتوان از آن در برآورد میزان دقت شبکه استفاده کرد، مجذور میانگین مربعات خطا میباشد. این معیار، دقت مدل را بر اساس تفاضل بین مقادیر واقعی و مقادیر پیشبینی شده، ارزیابی میکند و طبیعتاً هرچه به صفر نزدیکتر باشد، نمایانگر اختلاف کمتری بین آنها خواهد بود. مجذور میانگین مربعات خطا با رابطهی (۱-۵۵) تعریف میشود.
(۱-۵۵)
که در آن، n تعداد دادهها وسایر پارامترها مانند رابطهی (۱-۵۴) میباشند.