شکل ۳-۶، یک پیاده سازی مناسب از الگوریتم خوشهبندی سلسله مراتبی پایین به بالا را نمایش میدهد. این الگوریتم با مقداردهی اولیه خوشهبندی C آغاز میشود؛ به این ترتیب که خوشهبندی C، شامل تمامی نمونهها در قالب خوشههای یگانه خواهد بود. از آنجائیکه، خوشهبندی اولیه، شامل تعداد زیادی خوشه میباشد، مکررآً، جفت خوشهای که دارای امتیاز بالاتری نسبت به سایرین هستند انتخاب میشوند و درصورتی که امتیاز آنها از حد آستانه مورد نظر بیشتر باشد، خوشههای با یکدیگر ادغام و تشکیل یک خوشهی جدید میدهند، و این فرایند با جفت خوشه دیگری که دارای امتیاز بالاتری نسبت به سایرین هستند ادامه پیدا میکند. تابع امتیازدهی یک ترکیب وزندار خطی از ویژگیهای میباشد که از جفت خوشهها استخراج شده، و توسط بردار وزن W پارامتردهی میشود. از سویی دیگر، تابع نیز، خوشهبندی[۲۰۸] C را به عنوان ورودی گرفته و طبق رابطه ۳-۱۴، مجموعهای از جفت خوشهها را برمیگرداند.
رابطه (۳-۱۴) } } |
همانطور که در رابطهی ۳-۱۴، مشاهده میشود، شامل جفت نیز میباشد، که برای آن، تعریف خواهد شد تا شامل ویژگی دودویی منحصر بفردی برای جفتهای خالی نیز باشد. وزن متناظرِ آن، به همراه تمام وزنهای دیگر، مورد یادگیری قرار میگیرد تا به طور موثر به عنوان آستانهی خوشهبندی عمل نماید.
( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
۳-۲-۱-۲. آموزش الگوریتم خوشهبندی سلسله مراتبی
الگوریتمهایی که در شکلهای ۳-۷ و ۳-۸ آمدهاند، بیانگر یک مدل یادگیری افزایشی میباشند. در الگوریتم ۳-۷، بردار وزنی W، با تکراری به اندازهی تعداد دورههای آموزشیT و یک مجموعه خوشهبندی شده[۲۰۹]، بروزرسانی میشود؛ بدین ترتیب که این الگوریتم مکرراً، از خوشهبندیهای مشخص شده برای نیل به این منظور استفاده میکند. این اقدام و استفاده از میانگین در بردارِ وزنی مانع از بروز بیشبرازش[۲۱۰] خواهد شد. همان طور که مشاهده میشود، هسته اصلی مدل یادگیری، رویه بروزرسانی است و بطوریکه الگوریتم یادگیری، برای بروزرسانی آخرین بردار وزنی، این رویه را فراخوانی میکند.
الگوریتم خوشهبندی سلسله مراتبی پایین به بالا با ورودیهای (X,F):
-
- و
-
- به ازای انجام بده
-
- پایان حلقه اول
-
- در همهی جفت خوشههایی که فاصلهی میان آنها را بوسیله تابع محاسبه شده است، آنکه دارای بیشترین امتیاز است را در نظر بگیر
-
- تا زمانی که و ادامه بده
-
- در C، را با جایگزین کن
-
- حالا از میان جفتهای باقیمانده، جفت بعدی که دارای بیشترین امتیاز است را انتخاب کن
-
- پایان حلقه دوم
-
- بازگرداندن C در خروجی
شکل ۳-۶: الگوریتم خوشهبندی سلسله مراتبی پایین به بالا
الگوریتم بروزرسانی، نخست مانند الگوریتم خوشهبندی حریصانه عمل میکند، تا تمام دادههای ورودی را در قالب خوشههای تک عنصری در مجموعه خوشهبندی قرار دهد. در هر تکرار ازحلقه(خطوط ۶ تا ۱۷)، یک جفت خوشه که دارای بیشترین امتیاز نسبت به سایرین هستند ادغام میشوند، حلقه آنقدر ادامه پیدا میکند تا تمام خوشهها با هم یکی شده و تشکیل یک خوشه را بدهند و یا جفت خوشه خالی نیز به حداکثر امتیاز برسد. منطق بروزرسانی وزن در خطوط۸-۱۱ تعبیه شدهاست. به این ترتیب که اگر بتوان جفت دقیق تری پیدا کرد، آنرا به عنوان جفتی که دارای بالاترین امتیاز است به ورودی پرسپترون در خط ۱۱ دادهمیشود.
الگوریتم یادگیری با ورودیهای (C,T)
ورودی این الگوریتم: دریافت مجموعه خوشهبندیهای به عنوان مجموعهی آموزشی و تعداد دورههای آموزش T
خروجی: مقدار میانگین شده
-
- مقدار ۰ را به W اختصاص بده
-
- به ازای انجام بده
-
- برای تمام انجام بده
-
- UPDATE(C,W)
-
- پایان حلقه اول
-
- پایان حلقه دوم
-
- بازگرداندن
شکل ۳-۷: الگوریتم آموزش خوشهبندی حریصانه
اگر چندین جفت خوشه در خطوط ۷و۱۰ کاندیدا شوند، به طور تصادفی یکی از آنها انتخاب میشود. این عمل به خصوص در هنگام شروع فرایند و هنگامی که بردار وزن برابر با صفر است، میتواند موثر واقع شود. از طرفی دیگر در خط ۸، تابع خوبی[۲۱۱] یا تناسب استفاده شدهاست، این تابع برای جفت خوشه به صورت تعریف شده است. این مقدار با توجه به خوشهبندی برچسبدار آموزشیِ به عنوان صحتِ[۲۱۲] جفتهای هممرجع درنظر گرفته میشود، که در صورت ادغام ایجاد گردیده است.
رابطه (۳-۱۵)
رابطهی۳-۴ نشان میدهد، تابع تناسب، در خطوط ۸تا ۱۰، جفت خوشهای را انتخاب میکند که در هنگام ادغامشان، نتایج در خوشهبندی به دقت بهتری منتج شوند. به طورکلی این الگوریتم سعی دارد به گونهای با جستجو در دادههای آموزشی، پارامترهایی را پیدا کند که هم بیشبرازش را تحت کنترل داشته باشد(با بهره گرفتن از پارامترهای میانگین) و هم دقت خوشهبندی، بیشینه گردد.