طرح های پژوهشی دانشگاه ها درباره ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و ... |
اگر نمونههای ورودی مطابق شکل فوق باشند مشخص است که می توان داده ها را به دو خوشه تقسیم کرد. اما مشکلی که پیش میآید این است که دادهی مشخص شده در وسط می تواند عضو هر دو خوشه باشد. بنابراین، باید تصمیم گرفت که دادهی مورد نظر متعلق به کدام خوشه است؛ خوشهی سمت راست یا خوشهی سمت چپ. اما اگر از خوشه بندی فازی استفاده کنیم، دادهی مورد نظر با تعلق ۰٫۵ عضو خوشهی سمت راست و با تعلق مشابه عضو خوشهی سمت چپ است. تفاوت دیگر در این است که مثلاً نمونه های ورودی در سمت راست شکل می توانند با یک درجه تعلق خیلی کم عضو خوشهی سمت چپ نیز باشند که همین موضوع برای نمونه های سمت چپ نیز صادق است.
زمانی که در سال ۱۹۶۵ پروفسور لطفیزاده، استاد ایرانیالاصل دانشگاه برکلی، اولین مقاله خود را در زمینه فازی تحت عنوان مجموعههای فازی منتشر کرد، هیچ کس باور نداشت که این جرقهای خواهد بود که دنیای ریاضیات را به طور کلی تغییر دهد.
یکی از مهمترین و پرکاربردترین الگوریتمهای خوشهبندی فازی، الگوریتم c میانگین میباشد[۳۵]. در این الگوریتم نمونهها به c خوشه تقسیم میشوند به گونه ای که تعداد c از قبل مشخص شده باشد. در نسخه فازی این الگوریتم نیز تعداد خوشه ها © از قبل مشخص شده است. در الگوریتم خوشه بندی c میانگین فازی تابع هدف بصورت زیر می باشد:
(۲-۸)
در فرمول فوق m یک عدد حقیقی بزرگتر از ۱ است که در اکثر موراد برای m عدد ۲ انتخاب می شود. اگر در فرمول فوق m را برابر ۱ قرار دهیم تابع هدف خوشهبندی c میانگین (کلاسیک) غیرفازی بهدست می آید. در فرمول فوق نمونه ام و نماینده یا مرکز خوشه ام و تعداد نمونـهها میباشد. میـزان تعلق نمونه ام در خوشه ام را نشان می دهد. علامت ||*|| میزان تشابه (فاصله) نمونه با (از) مرکز خوشه میباشد که میتوان از هر تابعی که بیانگر تشابه نمونه و مرکز خوشه باشد، استفاده کرد. از روی میتوان یک ماتریس تعریف کرد که دارای سطر و ستون میباشد و مؤلفه های آن هر مقداری بین صفر تا ۱ را میتوانند اختیار کنند. اگر تمامی مؤلفه های ماتریس به صورت صفر و ۱ باشند، الگوریتم مشابه c میانگین کلاسیک خواهد بود. با اینکه مؤلفه های ماتریس می توانند هر مقداری بین صفر تا ۱ را اختیار کنند، اما مجموع مؤلفه های هر یک از ستونها باید برابر ۱ باشد و داریم:
(۲-۹)
این شرط به این معنا است که مجموع تعلق هر نمونه به c خوشه باید برابر ۱ باشد. برای بهدست آوردن فرمولهای مربوط به و باید تابع هدف تعریف شده، حداقل گردد. با بهره گرفتن از شرط فوق و برابر صفر قرار دادن مشتق تابع هدف خواهیم داشت:
(۲-۱۰)
(۲-۱۱)
با اسـتفاده از دو فرمول فوق، مراحل انجام الگوریتم خوشـهبندی c میانگین فازی بصورت زیر می باشد:
مرحله اول: مقدار دهی اولیه برایc، m و U، با توجه به قید ۲-۹٫
مرحله دوم: مراکز خوشه ها با بهره گرفتن از فرمول ۲-۱۰ محاسبه شوند.
مرحله سوم: محاسبهی تابع هدف با توجه به فرمول ۲-۸٫ در صورتیکه از مقدار آستانهای کوچکتر است، الگوریتم خاتمه یابد در غیر اینصورت برو به مرحله دوم.
مرحله چهارم: محاسبهی مقدار جدید با بهره گرفتن از فرمول ۲-۱۱٫
برای مشاهده عملکرد خوشهبندی فازی به مثال زیر توجه کنید. در شکل ۲-۶ یک توزیع یک بعدی از نمونههای ورودی آورده شده است.
شکل ۲-۶ توزیع یک بعدی نمونه ها.
اگر از الگوریتم c میانگین کلاسیک استفاده کنیم داده های فوق به دو خوشهی مجزا تقسیم خواهند شد و هر نمونه تنها متعلق به یکی از خوشه ها خواهد بود. بهعبارت دیگر، تابع تعلق هر نمونه مقدار صفر یا ۱ خواهد داشت. نتیجه خوشه بندی کلاسیک در شکل ۲- ۷نشان داده شده است:
شکل ۲‑۷ خوشه بندی کلاسیک نمونه های ورودی.
در این شکل تابع تعلق مرتبط به خوشهی A را نشان میدهد. تابع تعلق خوشهی B متمم تابع تعلق A میباشد. همانطور که مشاهده میکنید نمونههای ورودی تنها به یکی از خوشه ها تعلق دارند و بهعبارت، دیگر ماتریس U به صورت باینری می باشد. حال اگر از خوشه بندی فازی استفاده گردد، همانطور که در شکل ۲-۸ مشاهده میکنید، تابع تعلق هموارتر است و مرز بین خوشه ها به طور قطع و یقین مشخص نشده است. بهعنوان مثال، نمونه ای که با فلش مشخص شده است با درجه تعلق ۰٫۲ به خوشهی A و با درجه تعلق ۰٫۸ به خوشهی B نسبت داده شده است.
شکل ۲-۸ خوشه بندی فازی نمونه ها.
در جدول ۲-۱ نقاط ضعف و قوت الگوریتم c میانگین فازی نشان داده شده است.
جدول۲‑۲ معایب و محاسن الگوریتم c میانگین فازی.
نقاط قوت الگوریتم c میانگین فازی | نقاط ضعف الگوریتم c میانگین فازی |
همگرایی همیشگی پاسخ | زمان محاسبات زیاد |
بدون ناظر | وابسته به مقادیر اولیه |
همگرا به کمینه های محلی | |
فرم در حال بارگذاری ...
[شنبه 1400-08-01] [ 10:32:00 ب.ظ ]
|