دانلود مقالات و پایان نامه ها درباره بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه ...

۳-۳-۲- داده‌کاوی برپایه‌ی عامل
آقای وولدریج^[۳۷]، عامل‌ها را به عنوان نوعی نرم‌افزار کامپیوتری معرفی کرده است، که می‌توانند به صورت خودمختار به فعالیت بپردازند و اهداف مدنظر را تأمین کنند.[۲۶] عامل‌های هوشمند، عامل‌هایی پیشرفته هستند که می‌توانند به تغییرات محیط واکنش نشان دهند، در تعامل با دیگر عامل‌ها باشند، و از محاسبات هوشمند برای رسیدن به اهدافشان بهره ببرند.[۹۳] عامل‌ها، فعال، وظیفه محور، طراحی شده برای کارهای خاص، قادر به تصمیم‌گیری، و خودمختار هستند.

در برخی سیستم‌ها، به منظور رفع یک مشکل، از ترکیب چند عامل استفاده می‌شود، به این سیستم‌ها، سیستم‌های چند عامله می‌گویند. این سیستم‌ها، از عامل‌هایی تشکیل شده‌اند که هرکدام، مشکلاتی ساده‌تر از مشکل اصلی را حل می‌کنند. آن‌ها می‌توانند با یکدیگر در ارتباط باشند و به هم کمک کنند تا به اهداف بزرگ‌تر و پیچیده‌تری دست یابند.
تکنولوژی چند عامله، در حوزه‌ی تعاملات کاربر، محاسبات خودمختار، قابلیت سازمان‌دهی خود، همکاری، مشارکت، ارتباطات، مذاکرات، محاسبات فرد به فرد، محاسبات موبایل، و هوشمندی جمعی خوب عمل می‌کند. این‌ها نقاط قوت اصلی این تکنولوژی هستند و می‌توانند فرایند داده‌کاوی را به میزان قابل توجهی بهبود بخشند و مشکلات خاص و پیچیده‌ی داده‌کاوی را در حوزه‌هایی مانند پردازش داده، پردازش اطلاعات، کاوش الگو، مدلسازی و تعاملات کاربر، زیرساخت و سرویس‌ها برطرف کنند. یکی از موارد اصلی، داده‌کاوی بر پایه‌ی عامل است.
منظور از داده‌کاوی بر پایه‌ی عامل، نسخه‌هایی از سیستم‌های چند عامله است که برای بهبود فرایند داده کاوی ایجاد شده‌اند. توسعه‌ی سیستم‌های چند عامله می‌تواند به حل مسائل داده کاوی کمک کند. به عنوان مثال، معماری و زیرساخت داده‌کاوی بر پایه‌ی عامل، کاوش تعاملی بر پایه‌ی عامل، تعامل کاربر بر پایه‌ی عامل، کاوش الگوی اتوماتیک، کاوش داده توزیع شده بر پایه‌ی عامل، کاوش پویا بر پایه‌ی عامل، کاوش چندین منبع داده بر پایه‌ی عامل، کاوش داده فرد به فرد بر پایه‌ی عامل، و کاوش وب بر پایه‌ی عامل. در ادامه، نقش‌های عامل‌ها در حمایت از داده‌کاوی توزیع شده شرح داده خواهد شد.
در برنامه‌های سازمانی، داده‌ها در منابع ناهمگن توزیع شده‌اند. منابع داده توزیع شده مرتبط با یک کسب و کار اغلب پیچیده هستند. به عنوان نمونه، برخی از منابع داده از چگالی و فرکانس بالایی برخوردارند، و شامل داده‌های پویا و ایستا، و ساختارهای داده‌ای چندگانه هستند. در برخی از موارد، چند منبع داده در سیستم‌های ذخیره‌سازی موازی نگهداری می‌شوند. منابع داده محلی ممکن است بخاطر ارزش تجاری، پوشیدگی، و غیره مشکل محدودیت دسترسی داشته باشند که این مورد سبب می‌شود حتی در وضعیت مشارکتی، از پردازش‌های متمرکز جلوگیری شود. برای این قبیل داده، ادغام و یکپارچه‌سازی داده، کاری مشکل است. نمی‌توان آن‌ها را در یک مخزن مرکزی ذخیره کرد و پردازش‌های را بصورت متمرکز بر روی داده‌ها اعمال نمود. به منظور کاوش داده، با توجه به ضعف موجود در معماری و زیرساخت سیستم‌های داده‌کاوی توزیع شده موجود، نیاز به پشتیبانی انعطاف‌پذیر، هوشمندانه، و مقیاس پذیر وجود دارد.
تکنولوژی عامل می‌تواند با قابلیت‌های خودمختاری، تعامل، انتخاب پویا، مقیاس‌پذیری، قابلیت داشتن چند استراتژی و مشارکت، در رفع این چالش‌ها کمک کند. دلائل دیگر، شامل پوشیدگی، جابجایی، محدودیت زمان (جریان داده، زمان بر بودن فرایند استخراج و کاوش بر روی آن)، و هزینه‌های محاسباتی و نیازهای کارایی می‌شوند. درواقع تکنولوژی چند عامله، از خیلی جهات مکمل داده‌کاوی توزیع شده است، به عنوان مثال:
منابع داده چندگانه و توزیع شده، اغلب بصورت جدا از هم هستند. برای درک بهتر یک مشکل کسب و کار، لازم است داده‌های مرتبط از طریق یکپارچه‌سازی مرکزی یا ارتباطات محلی در کنار هم قرار گیرند. با توجه به این، مشارکت و برنامه‌ریزی عامل، عامل‌های موبایل، ارتباطات و مذاکرات عامل‌ها می‌توانند مفید باشند.
جابجایی داده و دستگاه، نیازمند درک و استفاده از الگوریتم‌های داده‌کاوی بر مبنای قابلیت تحرک است. عامل‌های موبایل بخوبی می‌توانند با خصیصه جابجایی سازگار شوند.
عاملی برای محدود کردن میزان نظارت و دخالت کاربر در اجرای فرایند داده‌کاوی لازم است.
در محیط توزیع شده باز و متغیر، می‌توان از عامل‌های کشف دانش برای انتخاب منابع داده برحسب معیارهای داده شده به آن‌ها استفاده کرد، به عنوان مثال معیارهایی مانند مقدار، نوع، و کیفیت مدنظر از یک منبع خاص، شبکه واقعی و بار شدن سرور کشف دانش. به عنوان نمونه می‌توان از عامل‌ها برای انجام پروسه‌ی گرداوری داده استفاده کرد.
برخی از داده‌های توزیع شده در منابع ذخیره‌سازی مختلف، وابسته به زمان هستند.
برای برخی از برنامه‌های پیچیده، ترکیبی مناسب از چندین تکنیک داده‌کاوی بهتر از یک تکنیک خاص عمل می‌کند. عامل‌های کشف دانش، می‌توانند بر اساس نوع داده سایت‌های مختلف و اعمال کاوشی که باید صورت گیرد، تصمیم بگیرند.
عامل‌ها می‌توانند بطور مستقل بر روی داده‌های سایت‌های مختلف، اعمال کاوش را انجام دهند و در نهایت مدل‌های حاصله را با هم ترکیب کنند. همچنین می‌توانند دانشی که استخراج کرده‌اند را به اشتراک بگذارند تا از قابلیت‌های سایر عامل‌ها بهره‌مند شوند.
داده‌های محلی توزیع شده، براساس مسائل پوشیدگی داده‌ها، اجازه ندارند استخراج و با سایر منابع بطور مستقیم، یکپارچه شوند. یک عامل که مجوز دسترسی و پردازش داده‌ها را دارد، می‌تواند الگوهای محلی شناسایی شده را برای ترکیب با یافته‌های سایر منابع به کار بندد.
در برخی از سازمان‌ها، منطق کسب و کار، فرایندها، و گردش کاری، ترتیب منابع داده و دسترسی به آن‌ها را تعیین می‌کنند. بنابراین پیچیدگی داده‌کاوی توزیع شده را افزایش می‌دهند. عامل‌هایی که در هریک از منابع قرار گرفته‌اند می‌توانند با یکدیگر ارتباط برقرار کنند.
در واقع داده‌کاوی توزیع شده بر پایه‌ی عامل‌ها، رویکردی منحصربفرد برای بکارگیری قابلیت‌ها، ارائه دادن، و انجام برخی مسئولیت‌هاست که عبارتند از:
هوشمندی داده از قبیل دسترسی به داده توزیع شده و مشارکت و همکاری بر پایه عامل
هوشمندی بشر از طریق تعامل کاربر-عامل، مدلسازی کاربر و سرویس دهی به وی
فاکتورهای سازمانی و دامنه مانند هوشمندی گروه برپایه‌ی سیستم‌های چند عامله، هوشمندی جمعی، و ظهور هوشمندی
هوشمندی شبکه از طریق عامل‌های موبایل، مشارکت و ارتباطات بر پایه‌ی سیستم‌های چند عامله، و
هوشمندی اجتماعی از قبیل شناخت و تعاملات اجتماعی بر مبنای سیستم‌های چند عامله تا بتوان گروهی از افراد خبره را در فرایند کاوش درگیر کرد.
۳-۳-۳- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی
تکنولوژی داده‌کاوی زمانی که وارد دنیای واقعی حل مشکل، بطور خاص‌تر در حوزه مدیریت داده‌ها و برنامه‌های پیچیده شود، با چالش‌ها و مشکلات بسیاری روبرو خواهد شد. در اینجا، برخی از موارد که از طریق تکنولوژی عامل قابل حل می‌باشند، مورد بررسی قرار می‌گیرد. این موارد شامل زیرساخت داده‌کاوی سازمانی، بکارگیری هوشمندی انسان و دامنه، پشتیبانی از کاوش توزیع شده و موازی، آماده‌سازی و اصلاح داده، یادگیری سازگار، و کاوش تعاملی.
۳-۳-۳-۱- زیرساخت داده‌کاوی سازمانی
توسعه سیستم‌های داده‌کاوی که از برنامه‌های کاربردی سازمان پشتیبانی کنند، بسیار چالش برانگیز است. چالش‌های این حوزه ممکن است از خیلی جهات بروز کنند، به عنوان نمونه، یکپارچه‌سازی یا کاوش منابع داده چندگانه، دسترسی به برنامه‌های توزیع شده، ارتباط متقابل با کاربران متنوع کسب و کار، و ارتباطات با برنامه‌های کاربردی چندگانه. علی الخصوص، ساخت یک پلت فرم توزیع شده، انعطاف‌پذیر، سازگار، و کارا که از کاوش تعاملی پشتیبانی کند چالش بزرگی محسوب می‌شود.
۳-۳-۳-۲- بکارگیری هوشمندی انسان و دامنه
چالش بزرگ دیگری که تکنیک‌ها و متدولوژی‌های داده‌کاوی موجود با آن روبرو هستند، نقش‌ها و بکارگیری هوشمندی انسان و هوشمندی دامنه در داده‌کاوی است. علی‌رغم مزایای بسیار هوشمندی دامنه، چگونگی بکارگیری، بیان کردن، تائید کردن و اتصال به کامپوننت‌هایی همچون دانش دامنه، دانش پیشین، فرایند کسب و کار، و منطق کسب و کار در سیستم‌های داده‌کاوی، یک مشکل تحقیقاتی است. در ارتباط با هوشمندی انسان، تشخیص نقش انسان‌ها در برنامه‌های خاص مورد نیاز است، تا بتوان یک سیستم پشتیبانی برای مدلسازی رفتار انسان تهیه نمود. این سیستم به عنوان پلی برای ایجاد ارتباطات بین سیستم‌های داده‌کاوی و انسان‌ها عمل کرده و مزیت دانش انسانی و نظارت وی بر سیستم را به ارمغان می‌آورد.
۳-۳-۳-۳- پشتیبانی از کاوش توزیع شده و موازی
یکی از موضوعات پژوهشی داده‌کاوی که تلاش بسیاری در آن صورت می‌گیرد، افزایش کارایی الگوریتم‌های داده‌کاوی است. معمولا از طریق طراحی ساختار داده‌ها و متدهای محاسباتی کارامد به منظور کاهش پیچیدگی محاسباتی به آن پرداخته می‌شود. در بسیاری از حالات، کارایی محاسباتی می‌تواند از طریق توسعه‌ی الگوریتم‌های موازی، رشد و پیشرفت خوبی داشته باشد. در سایر حالات، از قبیل سروکار داشتن با منابع داده و برنامه‌های توزیع شده، و یا محاسبات فرد به فرد، محاسبات توزیع شده نیاز است. به هر حال، چگونگی طراحی الگوریتم‌های کارامد و موثر توزیع شده و موازی یک موضوع مهم محسوب می‌شود.
۳-۳-۳-۴- پیش پردازش داده
در دنیای واقعی، داده‌ها روز به روز پیچیده‌تر می‌شوند، علی الخصوص داده‌های پراکنده و ناهمگن که در مکان‌های مختلف توزیع شده‌اند. برای دسترسی و ترکیب اینگونه داده‌ها نیاز به تکنیک‌ها و متدهای هوشمند است. از طرفی دیگر، تحقیقات کنونی بر روی آماده‌سازی داده با چالش‌های جدیدی همچون پردازش جریان داده‌های وابسته به زمان با فرکانس بالا، توزیع داده غیرمتوازن، استخراج شواهد پراکنده، اما مهم از مجموعه داده‌های پراکنده، ارتباط منابع داده مختلف، و دسترسی به داده‌های پویا روبرو است. همچین شرایطی، نیازمند تکنیک‌های جدید آماده‌سازی داده است.
۳-۳-۳-۵- یادگیری سازگار
بطور کلی، الگوریتم‌های داده‌کاوی اینگونه تعریف شده‌اند که مجموعه‌های داده را اسکن کنند. در شرایط دنیای واقعی، از مدل‌ها و الگوریتم‌های داده‌کاوی انتظار می‌رود بتوانند براساس قابلیت‌های خود یادگیری و خود سازماندهی، با شرایط پویا در داده متغیر سازگار شوند. به عبارت دیگر، مدل‌ها و الگوریتم‌ها، می‌توانند بطور اتوماتیک، الگوهایی را از داده متغیر استخراج کنند. در هر صورت، این حوزه‌ای چالش برانگیز است، چراکه متدولوژی‌ها و تکنیک‌های موجود داده‌کاوی اتوماتیک و سازگارپذیر نیستند. به منظور اصلاح قابلیت اتوماتیک و سازگارپذیری الگوریتم‌ها و متدهای داده‌کاوی، نیاز به پشتیبانی از دانش و تخصص‌هایی می‌باشد که مرتبط با تکنیک‌های هوشمند سازگاری و اتوماتیک هستند.
۳-۳-۳-۶- کاوش تعاملی
بحث‌های مرتبط با داده‌کاوی تعاملی یا اتوماتیک در گذشته شروع شده است. یک مسئله واضح برای این مشکل این است که ارتباطات متقابل بین انسان‌ها و سیستم‌های داده‌کاوی، نقش مهم و عینی در داده‌کاوی برپایه‌ی دامنه دارد. در توسعه‌ی داده‌کاوی تعاملی، یک محقق باید در مورد مباحثی چون مدلسازی کاربر، شبیه‌سازی رفتار، تجزیه و تحلیل شرایط، طراحی واسط کاربر، مدیریت دانش کاربر، تنظیمات ورودی مدل، یا الگوریتم توسط کاربران، نظارت و کنترل بر فرایند کاوش، و پالایش و تصحیح خروجی، به مطالعه بپردازد. بسیاری از این موارد نمی‌توانند توسط رویکردهای موجود داده‌کاوی انجام شوند.
۳-۳-۴- داده‌کاوی توزیع شده برپایه‌ی عامل‌ها
این بخش بطور خاص بر روی حوزه‌ی پیشرفته و به روز کشف دانش بر پایه‌ی عامل‌ها به بحث می‌پردازد. همانطور که در بخش‌های قبل گفته شد، کشف دانش بر پایه‌ی عامل‌ها، حوزه‌ی بزرگی برای کاوش عامل را شکل می‌دهد. در واقع حوزه‌ای است که در کاوش عامل بیش از همه به آن پرداخته شده است.
۳-۳-۴-۱- چالش‌های داده‌کاوی توزیع شده
داده‌کاوی و یادگیری ماشین، در حال حاضر، حوزه‌ای را در هوش مصنوعی شکل داده‌اند که توسط رویکردها، الگوریتم‌ها، و ابزارهای نرم‌افزاری متعددی پشتیبانی می‌شوند. برنامه‌های کاربردی و تکنولوژی‌های اطلاعاتی جدید الهام بخش نیازمندی‌های مدرن در داده‌کاوی و یادگیری ماشین بوده است و ویژگی‌های خاص منابع داده بطور فزاینده‌ای کار را مشکل کرده، و نیازمندی‌هایی را آشکار می‌کنند که عبارتند از:
در برنامه‌های سازمانی، داده‌ها در منابع ناهمگن توزیع شده‌اند و بصورات آزاد و رها یا محکم و سخت به هم متصل شده‌اند.
منابع داده توزیع شده مرتبط با یک کسب و کار اغلب پیچیده‌اند، به عنوان مثال، برخی چگالی و فرکانس بالایی دارند، و ترکیبی از داده‌های پویا و استاتیک و ساختارهای داده‌ای متنوع هستند.
ادغام و یکپارچه‌سازی داده کار مشکلی است. نمی‌توان آن‌ها را در یک مخزن مرکزی ذخیره کرد، و پردازش بر روی آن‌ها بصورت متمرکز کار آسانی نیست.
در برخی از حالات، چندین منبع داده در سیستم‌های ذخیره‌سازی موازی ذخیره شده‌اند.
منابع داده محلی، ممکن است بخاطر مسائل پوشیدگی، ارزش تجاری، و غیره از نظر میزان دسترسی در محدودیت باشند. که این سبب می‌شود در بسیاری از حالات امکان پردازش بصورت متمرکز حتی در حالت همکاری و مشارکت وجود نداشته باشد.
در بسیاری از حالات، داده‌های توزیع شده در سیستم‌های ذخیره‌سازی عمومی وابسته به زمان هستند.
دسترسی به منابع داده در یک محیط موبایلی به زمان وابسته است.
ضعف در معماری و زیرساخت سیستم‌های داده‌کاوی موجود نیازمند پشتیبانی انعطاف‌پذیر، هوشمند، و مقیاس‌پذیر است.
این موارد و موارد دیگر، نیاز به توسعه‌ی رویکردها و تکنولوژی‌های جدید داده‌کاوی برای شناسایی الگوها در داده‌های توزیع شده را ایجاد می‌کند. داده‌کاوی توزیع شده، و بطور خاص‌تر داده‌کاوی فرد به فرد، و تکنولوژی چند عامله، دو پاسخ به چالش‌های ذکر شده است. اگر از تکنولوژی چندعامله در سیستم داده کاوی توزیع شده بهره گرفته شود، نه تنها مشکلات مطرح شده به میزان قابل توجهی کاهش می‌یابد، مزایای بسیاری نیز به ارمغان می‌آورد [۹۴, ۹۵]. برخی از این مزایا عبارتند از:
کنترل غیر متمرکز

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب