دانلود مقالات و پایان نامه ها درباره بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه ... |
۳-۳-۲- دادهکاوی برپایهی عامل
آقای وولدریج[۳۷]، عاملها را به عنوان نوعی نرمافزار کامپیوتری معرفی کرده است، که میتوانند به صورت خودمختار به فعالیت بپردازند و اهداف مدنظر را تأمین کنند.[۲۶] عاملهای هوشمند، عاملهایی پیشرفته هستند که میتوانند به تغییرات محیط واکنش نشان دهند، در تعامل با دیگر عاملها باشند، و از محاسبات هوشمند برای رسیدن به اهدافشان بهره ببرند.[۹۳] عاملها، فعال، وظیفه محور، طراحی شده برای کارهای خاص، قادر به تصمیمگیری، و خودمختار هستند.
در برخی سیستمها، به منظور رفع یک مشکل، از ترکیب چند عامل استفاده میشود، به این سیستمها، سیستمهای چند عامله میگویند. این سیستمها، از عاملهایی تشکیل شدهاند که هرکدام، مشکلاتی سادهتر از مشکل اصلی را حل میکنند. آنها میتوانند با یکدیگر در ارتباط باشند و به هم کمک کنند تا به اهداف بزرگتر و پیچیدهتری دست یابند.
تکنولوژی چند عامله، در حوزهی تعاملات کاربر، محاسبات خودمختار، قابلیت سازماندهی خود، همکاری، مشارکت، ارتباطات، مذاکرات، محاسبات فرد به فرد، محاسبات موبایل، و هوشمندی جمعی خوب عمل میکند. اینها نقاط قوت اصلی این تکنولوژی هستند و میتوانند فرایند دادهکاوی را به میزان قابل توجهی بهبود بخشند و مشکلات خاص و پیچیدهی دادهکاوی را در حوزههایی مانند پردازش داده، پردازش اطلاعات، کاوش الگو، مدلسازی و تعاملات کاربر، زیرساخت و سرویسها برطرف کنند. یکی از موارد اصلی، دادهکاوی بر پایهی عامل است.
منظور از دادهکاوی بر پایهی عامل، نسخههایی از سیستمهای چند عامله است که برای بهبود فرایند داده کاوی ایجاد شدهاند. توسعهی سیستمهای چند عامله میتواند به حل مسائل داده کاوی کمک کند. به عنوان مثال، معماری و زیرساخت دادهکاوی بر پایهی عامل، کاوش تعاملی بر پایهی عامل، تعامل کاربر بر پایهی عامل، کاوش الگوی اتوماتیک، کاوش داده توزیع شده بر پایهی عامل، کاوش پویا بر پایهی عامل، کاوش چندین منبع داده بر پایهی عامل، کاوش داده فرد به فرد بر پایهی عامل، و کاوش وب بر پایهی عامل. در ادامه، نقشهای عاملها در حمایت از دادهکاوی توزیع شده شرح داده خواهد شد.
در برنامههای سازمانی، دادهها در منابع ناهمگن توزیع شدهاند. منابع داده توزیع شده مرتبط با یک کسب و کار اغلب پیچیده هستند. به عنوان نمونه، برخی از منابع داده از چگالی و فرکانس بالایی برخوردارند، و شامل دادههای پویا و ایستا، و ساختارهای دادهای چندگانه هستند. در برخی از موارد، چند منبع داده در سیستمهای ذخیرهسازی موازی نگهداری میشوند. منابع داده محلی ممکن است بخاطر ارزش تجاری، پوشیدگی، و غیره مشکل محدودیت دسترسی داشته باشند که این مورد سبب میشود حتی در وضعیت مشارکتی، از پردازشهای متمرکز جلوگیری شود. برای این قبیل داده، ادغام و یکپارچهسازی داده، کاری مشکل است. نمیتوان آنها را در یک مخزن مرکزی ذخیره کرد و پردازشهای را بصورت متمرکز بر روی دادهها اعمال نمود. به منظور کاوش داده، با توجه به ضعف موجود در معماری و زیرساخت سیستمهای دادهکاوی توزیع شده موجود، نیاز به پشتیبانی انعطافپذیر، هوشمندانه، و مقیاس پذیر وجود دارد.
تکنولوژی عامل میتواند با قابلیتهای خودمختاری، تعامل، انتخاب پویا، مقیاسپذیری، قابلیت داشتن چند استراتژی و مشارکت، در رفع این چالشها کمک کند. دلائل دیگر، شامل پوشیدگی، جابجایی، محدودیت زمان (جریان داده، زمان بر بودن فرایند استخراج و کاوش بر روی آن)، و هزینههای محاسباتی و نیازهای کارایی میشوند. درواقع تکنولوژی چند عامله، از خیلی جهات مکمل دادهکاوی توزیع شده است، به عنوان مثال:
منابع داده چندگانه و توزیع شده، اغلب بصورت جدا از هم هستند. برای درک بهتر یک مشکل کسب و کار، لازم است دادههای مرتبط از طریق یکپارچهسازی مرکزی یا ارتباطات محلی در کنار هم قرار گیرند. با توجه به این، مشارکت و برنامهریزی عامل، عاملهای موبایل، ارتباطات و مذاکرات عاملها میتوانند مفید باشند.
جابجایی داده و دستگاه، نیازمند درک و استفاده از الگوریتمهای دادهکاوی بر مبنای قابلیت تحرک است. عاملهای موبایل بخوبی میتوانند با خصیصه جابجایی سازگار شوند.
عاملی برای محدود کردن میزان نظارت و دخالت کاربر در اجرای فرایند دادهکاوی لازم است.
در محیط توزیع شده باز و متغیر، میتوان از عاملهای کشف دانش برای انتخاب منابع داده برحسب معیارهای داده شده به آنها استفاده کرد، به عنوان مثال معیارهایی مانند مقدار، نوع، و کیفیت مدنظر از یک منبع خاص، شبکه واقعی و بار شدن سرور کشف دانش. به عنوان نمونه میتوان از عاملها برای انجام پروسهی گرداوری داده استفاده کرد.
برخی از دادههای توزیع شده در منابع ذخیرهسازی مختلف، وابسته به زمان هستند.
برای برخی از برنامههای پیچیده، ترکیبی مناسب از چندین تکنیک دادهکاوی بهتر از یک تکنیک خاص عمل میکند. عاملهای کشف دانش، میتوانند بر اساس نوع داده سایتهای مختلف و اعمال کاوشی که باید صورت گیرد، تصمیم بگیرند.
عاملها میتوانند بطور مستقل بر روی دادههای سایتهای مختلف، اعمال کاوش را انجام دهند و در نهایت مدلهای حاصله را با هم ترکیب کنند. همچنین میتوانند دانشی که استخراج کردهاند را به اشتراک بگذارند تا از قابلیتهای سایر عاملها بهرهمند شوند.
دادههای محلی توزیع شده، براساس مسائل پوشیدگی دادهها، اجازه ندارند استخراج و با سایر منابع بطور مستقیم، یکپارچه شوند. یک عامل که مجوز دسترسی و پردازش دادهها را دارد، میتواند الگوهای محلی شناسایی شده را برای ترکیب با یافتههای سایر منابع به کار بندد.
در برخی از سازمانها، منطق کسب و کار، فرایندها، و گردش کاری، ترتیب منابع داده و دسترسی به آنها را تعیین میکنند. بنابراین پیچیدگی دادهکاوی توزیع شده را افزایش میدهند. عاملهایی که در هریک از منابع قرار گرفتهاند میتوانند با یکدیگر ارتباط برقرار کنند.
در واقع دادهکاوی توزیع شده بر پایهی عاملها، رویکردی منحصربفرد برای بکارگیری قابلیتها، ارائه دادن، و انجام برخی مسئولیتهاست که عبارتند از:
هوشمندی داده از قبیل دسترسی به داده توزیع شده و مشارکت و همکاری بر پایه عامل
هوشمندی بشر از طریق تعامل کاربر-عامل، مدلسازی کاربر و سرویس دهی به وی
فاکتورهای سازمانی و دامنه مانند هوشمندی گروه برپایهی سیستمهای چند عامله، هوشمندی جمعی، و ظهور هوشمندی
هوشمندی شبکه از طریق عاملهای موبایل، مشارکت و ارتباطات بر پایهی سیستمهای چند عامله، و
هوشمندی اجتماعی از قبیل شناخت و تعاملات اجتماعی بر مبنای سیستمهای چند عامله تا بتوان گروهی از افراد خبره را در فرایند کاوش درگیر کرد.
۳-۳-۳- مزیت بهرهگیری از عاملها در دادهکاوی
تکنولوژی دادهکاوی زمانی که وارد دنیای واقعی حل مشکل، بطور خاصتر در حوزه مدیریت دادهها و برنامههای پیچیده شود، با چالشها و مشکلات بسیاری روبرو خواهد شد. در اینجا، برخی از موارد که از طریق تکنولوژی عامل قابل حل میباشند، مورد بررسی قرار میگیرد. این موارد شامل زیرساخت دادهکاوی سازمانی، بکارگیری هوشمندی انسان و دامنه، پشتیبانی از کاوش توزیع شده و موازی، آمادهسازی و اصلاح داده، یادگیری سازگار، و کاوش تعاملی.
۳-۳-۳-۱- زیرساخت دادهکاوی سازمانی
توسعه سیستمهای دادهکاوی که از برنامههای کاربردی سازمان پشتیبانی کنند، بسیار چالش برانگیز است. چالشهای این حوزه ممکن است از خیلی جهات بروز کنند، به عنوان نمونه، یکپارچهسازی یا کاوش منابع داده چندگانه، دسترسی به برنامههای توزیع شده، ارتباط متقابل با کاربران متنوع کسب و کار، و ارتباطات با برنامههای کاربردی چندگانه. علی الخصوص، ساخت یک پلت فرم توزیع شده، انعطافپذیر، سازگار، و کارا که از کاوش تعاملی پشتیبانی کند چالش بزرگی محسوب میشود.
۳-۳-۳-۲- بکارگیری هوشمندی انسان و دامنه
چالش بزرگ دیگری که تکنیکها و متدولوژیهای دادهکاوی موجود با آن روبرو هستند، نقشها و بکارگیری هوشمندی انسان و هوشمندی دامنه در دادهکاوی است. علیرغم مزایای بسیار هوشمندی دامنه، چگونگی بکارگیری، بیان کردن، تائید کردن و اتصال به کامپوننتهایی همچون دانش دامنه، دانش پیشین، فرایند کسب و کار، و منطق کسب و کار در سیستمهای دادهکاوی، یک مشکل تحقیقاتی است. در ارتباط با هوشمندی انسان، تشخیص نقش انسانها در برنامههای خاص مورد نیاز است، تا بتوان یک سیستم پشتیبانی برای مدلسازی رفتار انسان تهیه نمود. این سیستم به عنوان پلی برای ایجاد ارتباطات بین سیستمهای دادهکاوی و انسانها عمل کرده و مزیت دانش انسانی و نظارت وی بر سیستم را به ارمغان میآورد.
۳-۳-۳-۳- پشتیبانی از کاوش توزیع شده و موازی
یکی از موضوعات پژوهشی دادهکاوی که تلاش بسیاری در آن صورت میگیرد، افزایش کارایی الگوریتمهای دادهکاوی است. معمولا از طریق طراحی ساختار دادهها و متدهای محاسباتی کارامد به منظور کاهش پیچیدگی محاسباتی به آن پرداخته میشود. در بسیاری از حالات، کارایی محاسباتی میتواند از طریق توسعهی الگوریتمهای موازی، رشد و پیشرفت خوبی داشته باشد. در سایر حالات، از قبیل سروکار داشتن با منابع داده و برنامههای توزیع شده، و یا محاسبات فرد به فرد، محاسبات توزیع شده نیاز است. به هر حال، چگونگی طراحی الگوریتمهای کارامد و موثر توزیع شده و موازی یک موضوع مهم محسوب میشود.
۳-۳-۳-۴- پیش پردازش داده
در دنیای واقعی، دادهها روز به روز پیچیدهتر میشوند، علی الخصوص دادههای پراکنده و ناهمگن که در مکانهای مختلف توزیع شدهاند. برای دسترسی و ترکیب اینگونه دادهها نیاز به تکنیکها و متدهای هوشمند است. از طرفی دیگر، تحقیقات کنونی بر روی آمادهسازی داده با چالشهای جدیدی همچون پردازش جریان دادههای وابسته به زمان با فرکانس بالا، توزیع داده غیرمتوازن، استخراج شواهد پراکنده، اما مهم از مجموعه دادههای پراکنده، ارتباط منابع داده مختلف، و دسترسی به دادههای پویا روبرو است. همچین شرایطی، نیازمند تکنیکهای جدید آمادهسازی داده است.
۳-۳-۳-۵- یادگیری سازگار
بطور کلی، الگوریتمهای دادهکاوی اینگونه تعریف شدهاند که مجموعههای داده را اسکن کنند. در شرایط دنیای واقعی، از مدلها و الگوریتمهای دادهکاوی انتظار میرود بتوانند براساس قابلیتهای خود یادگیری و خود سازماندهی، با شرایط پویا در داده متغیر سازگار شوند. به عبارت دیگر، مدلها و الگوریتمها، میتوانند بطور اتوماتیک، الگوهایی را از داده متغیر استخراج کنند. در هر صورت، این حوزهای چالش برانگیز است، چراکه متدولوژیها و تکنیکهای موجود دادهکاوی اتوماتیک و سازگارپذیر نیستند. به منظور اصلاح قابلیت اتوماتیک و سازگارپذیری الگوریتمها و متدهای دادهکاوی، نیاز به پشتیبانی از دانش و تخصصهایی میباشد که مرتبط با تکنیکهای هوشمند سازگاری و اتوماتیک هستند.
۳-۳-۳-۶- کاوش تعاملی
بحثهای مرتبط با دادهکاوی تعاملی یا اتوماتیک در گذشته شروع شده است. یک مسئله واضح برای این مشکل این است که ارتباطات متقابل بین انسانها و سیستمهای دادهکاوی، نقش مهم و عینی در دادهکاوی برپایهی دامنه دارد. در توسعهی دادهکاوی تعاملی، یک محقق باید در مورد مباحثی چون مدلسازی کاربر، شبیهسازی رفتار، تجزیه و تحلیل شرایط، طراحی واسط کاربر، مدیریت دانش کاربر، تنظیمات ورودی مدل، یا الگوریتم توسط کاربران، نظارت و کنترل بر فرایند کاوش، و پالایش و تصحیح خروجی، به مطالعه بپردازد. بسیاری از این موارد نمیتوانند توسط رویکردهای موجود دادهکاوی انجام شوند.
۳-۳-۴- دادهکاوی توزیع شده برپایهی عاملها
این بخش بطور خاص بر روی حوزهی پیشرفته و به روز کشف دانش بر پایهی عاملها به بحث میپردازد. همانطور که در بخشهای قبل گفته شد، کشف دانش بر پایهی عاملها، حوزهی بزرگی برای کاوش عامل را شکل میدهد. در واقع حوزهای است که در کاوش عامل بیش از همه به آن پرداخته شده است.
۳-۳-۴-۱- چالشهای دادهکاوی توزیع شده
دادهکاوی و یادگیری ماشین، در حال حاضر، حوزهای را در هوش مصنوعی شکل دادهاند که توسط رویکردها، الگوریتمها، و ابزارهای نرمافزاری متعددی پشتیبانی میشوند. برنامههای کاربردی و تکنولوژیهای اطلاعاتی جدید الهام بخش نیازمندیهای مدرن در دادهکاوی و یادگیری ماشین بوده است و ویژگیهای خاص منابع داده بطور فزایندهای کار را مشکل کرده، و نیازمندیهایی را آشکار میکنند که عبارتند از:
در برنامههای سازمانی، دادهها در منابع ناهمگن توزیع شدهاند و بصورات آزاد و رها یا محکم و سخت به هم متصل شدهاند.
منابع داده توزیع شده مرتبط با یک کسب و کار اغلب پیچیدهاند، به عنوان مثال، برخی چگالی و فرکانس بالایی دارند، و ترکیبی از دادههای پویا و استاتیک و ساختارهای دادهای متنوع هستند.
ادغام و یکپارچهسازی داده کار مشکلی است. نمیتوان آنها را در یک مخزن مرکزی ذخیره کرد، و پردازش بر روی آنها بصورت متمرکز کار آسانی نیست.
در برخی از حالات، چندین منبع داده در سیستمهای ذخیرهسازی موازی ذخیره شدهاند.
منابع داده محلی، ممکن است بخاطر مسائل پوشیدگی، ارزش تجاری، و غیره از نظر میزان دسترسی در محدودیت باشند. که این سبب میشود در بسیاری از حالات امکان پردازش بصورت متمرکز حتی در حالت همکاری و مشارکت وجود نداشته باشد.
در بسیاری از حالات، دادههای توزیع شده در سیستمهای ذخیرهسازی عمومی وابسته به زمان هستند.
دسترسی به منابع داده در یک محیط موبایلی به زمان وابسته است.
ضعف در معماری و زیرساخت سیستمهای دادهکاوی موجود نیازمند پشتیبانی انعطافپذیر، هوشمند، و مقیاسپذیر است.
این موارد و موارد دیگر، نیاز به توسعهی رویکردها و تکنولوژیهای جدید دادهکاوی برای شناسایی الگوها در دادههای توزیع شده را ایجاد میکند. دادهکاوی توزیع شده، و بطور خاصتر دادهکاوی فرد به فرد، و تکنولوژی چند عامله، دو پاسخ به چالشهای ذکر شده است. اگر از تکنولوژی چندعامله در سیستم داده کاوی توزیع شده بهره گرفته شود، نه تنها مشکلات مطرح شده به میزان قابل توجهی کاهش مییابد، مزایای بسیاری نیز به ارمغان میآورد [۹۴, ۹۵]. برخی از این مزایا عبارتند از:
کنترل غیر متمرکز
فرم در حال بارگذاری ...
[یکشنبه 1400-08-02] [ 09:43:00 ق.ظ ]
|