• فهرست مقالات داده‌کاوی

      • دسترسی آزاد مقاله

        1 - ارائه روشی برای بخش‌بندی مشتریان با استفاده از مدل RFM در شرایط عدم قطعیت
        عظیمه مظفری
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاک چکیده کامل
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاکم بر آن‌ها، از تئوری اعداد خاکستری استفاده شده و با استفاده از یک روش متفاوت به بخش‌بندی مشتریان پرداخته شده است. به این ترتیب مشتریان بانک به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شده اند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شده است. در پایان نیز پیشنهادهایی جهت بهبود سیستم مدیریت ارتباط با مشتری ارائه می‌گردد. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن‌کاوی در حوزه یادگیری الکترونیکی
        سمیه آهاری
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطل چکیده کامل
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن‌کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان می‌دهد و از طرف دیگر اجازه مدیریت ابهام و شک را می‌دهد. علاوه بر آن، متن‌کاوی به عنوان داده‌کاوی متن بیان می‌شود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن می‌پردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج می‌کند. همچنین به عنوان داده‌کاوی متن یا کشف دانش از پایگاه ‌داده‌های متنی شناخته می‌شود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان می‌شود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهش‌های انجام شده در حوزه متن‌کاوی با تأکید بر روش‌ها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهش‌های مرتبط در حوزه آموزش الکترونیکی طبقه‌بندی گردیدند. پس از طبقه‌بندی پژوهش‌ها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متن‌کاوی پرداخته می‌شود. سپس فرایند متن‌کاوی و حوزه‌های کاربرد متن‌کاوی در آموزش الکترونیکی مورد بررسی قرار می‌گیرند. در ادامه روش‌های متن‌کاوی معرفی شده و تک تک این روش‌ها در حوزه آموزش الکترونیکی مطرح می‌گردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهره‌برداری از روش‌های متن‌کاوی در یادگیری الکترونیکی پیشنهاد می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - کشف اسپم در شبکه اجتماعی فیس‌بوک با استفاده از داده‌کاوی
        امین نظری
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای چکیده کامل
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای افراد سودجو فراهم نموده است. در اغلب موارد، کلاهبردارن در تلاشند تا انواع مختلف اسپم را در محیط‌هایی با پتانسیل بالا گسترش دهند. به همین دلیل در شبکه‌های اجتماعی نیازمند یک روش موثر برای تشخیص اسپم به منظور افزایش سطح امنیت اطلاعات هستیم. در این مقاله روش جدیدی برای کشف اسپمرها در شبکه‌ اجتماعی فیس‌بوک ارائه می‌دهیم. نتایج حاصل، دقت 99.96% روش پیشنهادی را نشان می‌دهد. در مقالات پیشین کاربران به دودسته‌ی کاربران عادی و کاربران اسپمر تقسیم می‌شوند. روش دسته‌بندی در این مقالات به‌گونه‌ای است که کاربرانی را که موردحمله اسپمرها قرارگرفته‌اند را نیز به‌عنوان اسپمر شناسایی می‌کنند. بنابراین در این مقاله با دسته‌بندی کاربران به سه دسته‌ی کاربران عادی، اسپمرها و کاربرانی که موردحمله اسپمرها قرارگرفته‌اند، صحت تشخیص الگوریتم را افزایش دادیم. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - بررسی صحت ارزیابی کارشناسان املاک با استفاده از یک مدل مبتنی بر داده‌کاوی (مطالعه موردی بانک ملت)
        فاطمه داور
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر چکیده کامل
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر اساس شاخص‌های قیمت گذاری، اقدام به ارزیابی املاک می‌نمایند. در این تحقیق سعی شده است تا صحت ارزیابی کارشناسان ارزیابی اموال با استفاده از مدل‌های داده‌کاوی بررسی گردد. این اقدام در جهت کمک به مدیران بانک و مسئولان ممیزی گزارشات ارزیابی، انجام گرفته است تا آنها بتوانند در مورد کارشناسان و ارزیابی‌های انجام شده توسط آنها، تصمیمات بهتری اخذ نمایند. با استفاده از شاخص‌های ارزیابی املاک و داده‌کاوی به یک مدل پیش بینی کننده جهت پیش بینی قیمت املاک دست یافته و به منظور رسیدن به یک مدل پیش بینی با عملکرد بالا، از ترکیب الگوریتم های FCM و K-NN بهره گرفته شده است که این اقدام توانست میزان دقت پیش بینی را تا حد زیادی افزایش داده و کارایی مدل پیشنهادی را بالا می برد. میزان دقت[1] در پیش بینی مبالغ ارزیابی، برابر 84.21 % و میزان خطای RMSE در پیش بینی آن برابر 0.43، بدست آمد. رویکرد پیشنهادی بر روی داده‌های ارزیابی املاک بانک ملت آزموده شد. [1] accuracy پرونده مقاله
      • دسترسی آزاد مقاله

        5 - ارائه روشی برای بخش‌بندي مشتريان با استفاده از مدل RFM در شرایط عدم قطعیت
        محمدرضا غلامیان عظیمه مظفری
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پول چکیده کامل
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولي مبادله (M) از پایگاه داده مشتریان استخراج و پیش‌پردازش شدند. با توجه به گستردگی دامنه داده‌های مذکور، برای تعیین وضعیت خوب یا بد بودن مشتری نمی‌توان عدد دقیقی تعیین نمود؛ لذا برای از بین بردن این عدم قطعیت، از تئوری اعداد خاکستری استفاده شد که وضعیت مشتری را به صورت یک بازه در نظر می‌گیرد. به این ترتیب با استفاده از یک روش متفاوت به بخش‌بندی مشتريان بانک پرداخته شد که طبق نتایج، مشتریان به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شدند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شد و در پایان نيز پيشنهادهايي جهت بهبود سيستم مديريت ارتباط با مشتري ارائه گردید. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از داده‌کاوی روی صفحات وب
        مهدیه بهارلو علیرضا یاری
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داد چکیده کامل
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگی‌های برجسته از فیشینگ یکی از پیش‌شرط‌های مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگی‌های نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وب‌سایت‌های فیشینگ آماده گردید. سپس برای افزایش کارایی سامانه‌های تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله‌ مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگی‌ها به‌طور قابل‌توجهی کاهش یابند. پس‌ازآن عملکرد روش‌های درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگی‌های کاهش‌یافته موردبررسی قرار گرفت. نتایج نشان می‌دهند دقت مدل ایجاد شده برای تعیین وب سایت‌های فیشینگ با استفاده از کاهش ویژگی دومرحله‌ای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% می‌باشد که نسبت به سایر روش‌ها نتیجه مطلوبی است. پرونده مقاله
      • دسترسی آزاد مقاله

        7 - طراحی سامانه تصمیم یار با استفاده از ابزار داده کاوی(مطالعه موردی معاونت فرهنگی دانشگاه علم و صنعت)
        روزبه قوسی عماد چیذری هانی وحدانی
        تصمیم‌گیری یکی از وظایف اصلی مدیران تلقی می‌شود؛ درعصر کنونی فرآیند تصمیم‌گیری با پیچیدگی‌ها و ظرافت‌های فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوری‌های روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتج چکیده کامل
        تصمیم‌گیری یکی از وظایف اصلی مدیران تلقی می‌شود؛ درعصر کنونی فرآیند تصمیم‌گیری با پیچیدگی‌ها و ظرافت‌های فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوری‌های روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتجربه مدیریت نیازمند به کارگیری صحیح سامانه‌های اطلاعاتی است؛ سیستم‌ پشتیبان تصمیم یکی از این سامانه‌های می‌باشد که پشتوانه‌ای برای فرآیند تصمیم‌گیری مدیران سازمانی می‌باشد. در این مقاله ابتدا ادبیات مربوط به سیستم پشتیبان تصمیم بررسی شده است؛ سپس داده‌کاوی به عنوان ابزاری برای استخراج دانش و اطلاعات کاربردی از داده‌های خام سازمانی معرفی شده است. این دانش به دست آمده حاوی مفاهیم و اطلاعاتی است که ممکن است پیش از این در سازمان مغفول مانده باشد لذا کمک شایانی به روند تصمیم گیری مدیران خواهد داشت. در نهایت یافته‌های این مطالعه در دانشگاه علم و صنعت به کار گرفته شده است تا راهنما و پشتیبان تصمیمات مدیران دانشگاهی باشد. پرونده مقاله
      • دسترسی آزاد مقاله

        8 - ارزیابی پتانسیل منابع سمت تقاضا در حضور تجهیزات سرمایشی و گرمایشی با استفاده از روش داده-کاوی مبتنی بر الگوریتم طبقه¬بندی k-means
        فاطمه شیبانی مژگان ملاحسنی‌پور هنگامه کشاورز
        در بستر سیستم‌های قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاست‌های تصمیم‌گیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقه‌بندی k-means به ع چکیده کامل
        در بستر سیستم‌های قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاست‌های تصمیم‌گیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقه‌بندی k-means به عنوان یک روش داده‌کاوی، تعیین می‌شود. ابتدا داده‌های انرژی مصرفی در ساعات پیک دوره‌های گرم (بهار و تابستان) و دوره‌های سرد (پاییز و زمستان)، با توجه به تغییرات قیمت و دما، با استفاده از الگوریتم k-means در خوشه‌های مختلفی گروه‌بندی می‌شوند. خوشه‌هایی با امکان حضور وسایل سرمایشی و گرمایشی، انتخاب می‌شوند. سپس نمودار بازه اطمینان داده‌های انرژی مصرفی در خوشه‌های منتخب با توجه به تغییرات قیمت انرژی ترسیم می‌گردد. با توجه به فاصله کمینه و بیشینه در میانگین داده‌های موجود در آستانه بالا و آستانه متوسط نمودار بازه اطمینان، پتانسیل نامی منابع پاسخگویی تقاضا (بار انعطاف‌پذیر) به دست می‌آید. اطلاعات انرژی مصرفی، دما و قیمت انرژی شبکه برق BOSTON در یک افق زمانی شش‌ساله به منظور ارزیابی مدل پیشنهادی استفاده می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        9 - ساخت درخت ‌تصمیم مقیاس‌پذیر مبتنی بر تقسیم سریع داده‌ها و پیش‌هرس
        سميه لطفي محمد قاسم زاده مهران محسن زاده ميترا ميرزارضايي
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. چکیده کامل
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. الگوريتم‌هاي ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتم‌هایی که به علت انتخاب زیرمجموعه‌ای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف‌ می‌کنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاس‌پذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی‌ مجموعه داده‌های حجیم ارائه شده است. الگوریتم ارائه‌شده درخت تصمیم را با استفاده از کل مجموعه داده‌ آموزش اما بدون نیاز به ذخیره‌سازی داده در حافظه اصلی می‌سازد. همچنین جهت کاهش پیچیدگی درخت از روش پیش‌هرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه داده‌های UCI نشان می‌دهد الگوریتم ارائه‌شده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتم‌ها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است. پرونده مقاله
      • دسترسی آزاد مقاله

        10 - ترکیب تکنیک‌های انتخاب نمونه و داده‌افزایي برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن
        پرستو محقق سميرا نوفرستی مهری رجائی
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌ب چکیده کامل
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        11 - ارائه یک سیستم توصیه گر وب برای پیش بینی صفحات مورد علاقه کاربر با استفاده از الگوریتم خوشه بندی DBSCAN و روش SVM یادگیری ماشین
        رضا  مولایی فرد محمد مصلح
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد چکیده کامل
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد کرد که این کار می‌تواند مشکل شروع سرد سیستم را حل و باعث کیفیت بخشیدن به جستجو شود. در این تحقیق به ارائه روش جدیدی به‌منظور بهبود سیستم‌های توصیه گر در زمینه وب پرداخته می‌شود که از الگوریتم خوشه‌بندی DBSCAN جهت خوشه‌بندی داده‌ها استفاده می‌شود که این الگوریتم امتیاز کارایی ۹۹٪ را به دست آورد. سپس با استفاده از الگوریتم Page rank، صفحات موردعلاقه کاربر وزن دهی می‌شوند. سپس با استفاده از روش SVM، داده‌ها را دسته‌بندی و جهت تولید پیش‌بینی به کاربر به یک سیستم توصیه گر ترکیبی داده می‌دهیم که درنهایت این سیستم توصیه گر لیستی از صفحات را در اختیار کاربر قرار خواهد داد که می‌تواند موردعلاقه وی باشند. ارزیابی نتایج حاصل از تحقیق حاکی از آن بود که استفاده از این روش پیشنهادی می‌تواند امتیاز ۹۵% را در قسمت فراخوانی و امتیاز ۹۹% را در قسمت دقت به دست آورد که این نتایج اثبات می‌کند که این سیستم توصیه گر تا بیش از ۹۰٪ می‌تواند صفحات موردنظر کاربر را به‌درستی تشخیص داده و تا حدود زیادی نقاط ضعف سایر سیستم های پیشین را برطرف سازد. پرونده مقاله
      • دسترسی آزاد مقاله

        12 - تشخیص نفوذ و ناهنجاری ها با استفاده از داده کاوی و انتخاب ویژگی ها بوسیله الگوریتم PSO
        فریدون  رضائی محمدعلی افشار کاظمی محمد علی کرامتی
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد چکیده کامل
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد با استفاده از حملات سایبری به سایت‌ها و فروشگاه‌های مجازی نفوذ کرده و در آنها اخلال ایجاد می‌کنند. آشکارسازی حملات و ناهنجاری‌ها یکی از چالش‌های جدید در مسیر پیشبرد تکنولوژی تجارت الکترونیک می‌باشد. تشخیص ناهنجاری‌های یک شبکه و فرآیند شناسایی فعالیت‌های مخرب در کسب و کارهای تجارت الکترونیک با تجزیه و تحلیل رفتار ترافیک شبکه امکان‌پذیر است. سیستم‌های داده‌کاوی بطور گسترده‌ای در سیستمهای تشخیص نفوذ (IDS) برای تشخیص ناهنجاری‌ها استفاده می‌شوند. کاهش ابعاد ویژگی‌ها نقش بسیار مهمی در تشخیص نفوذ ایفا می‌کند، زیرا تشخیص ناهنجاری‌ها از ویژگی‌های ترافیک شبکه با ابعاد بالا فرآیندی زمان‌بری است. انتخاب ویژگی‌های درست و مناسب بر سرعت تجزیه و تحلیل و کار پیشنهادی تاثیر می‌گذارد و می‌تواند سرعت تشخیص را بهبود بخشد. در این مقاله با استفاده از الگوریتم‌های داده‌کاوی مانند بیزین، پرسپترون چندلایه، CFS، Best First، J48 و PSO، میزان دقت تشخیص ناهنجاری‌ها و حملات به 0.996 و میزان خطای آن 0.004 رسانده شده است. پرونده مقاله