• فهرست مقالات Data Mining

      • دسترسی آزاد مقاله

        1 - تکنیک های داده‌کاوی در سهمیه‌بندی مناطق برای کنکور
        نرجس سرعتی آَشتیانی سمیه علیزاده علی  مبصّـری
        تعداد زیادی از فارغ‌التحصیلان دبیرستان‌ها در سیستم آموزشی ایران خواهان ورود به دانشگاه‌ها می‌باشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر می‌باشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمان‌های ذیربط، تخصیص سهمیه چکیده کامل
        تعداد زیادی از فارغ‌التحصیلان دبیرستان‌ها در سیستم آموزشی ایران خواهان ورود به دانشگاه‌ها می‌باشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر می‌باشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمان‌های ذیربط، تخصیص سهمیه را راه‌کاری مناسب برای حل این مسأله می‌دانند و به دنبال استفاده از دانش نهفته در داده‌های موجود در این حوزه هستند. با منطقه‌بندی کلیه بخش‌های کشور، داوطلبان هر منطقه با هم مقایسه می‌شوند و در واقع با این روش از اینکه درصد پذیرفته‌شدگان یک شهر چند برابر شهر دیگری باشد، جلوگیری می‌شود. تعیین میزان سهمیه کنکور برای بخش‌های کشور در سال های اخیر، برمبنای میزان توسعه‌یافتگی مناطق با استفاده از روش تاکسونومی صورت گرفته است که خروجی حاصل از این روش نوعی رتبه‌بندی مناطق می‌باشد که در آن امکان تحلیل گروهی مناطق وجود ندارد، همچنین تعداد مناطق بصورت نظری تعیین می شود. برای رفع این مسائل بخش‌بندی می‌تواند به عنوان یک راهکار مناسب مورد استفاده قرار گیرد. تحقیق حاضر برای اولین بار در حوزه توسعه‌یافتگی، با استفاده از تکنیک‌های داده‌کاوی و روش کریسپ و در قالب متدولوژی پیشنهادی، بر روی داده‌های مرتبط، در وزارت آموزش‌ و پرورش، وزارت کشور، وزارت بهداشت و درمان، مرکز آمار و سازمان سنجش، صورت گرفته است. پس از شناسایی استانداردها و شاخص‌های اثرگذار در این زمینه، آماده‌سازی داده‌ها انجام شده و به ساخت انباره‌داده و ترکیب شاخص‌ها جهت استخراج عوامل جدید پرداخته شده است. در گام بعدی با بکارگیری الگوریتم K-means بخش‌های شبیه به هم در خوشه‌های مربوطه قرار گرفته و سپس با استفاده از روش پیش‌بینی شبکه های عصبی و درخت تصمیم امکان اختصاص بخش‌های جدید به هر کلاس (خوشه‌های ایجاد شده) فراهم شده و جهت ارزیابی مدل‌های ایجاد شده، دقت خروجی با سایر روش‌ها مقایسه شده است. دستاوردهای این تحقیق عبارتند از: تعیین تعداد بهینه بخش‌ها، بخش‌بندی مناطق، تحلیل هر بخش، استخراج قواعد تصمیم‌گیری، امکان پیش‌بینی سریع‌تر و دقیق‌تر برچسب کلاس برای مناطق جدید، فراهم نمودن امکان تدوین راهبرد‌های مناسب برای هر بخش. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - ارائه روشی برای بخش‌بندی مشتریان با استفاده از مدل RFM در شرایط عدم قطعیت
        عظیمه مظفری
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاک چکیده کامل
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاکم بر آن‌ها، از تئوری اعداد خاکستری استفاده شده و با استفاده از یک روش متفاوت به بخش‌بندی مشتریان پرداخته شده است. به این ترتیب مشتریان بانک به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شده اند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شده است. در پایان نیز پیشنهادهایی جهت بهبود سیستم مدیریت ارتباط با مشتری ارائه می‌گردد. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن‌کاوی در حوزه یادگیری الکترونیکی
        سمیه آهاری
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطل چکیده کامل
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن‌کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان می‌دهد و از طرف دیگر اجازه مدیریت ابهام و شک را می‌دهد. علاوه بر آن، متن‌کاوی به عنوان داده‌کاوی متن بیان می‌شود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن می‌پردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج می‌کند. همچنین به عنوان داده‌کاوی متن یا کشف دانش از پایگاه ‌داده‌های متنی شناخته می‌شود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان می‌شود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهش‌های انجام شده در حوزه متن‌کاوی با تأکید بر روش‌ها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهش‌های مرتبط در حوزه آموزش الکترونیکی طبقه‌بندی گردیدند. پس از طبقه‌بندی پژوهش‌ها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متن‌کاوی پرداخته می‌شود. سپس فرایند متن‌کاوی و حوزه‌های کاربرد متن‌کاوی در آموزش الکترونیکی مورد بررسی قرار می‌گیرند. در ادامه روش‌های متن‌کاوی معرفی شده و تک تک این روش‌ها در حوزه آموزش الکترونیکی مطرح می‌گردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهره‌برداری از روش‌های متن‌کاوی در یادگیری الکترونیکی پیشنهاد می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - بررسی ابعاد مختلف مسئله شناسایی وب سایت فیشینگ و مرور روش‌های موجود
        نفیسه لنگری
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج چکیده کامل
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج گروه، به ارائه مزایا و معایب هر کدام از روش‌های این گروه‌های پنج گانه بپردازند. نتایج این تحقیق گسترده می‌تواند در شناسایی گپ‌های موجود در این حوزه به محققین کمک فراوانی نماید پرونده مقاله
      • دسترسی آزاد مقاله

        5 - تلفیق مدل تحلیل پوششی داده ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کار چکیده کامل
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی بهDMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - کشف اسپم در شبکه اجتماعی فیس‌بوک با استفاده از داده‌کاوی
        امین نظری
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای چکیده کامل
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای افراد سودجو فراهم نموده است. در اغلب موارد، کلاهبردارن در تلاشند تا انواع مختلف اسپم را در محیط‌هایی با پتانسیل بالا گسترش دهند. به همین دلیل در شبکه‌های اجتماعی نیازمند یک روش موثر برای تشخیص اسپم به منظور افزایش سطح امنیت اطلاعات هستیم. در این مقاله روش جدیدی برای کشف اسپمرها در شبکه‌ اجتماعی فیس‌بوک ارائه می‌دهیم. نتایج حاصل، دقت 99.96% روش پیشنهادی را نشان می‌دهد. در مقالات پیشین کاربران به دودسته‌ی کاربران عادی و کاربران اسپمر تقسیم می‌شوند. روش دسته‌بندی در این مقالات به‌گونه‌ای است که کاربرانی را که موردحمله اسپمرها قرارگرفته‌اند را نیز به‌عنوان اسپمر شناسایی می‌کنند. بنابراین در این مقاله با دسته‌بندی کاربران به سه دسته‌ی کاربران عادی، اسپمرها و کاربرانی که موردحمله اسپمرها قرارگرفته‌اند، صحت تشخیص الگوریتم را افزایش دادیم. پرونده مقاله
      • دسترسی آزاد مقاله

        7 - ارائه مدل داده‌ای مناسب در بانک‌ها به منظور بهره‌گیری از کاربردهای داده‌‌‌کاوی
        شهیده احمدی
        حوزه‌های بانکداری مانند ارزیابی اعتباری، کارایی شعبه‌ها، بانکداری الکترونیکی زمینه‌های فوق العاده‌ای برای کاربرد وسیع مفاهیم هوش تجاری و روش‌های آن شامل داده‌‌کاوی، انباره‌های داده‌ها و سیستم‌های پشتیبانی تصمیم‌گیری می‌باشند. پژوهش‌های زیادی در حوزه کاربرد داده‌کاوی در چکیده کامل
        حوزه‌های بانکداری مانند ارزیابی اعتباری، کارایی شعبه‌ها، بانکداری الکترونیکی زمینه‌های فوق العاده‌ای برای کاربرد وسیع مفاهیم هوش تجاری و روش‌های آن شامل داده‌‌کاوی، انباره‌های داده‌ها و سیستم‌های پشتیبانی تصمیم‌گیری می‌باشند. پژوهش‌های زیادی در حوزه کاربرد داده‌کاوی در زمینه‌های خاصی از بانکداری وجود دارند که هر کدام با استفاده از موجودیت­ های مختلف حوزه بانکداری مانند مشتری، تسهیلات، حساب و غیره به تحلیل پرداخته‌اند. اما پژوهشی که به طور جامع به همه کاربردهای داده‌کاوی در بانک بپردازد، آنها را یکپارچه کند، تمام موجودیت‌های مورد نیاز بانکداری به منظور انواع کاربردهای تحلیلی را استخراج و دسته­ بندی کند و در نهایت با توجه به صفت‌های مورد نیاز حوزه‌های بانکداری به ارائه مدل داده­ای مناسب بپردازد، وجود ندارد. در حال حاضر در بانک­ های ایران، سامانه­ های اطلاعاتی برای پاسخ به نیازهای اطلاعاتی جدید در حال توسعه هستند. در این پژوهش با استفاده از روش تحلیل محتوا، محتوای پژوهش­های معتبر در حوزه بانکداری که با رویکرد داده­ کاوی انجام شده ­اند، مورد بررسی قرار گرفت تا  با استخراج موجودیت­ ها و صفت ­های مورد استفاده این پژوهش­ ها، مدل داده ­ای مناسبی برای کابردهای تحلیل داده ­کاوی در بانکداری ارائه شود. مدیران فن­آوری اطلاعات با استفاده از این مدل م ی­توانند به ارزیابی وضعیت بانک از نظر غنای داده ­های لازم برای انجام تحلیل­ های داده ­کاوی بپردازند و خلاءهای مورد شناسایی را در برنامه ­های توسعه آتی سامانه­ های اطلاعاتی مدنظر قرار دهند. به علاوه، وجود مدل به آنها کمک می­ کند که بدانند برای هر یک از اهداف تجاری بکارگیری داده­ کاوی در بانکداری نیاز به چه اقلام اطلاعاتی وجود دارد. پس از تحلیل و بررسی پژوهش­ های پیشین، نهایتاً  28 موجودیت با 423 صفت شناسایی شدند و مدل نهایی ارتباط-موجودیت ایجاد شد. برای تائید مدل داده‌ای نهایی از نظر ده نفر از خبرگان بانک در بخش ­های مختلف مشتریان و بانکداری عمومی، مالی و پشتیبانی، امور بانکداری الکترونیک، امور اعتباری و بانکداری شرکتی، حوزه فناوری اطلاعات  و امور بین الملل در بانک با استفاده از ابزار پرسشنامه و مصاحبه استفاده شد. همچنین با استفاده از داده­ های جمع­ آوری شده از پژوهش ­ها نمودارهای فراوانی الگوریتم ­ها، تکنیک­ ها، روش ­های نمونه ­گیری، شاخص­ های کارایی و نرم­ افزارهای داده­ کاوی مورد استفاده در پژوهش ­ها ارائه شد تا مشخص شود که به عنوان نمونه کدام الگوریتم­ های داده ­کاوی بیشترین کاربرد را در حوزه­ های مختلف داشته­ اند.     پرونده مقاله
      • دسترسی آزاد مقاله

        8 - بررسی صحت ارزیابی کارشناسان املاک با استفاده از یک مدل مبتنی بر داده‌کاوی (مطالعه موردی بانک ملت)
        فاطمه داور
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر چکیده کامل
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر اساس شاخص‌های قیمت گذاری، اقدام به ارزیابی املاک می‌نمایند. در این تحقیق سعی شده است تا صحت ارزیابی کارشناسان ارزیابی اموال با استفاده از مدل‌های داده‌کاوی بررسی گردد. این اقدام در جهت کمک به مدیران بانک و مسئولان ممیزی گزارشات ارزیابی، انجام گرفته است تا آنها بتوانند در مورد کارشناسان و ارزیابی‌های انجام شده توسط آنها، تصمیمات بهتری اخذ نمایند. با استفاده از شاخص‌های ارزیابی املاک و داده‌کاوی به یک مدل پیش بینی کننده جهت پیش بینی قیمت املاک دست یافته و به منظور رسیدن به یک مدل پیش بینی با عملکرد بالا، از ترکیب الگوریتم های FCM و K-NN بهره گرفته شده است که این اقدام توانست میزان دقت پیش بینی را تا حد زیادی افزایش داده و کارایی مدل پیشنهادی را بالا می برد. میزان دقت[1] در پیش بینی مبالغ ارزیابی، برابر 84.21 % و میزان خطای RMSE در پیش بینی آن برابر 0.43، بدست آمد. رویکرد پیشنهادی بر روی داده‌های ارزیابی املاک بانک ملت آزموده شد. [1] accuracy پرونده مقاله
      • دسترسی آزاد مقاله

        9 - بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری ایران با رویکرد داده کاوی
        مهرناز مطهری نیا
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی بر چکیده کامل
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند.امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند. پرونده مقاله
      • دسترسی آزاد مقاله

        10 - تلفیق مدل تحلیل پوششی داده¬ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی علی علی نژاد سمیه  شفقی زاده
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری ک چکیده کامل
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی به DMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        11 - ارائه روشی برای بخش‌بندي مشتريان با استفاده از مدل RFM در شرایط عدم قطعیت
        محمدرضا غلامیان عظیمه مظفری
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پول چکیده کامل
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولي مبادله (M) از پایگاه داده مشتریان استخراج و پیش‌پردازش شدند. با توجه به گستردگی دامنه داده‌های مذکور، برای تعیین وضعیت خوب یا بد بودن مشتری نمی‌توان عدد دقیقی تعیین نمود؛ لذا برای از بین بردن این عدم قطعیت، از تئوری اعداد خاکستری استفاده شد که وضعیت مشتری را به صورت یک بازه در نظر می‌گیرد. به این ترتیب با استفاده از یک روش متفاوت به بخش‌بندی مشتريان بانک پرداخته شد که طبق نتایج، مشتریان به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شدند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شد و در پایان نيز پيشنهادهايي جهت بهبود سيستم مديريت ارتباط با مشتري ارائه گردید. پرونده مقاله
      • دسترسی آزاد مقاله

        12 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از داده‌کاوی روی صفحات وب
        مهدیه بهارلو علیرضا یاری
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داد چکیده کامل
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگی‌های برجسته از فیشینگ یکی از پیش‌شرط‌های مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگی‌های نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وب‌سایت‌های فیشینگ آماده گردید. سپس برای افزایش کارایی سامانه‌های تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله‌ مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگی‌ها به‌طور قابل‌توجهی کاهش یابند. پس‌ازآن عملکرد روش‌های درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگی‌های کاهش‌یافته موردبررسی قرار گرفت. نتایج نشان می‌دهند دقت مدل ایجاد شده برای تعیین وب سایت‌های فیشینگ با استفاده از کاهش ویژگی دومرحله‌ای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% می‌باشد که نسبت به سایر روش‌ها نتیجه مطلوبی است. پرونده مقاله
      • دسترسی آزاد مقاله

        13 - Referral Traffic Analysis: A Case Study of the Iranian Students' News Agency (ISNA)
        Roya Hassanian Esfahani Mohammad Javad Kargar
        Web traffic analysis is a well-known e-marketing activity. Today most of the news agencies have entered the web providing a variety of online services to their customers. The number of online news consumers is also increasing dramatically all over the world. A news webs چکیده کامل
        Web traffic analysis is a well-known e-marketing activity. Today most of the news agencies have entered the web providing a variety of online services to their customers. The number of online news consumers is also increasing dramatically all over the world. A news website usually benefits from different acquisition channels including organic search services, paid search services, referral links, direct hits, links from online social media, and e-mails. This article presents the results of an empirical study of analyzing referral traffic of a news website through data mining techniques. Main methods include correlation analysis, outlier detection, clustering, and model performance evaluation. The results decline any significant relationship between the amount of referral traffic coming from a referrer website and the website's popularity state. Furthermore, the referrer websites of the study fit into three clusters applying K-means Squared Euclidean Distance clustering algorithm. Performance evaluations assure the significance of the model. Also, among detected clusters, the most populated one has labeled as "Automatic News Aggregator Websites" by the experts. The findings of the study help to have a better understanding of the different referring behaviors, which form around 15% of the overall traffic of Iranian Students' News Agency (ISNA) website. They are also helpful to develop more efficient online marketing plans, business alliances, and corporate strategies. پرونده مقاله
      • دسترسی آزاد مقاله

        14 - Privacy Preserving Big Data Mining: Association Rule Hiding
        Golnar Assadat  Afzali شهریار  محمدی
        Data repositories contain sensitive information which must be protected from unauthorized access. Existing data mining techniques can be considered as a privacy threat to sensitive data. Association rule mining is one of the utmost data mining techniques which tries to چکیده کامل
        Data repositories contain sensitive information which must be protected from unauthorized access. Existing data mining techniques can be considered as a privacy threat to sensitive data. Association rule mining is one of the utmost data mining techniques which tries to cover relationships between seemingly unrelated data in a data base.. Association rule hiding is a research area in privacy preserving data mining (PPDM) which addresses a solution for hiding sensitive rules within the data problem. Many researches have be done in this area, but most of them focus on reducing undesired side effect of deleting sensitive association rules in static databases. However, in the age of big data, we confront with dynamic data bases with new data entrance at any time. So, most of existing techniques would not be practical and must be updated in order to be appropriate for these huge volume data bases. In this paper, data anonymization technique is used for association rule hiding, while parallelization and scalability features are also embedded in the proposed model, in order to speed up big data mining process. In this way, instead of removing some instances of an existing important association rule, generalization is used to anonymize items in appropriate level. So, if necessary, we can update important association rules based on the new data entrances. We have conducted some experiments using three datasets in order to evaluate performance of the proposed model in comparison with Max-Min2 and HSCRIL. Experimental results show that the information loss of the proposed model is less than existing researches in this area and this model can be executed in a parallel manner for less execution time پرونده مقاله
      • دسترسی آزاد مقاله

        15 - Preserving Data Clustering with Expectation Maximization Algorithm
        Leila Jafar Tafreshi Farzin Yaghmaee
        Data mining and knowledge discovery are important technologies for business and research. Despite their benefits in various areas such as marketing, business and medical analysis, the use of data mining techniques can also result in new threats to privacy and informatio چکیده کامل
        Data mining and knowledge discovery are important technologies for business and research. Despite their benefits in various areas such as marketing, business and medical analysis, the use of data mining techniques can also result in new threats to privacy and information security. Therefore, a new class of data mining methods called privacy preserving data mining (PPDM) has been developed. The aim of researches in this field is to develop techniques those could be applied to databases without violating the privacy of individuals. In this work we introduce a new approach to preserve sensitive information in databases with both numerical and categorical attributes using fuzzy logic. We map a database into a new one that conceals private information while preserving mining benefits. In our proposed method, we use fuzzy membership functions (MFs) such as Gaussian, P-shaped, Sigmoid, S-shaped and Z-shaped for private data. Then we cluster modified datasets by Expectation Maximization (EM) algorithm. Our experimental results show that using fuzzy logic for preserving data privacy guarantees valid data clustering results while protecting sensitive information. The accuracy of the clustering algorithm using fuzzy data is approximately equivalent to original data and is better than the state of the art methods in this field. پرونده مقاله
      • دسترسی آزاد مقاله

        16 - A RFMV Model and Customer Segmentation Based on Variety of Products
        Saman  Qadaki Moghaddam Neda Abdolvand Saeedeh Rajaee Harandi
        Today, increased competition between organizations has led them to seek a better understanding of customer behavior through innovative ways of storing and analyzing their information. Moreover, the emergence of new computing technologies has brought about major change چکیده کامل
        Today, increased competition between organizations has led them to seek a better understanding of customer behavior through innovative ways of storing and analyzing their information. Moreover, the emergence of new computing technologies has brought about major changes in the ability of organizations to collect, store and analyze macro-data. Therefore, over thousands of data can be stored for each customer. Hence, customer satisfaction is one of the most important organizational goals. Since all customers do not represent the same profitability to an organization, understanding and identifying the valuable customers has become the most important organizational challenge. Thus, understanding customers’ behavioral variables and categorizing customers based on these characteristics could provide better insight that will help business owners and industries to adopt appropriate marketing strategies such as up-selling and cross-selling. The use of these strategies is based on a fundamental variable, variety of products. Diversity in individual consumption may lead to increased demand for variety of products; therefore, variety of products can be used, along with other behavioral variables, to better understand and categorize customers’ behavior. Given the importance of the variety of products as one of the main parameters of assessing customer behavior, studying this factor in the field of business-to-business (B2B) communication represents a vital new approach. Hence, this study aims to cluster customers based on a developed RFM model, namely RFMV, by adding a variable of variety of products (V). Therefore, CRISP-DM and K-means algorithm was used for clustering. The results of the study indicated that the variable V, variety of products, is effective in calculating customers’ value. Moreover, the results indicated the better customers clustering and valuation by using the RFMV model. As a whole, the results of modeling indicate that the variety of products along with other behavioral variables provide more accurate clustering than RFM model. پرونده مقاله
      • دسترسی آزاد مقاله

        17 - Identification of a Nonlinear System by Determining of Fuzzy Rules
        hojatallah hamidi Atefeh  Daraei
        In this article the hybrid optimization algorithm of differential evolution and particle swarm is introduced for designing the fuzzy rule base of a fuzzy controller. For a specific number of rules, a hybrid algorithm for optimizing all open parameters was used to reach چکیده کامل
        In this article the hybrid optimization algorithm of differential evolution and particle swarm is introduced for designing the fuzzy rule base of a fuzzy controller. For a specific number of rules, a hybrid algorithm for optimizing all open parameters was used to reach maximum accuracy in training. The considered hybrid computational approach includes: opposition-based differential evolution algorithm and particle swarm optimization algorithm. To train a fuzzy system hich is employed for identification of a nonlinear system, the results show that the proposed hybrid algorithm approach demonstrates a better identification accuracy compared to other educational approaches in identification of the nonlinear system model. The example used in this article is the Mackey-Glass Chaotic System on which the proposed method is finally applied. پرونده مقاله
      • دسترسی آزاد مقاله

        18 - Analysis of Business Customers’ Value Network Using Data Mining Techniques
        Forough Farazzmanesh (Isvand) Monireh Hosseini
        In today's competitive environment, customers are the most important asset to any company. Therefore companies should understand what the retention and value drivers are for each customer. An approach that can help consider customers‘ different value dimensions is the چکیده کامل
        In today's competitive environment, customers are the most important asset to any company. Therefore companies should understand what the retention and value drivers are for each customer. An approach that can help consider customers‘ different value dimensions is the value network. This paper aims to introduce a new approach using data mining techniques for mapping and analyzing customers‘ value network. Besides, this approach is applied in a real case study. This research contributes to develop and implement a methodology to identify and define network entities of a value network in the context of B2B relationships. To conduct this work, we use a combination of methods and techniques designed to analyze customer data-sets (e.g. RFM and customer migration) and to analyze value network. As a result, this paper develops a new strategic network view of customers and discusses how a company can add value to its customers. The proposed approach provides an opportunity for marketing managers to gain a deep understanding of their business customers, the characteristics and structure of their customers‘ value network. This paper is the first contribution of its kind to focus exclusively on large data-set analytics to analyze value network. This new approach indicates that future research of value network can further gain the data mining tools. In this case study, we identify the value entities of the network and its value flows in the telecommunication organization using the available data in order to show that it can improve the value in the network by continuous monitoring. پرونده مقاله
      • دسترسی آزاد مقاله

        19 - DBCACF: A Multidimensional Method for Tourist Recommendation Based on Users’ Demographic, Context and Feedback
        Maral  Kolahkaj Ali Harounabadi Alireza Nikravan shalmani Rahim Chinipardaz
        By the advent of some applications in the web 2.0 such as social networks which allow the users to share media, many opportunities have been provided for the tourists to recognize and visit attractive and unfamiliar Areas-of-Interest (AOIs). However, finding the appropr چکیده کامل
        By the advent of some applications in the web 2.0 such as social networks which allow the users to share media, many opportunities have been provided for the tourists to recognize and visit attractive and unfamiliar Areas-of-Interest (AOIs). However, finding the appropriate areas based on user’s preferences is very difficult due to some issues such as huge amount of tourist areas, the limitation of the visiting time, and etc. In addition, the available methods have yet failed to provide accurate tourist’s recommendations based on geo-tagged media because of some problems such as data sparsity, cold start problem, considering two users with different habits as the same (symmetric similarity), and ignoring user’s personal and context information. Therefore, in this paper, a method called “Demographic-Based Context-Aware Collaborative Filtering” (DBCACF) is proposed to investigate the mentioned problems and to develop the Collaborative Filtering (CF) method with providing personalized tourist’s recommendations without users’ explicit requests. DBCACF considers demographic and contextual information in combination with the users' historical visits to overcome the limitations of CF methods in dealing with multi- dimensional data. In addition, a new asymmetric similarity measure is proposed in order to overcome the limitations of symmetric similarity methods. The experimental results on Flickr dataset indicated that the use of demographic and contextual information and the addition of proposed asymmetric scheme to the similarity measure could significantly improve the obtained results compared to other methods which used only user-item ratings and symmetric measures. پرونده مقاله
      • دسترسی آزاد مقاله

        20 - The Development of a Hybrid Error Feedback Model for Sales Forecasting
        Mehdi Farrokhbakht Foumani Sajad Moazami Goudarzi
        Sales forecasting is one of the significant issues in the industrial and service sector which can lead to facilitated management decisions and reduce the lost values in case of being dealt with properly. Also sales forecasting is one of the complicated problems in analy چکیده کامل
        Sales forecasting is one of the significant issues in the industrial and service sector which can lead to facilitated management decisions and reduce the lost values in case of being dealt with properly. Also sales forecasting is one of the complicated problems in analyzing time series and data mining due to the number of intervening parameters. Various models were presented on this issue and each one found acceptable results. However, developing the methods in this study is still considered by researchers. In this regard, the present study provided a hybrid model with error feedback for sales forecasting. In this study, forecasting was conducted using a supervised learning method. Then, the remaining values (model error) were specified and the error values were forecasted using another learning method. Finally, two trained models were combined together and consecutively used for sales forecasting. In other words, first the forecasting was conducted and then the error rate was determined by the second model. The total forecasting and model error indicated the final forecasting. The computational results obtained from numerical experiments indicated the superiority of the proposed hybrid method performance over the common models in the available literature and reduced the indicators related to forecasting error. پرونده مقاله
      • دسترسی آزاد مقاله

        21 - ارائه ی مدلی برای عقیده کاوی در سطح ویژگی برای نظرات کاربران هتل ها
        الهام  خلج شهریار  محمدی
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و ع چکیده کامل
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و عظیمی از عقاید بصورت متن موجود می باشد که افراد می‌توانند از روش های متن کاوی برای کشف عقاید دیگران استفاده کنند. با توجه به اهمیت نظر و عقاید کاربران در صنایع و بویژه صنعت گردشگری و هتلداری، مباحث عقیده‌کاوی و تحلیل احساسات و کاوش متون نوشته شده توسط کاربران مورد توجه متصدیان امور قرار گرفته است . در این مقاله یک روش ترکیبی و جدید بر اساس یک رویکرد رایج در تحلیل احساسات، استفاده از واژگان برای تولید ویژگی هایی برای طبقه بندی بار احساسی نظرات ارائه شده است. بدین صورت که دو روش ساخت فهرست واژگان یکی با استفاده از روش های آماری و دیگری با استفاده از الگوریتم ژنتیکی ارائه شده است. واژگان فوق الذکر با فرهنگ واژگان احساس عمومی و استاندارد لیو بینگ آمیخته می شوند تا دقت طبقه بندی افزایش یابد. پرونده مقاله
      • دسترسی آزاد مقاله

        22 - راهبرد مدیریت منابع انسانی در عصر دیجیتال با تکیه‌بر کلان داده
        غلامرضا ملک زاده صدیقه صادقی
        امروزه ابزارهای هوشمند، محیط‌های مجازی و خلاقیت‌های فناورانه، بخشی از زندگی همه انسان‌ها شده است. اگرچه این پیشرفت‌ها می‌تواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند می‌توانند از آن‌ها در فرصت‌های فراروی سازمان خود بهره‌برداری ک چکیده کامل
        امروزه ابزارهای هوشمند، محیط‌های مجازی و خلاقیت‌های فناورانه، بخشی از زندگی همه انسان‌ها شده است. اگرچه این پیشرفت‌ها می‌تواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند می‌توانند از آن‌ها در فرصت‌های فراروی سازمان خود بهره‌برداری کنند. از سوی دیگر فراگیر شدن فناوری اطلاعات در سازمان‌ها از یک‌سو و گستردگی انواع شبکه‌های اجتماعی از سوی دیگر بستری برای جمع‌آوری حجم انبوهی از داده‌ها و اطلاعات مربوط به افراد را فراهم آورده است. با توجه به این حقایق می‌توان گفت تفکر خلاق و همسویی با جریان امکانات، نیازها و الزامات عصر امروز و آگاهی از ارزش مدیریت دانش و بکارگیری آن موضوعی است که به‌ویژه در رابطه با سرمایه‌های انسانی باید بیشتر موردتوجه قرار گیرد. تأثیر توجه به فلسفه وجودی سازمان در انعطاف‌پذیری و خلاقیت سرمایه‌های انسانی و نیز برخورداری از سواد بهره‌برداری بهینه از سامانه‌های اطلاعاتی از عمده‌ترین محورهای این موضوع است. با عنایت به این مهم که نسل جدیدی از افراد در شرف ورود به بازار کار هستند، در این مقاله با تکیه‌ بر پژوهش‌ها و مطالعات انجام‌ شده در سازمان‌های معتبری همچون مکنزی، بهره‌گیری از سامانه‌های اطلاعاتی به‌ویژه کلان داده در مدیریت منابع انسانی در حال حاضر و برای دهه پیش رو مورد بررسی قرار می‌گیرد. با توجه این واقعیت می‌توان انتظار داشت در حوزه مدیریت منابع انسانی، جایگزین کردن ساختارهای سنتی با نتایج تحلیلی حاصل از کلان داده‌های سامانه‌های اطلاعاتی تناسب بیشتری برای تعامل و مدیریت نسل کاری آتی خواهد داشت. پرونده مقاله
      • دسترسی آزاد مقاله

        23 - طراحی سامانه تصمیم یار با استفاده از ابزار داده کاوی(مطالعه موردی معاونت فرهنگی دانشگاه علم و صنعت)
        روزبه قوسی عماد چیذری هانی وحدانی
        تصمیم‌گیری یکی از وظایف اصلی مدیران تلقی می‌شود؛ درعصر کنونی فرآیند تصمیم‌گیری با پیچیدگی‌ها و ظرافت‌های فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوری‌های روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتج چکیده کامل
        تصمیم‌گیری یکی از وظایف اصلی مدیران تلقی می‌شود؛ درعصر کنونی فرآیند تصمیم‌گیری با پیچیدگی‌ها و ظرافت‌های فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوری‌های روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتجربه مدیریت نیازمند به کارگیری صحیح سامانه‌های اطلاعاتی است؛ سیستم‌ پشتیبان تصمیم یکی از این سامانه‌های می‌باشد که پشتوانه‌ای برای فرآیند تصمیم‌گیری مدیران سازمانی می‌باشد. در این مقاله ابتدا ادبیات مربوط به سیستم پشتیبان تصمیم بررسی شده است؛ سپس داده‌کاوی به عنوان ابزاری برای استخراج دانش و اطلاعات کاربردی از داده‌های خام سازمانی معرفی شده است. این دانش به دست آمده حاوی مفاهیم و اطلاعاتی است که ممکن است پیش از این در سازمان مغفول مانده باشد لذا کمک شایانی به روند تصمیم گیری مدیران خواهد داشت. در نهایت یافته‌های این مطالعه در دانشگاه علم و صنعت به کار گرفته شده است تا راهنما و پشتیبان تصمیمات مدیران دانشگاهی باشد. پرونده مقاله
      • دسترسی آزاد مقاله

        24 - ارائه یک الگوریتم خوشه‌بندی مبتنی بر چگالی با قابلیت کشف خوشه‌های با چگالی متفاوت در پایگاه داده‌های مکانی
        علی زاده ده بالایی علیرضا باقری حامد افشار
        خوشه‌بندی یکی از تکنیک‌های مهم کشف دانش در پایگاه داده‌های مکانی است. الگوریتم‌های خوشه‌بندی مبتنی بر چگالی یکی از روش‌های اصلی برای خوشه‌بندی در داده‌کاوی هستند. الگوریتم DBSCAN پایه روش‌های خوشه‌بندی مبتنی بر چگالی است که علی‌رغم مزایایی که دارد دارای مشکلاتی نظیر سخت چکیده کامل
        خوشه‌بندی یکی از تکنیک‌های مهم کشف دانش در پایگاه داده‌های مکانی است. الگوریتم‌های خوشه‌بندی مبتنی بر چگالی یکی از روش‌های اصلی برای خوشه‌بندی در داده‌کاوی هستند. الگوریتم DBSCAN پایه روش‌های خوشه‌بندی مبتنی بر چگالی است که علی‌رغم مزایایی که دارد دارای مشکلاتی نظیر سخت‌بودن تعیین پارامترهای ورودی و عدم توانایی کشف خوشه‌های با چگالی متفاوت نیز است. در این مقاله الگوریتمی ارائه شده که برخلاف الگوریتم DBSCAN، قابلیت تشخیص خوشه‌های با چگالی متفاوت را دارد. این الگوریتم همچنین خوشه‌های تودرتو و چسبیده به هم را نیز به خوبی تشخیص می‌دهد. ایده الگوریتم پیشنهادی به این صورت است که ابتدا با استفاده از تکنیکی چگالی‌های مختلف مجموعه داده را تشخیص داده و برای هر چگالی یک شعاع Eps تعیین می‌کند. سپس الگوریتم DBSCAN جهت اعمال بر روی مجموعه داده، با پارامترهای به دست آمده تطبیق داده می‌شود. الگوریتم پیشنهادی بر روی مجموعه داده‌های استاندارد و مصنوعی تست شده است و نتایج به دست آمده با نتایج حاصل از الگوریتم DBSCAN و پنج بهبود الگوریتم DBSCAN شامل: VDBSCAN، VMDBSCAN، LDBSCAN، DVBSCAN و MDDBSCAN که همگی برای رفع مشکل تغییرات چگالی الگوریتم DBSCAN ارائه شده‌اند، بر اساس معیارهای ارزیابی روش‌های خوشه‌بندی مقایسه شده‌اند. نتایج ارزیابی‌ها نشان می‌دهد که الگوریتم پیشنهادی از دقت بالا و درصد خطای پایینی برخوردار بوده و نتایج بهتری نسبت به سایر الگوریتم‌ها داشته است. پرونده مقاله
      • دسترسی آزاد مقاله

        25 - کاهش ابعاد ویژگی مبتنی بر تئوری راف با استفاده از الگوریتم رقابت لیگ فوتبال
        مجید عبدالرزاق نژاد علی ادیبیان
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند چکیده کامل
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند. در سال‌های اخیر، تئوری مجموعه راف به عنوان یکی از ابزارهای موثر و کارآمد در کاهش ویژگی مورد توجه محققان قرار گرفته است. در این مقاله الگوریتم رقابت لیگ فوتبال برای اولین بار به منظور حل این مسئله مورد استفاده قرار گرفته شده است. توانایی فرار از بهین‌های موضعی، امکان بهره‌گیری از اطلاعات بازیکنان توزیع‌شده در فضای جستجو، همگرایی سریع به جواب‌های بهین و پارامترهای کم این الگوریتم، انگیزه این انتخاب بود. علاوه بر این نوآوری، ارائه تغییراتی همچون بهره‌گیری از مجموع توان بازیکنان ثابت و ذخیره در محاسبه توان هر تیم، در نظر گرفتن ترکیب ساختارهای پیوسته و گسسته برای هر بازیکن، ارائه یک مکانیزم ابتکاری گسسته‌سازی جدید، ارائه تحلیل هیدرولیک متناسب با مسئله تحقیق برای فرایند برازش هر بازیکن، ارائه اصلاح در عملگرهای تقلید و تهییج بر اساس چالش‌های نسخه اصلی را می‌توان به عنوان ایده‌های پیشنهادی به منظور اصلاح و سازگاری این الگوریتم برای مسئله کاهش ویژگی برشمرد. ایده‌های پیشنهادشده بر روی سه سطح داده در ابعاد کوچک، متوسط و بزرگ به همراه چهار الگوریتم فراابتکاری مشهور ژنتیک و بهینه‌سازی ازدحام ذارت، سیستم ایمنی مصنوعی و لیگ قهرمانان پیاده‌سازی گردیده و مقایسه نتایج به دست آمده نشان از مزیت‌های رقابتی قابل توجه الگوریتم رقابت لیگ فوتبال با سایر الگوریتم‌ها دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        26 - ارزیابی پتانسیل منابع سمت تقاضا در حضور تجهیزات سرمایشی و گرمایشی با استفاده از روش داده-کاوی مبتنی بر الگوریتم طبقه¬بندی k-means
        فاطمه شیبانی مژگان ملاحسنی‌پور هنگامه کشاورز
        در بستر سیستم‌های قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاست‌های تصمیم‌گیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقه‌بندی k-means به ع چکیده کامل
        در بستر سیستم‌های قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاست‌های تصمیم‌گیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقه‌بندی k-means به عنوان یک روش داده‌کاوی، تعیین می‌شود. ابتدا داده‌های انرژی مصرفی در ساعات پیک دوره‌های گرم (بهار و تابستان) و دوره‌های سرد (پاییز و زمستان)، با توجه به تغییرات قیمت و دما، با استفاده از الگوریتم k-means در خوشه‌های مختلفی گروه‌بندی می‌شوند. خوشه‌هایی با امکان حضور وسایل سرمایشی و گرمایشی، انتخاب می‌شوند. سپس نمودار بازه اطمینان داده‌های انرژی مصرفی در خوشه‌های منتخب با توجه به تغییرات قیمت انرژی ترسیم می‌گردد. با توجه به فاصله کمینه و بیشینه در میانگین داده‌های موجود در آستانه بالا و آستانه متوسط نمودار بازه اطمینان، پتانسیل نامی منابع پاسخگویی تقاضا (بار انعطاف‌پذیر) به دست می‌آید. اطلاعات انرژی مصرفی، دما و قیمت انرژی شبکه برق BOSTON در یک افق زمانی شش‌ساله به منظور ارزیابی مدل پیشنهادی استفاده می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        27 - روشی نوین برای خوشه‌بندی داده‌ها با استفاده از الگوریتم بهینه‌سازی چهارگرگ خاکستری
        لاله عجمی بختیاروند زهرا بهشتی
        امروزه، خوشه‌بندی داده‌ها به دلیل حجم و تنوع داده‎ها بسیار مورد توجه قرار گرفته است. مشکل اصلی روش‌های خوشه‌بندهای معمول این است که در دام بهینه محلی گرفتار می‌آیند. الگوریتم‌های فراابتکاری به دلیل داشتن توانایی فرار از بهینه‌های محلی، نتایج موفقی را در خوشه‌بندی داده‌ه چکیده کامل
        امروزه، خوشه‌بندی داده‌ها به دلیل حجم و تنوع داده‎ها بسیار مورد توجه قرار گرفته است. مشکل اصلی روش‌های خوشه‌بندهای معمول این است که در دام بهینه محلی گرفتار می‌آیند. الگوریتم‌های فراابتکاری به دلیل داشتن توانایی فرار از بهینه‌های محلی، نتایج موفقی را در خوشه‌بندی داده‌ها نشان داده‌اند. الگوریتم بهینه‌سازی گرگ خاکستری از جمله این دسته الگوریتم‌ها است که قابلیت بهره‌برداری خوبی دارد و در برخی از مسایل راه حل مناسبی ارائه داده است، اما اکتشاف آن ضعیف است و در بعضی از مسایل به بهینه محلی همگرا می‌شود. در این تحقیق برای بهبود خوشه‌بندی داده‌ها، نسخه بهبودیافته‌ای از الگوریتم بهینه‌سازی گرگ خاکستری به نام الگوریتم بهینه‌سازی چهارگرگ خاکستری ارائه شده که با استفاده از بهترین موقعیت دسته چهارم گرگ‌ها به نام گرگ‌های امگای پیشرو در تغییر موقعیت هر گرگ، قابلیت اکتشاف بهبود می‌یابد. با محاسبه امتیاز هر گرگ نسبت به بهترین راه حل، نحوه حرکت آن مشخص می‌شود. نتایج الگوریتم پیشنهادی چهارگرگ خاکستری با الگوریتم‌های بهینه‌سازی گرگ خاکستری، بهینه‌سازی ازدحام ذرات، کلونی زنبور عسل مصنوعی، ارگانیسم‌های هم‌زیست و بهینه‌سازی ازدحام سالپ در مسأله خوشه‌بندی روی چهارده مجموعه دادگان ارزیابی شده است. همچنین عملکرد الگوریتم پیشنهادی با چند نسخه بهبودیافته از الگوریتم گرگ خاکستری مقایسه شده است. نتایج به دست آمده عملکرد قابل توجه الگوریتم پیشنهادی را نسبت به سایر الگوریتم‌های فراابتکاری مورد مقایسه در مسأله خوشه‌بندی نشان می‌دهد. بر اساس میانگین معیار F روی تمام مجموعه دادگان، روش پیشنهادی 82/172% و الگوریتم بهینه ذرات 78/284% را نشان می‌دهد و در مقایسه با نسخه‌های بهبودیافته الگوریتم گرگ، الگوریتم EGWO که در رتبه بعدی است دارای میانگین معیار F برابر 80/656% می‌باشد. پرونده مقاله
      • دسترسی آزاد مقاله

        28 - ساخت درخت ‌تصمیم مقیاس‌پذیر مبتنی بر تقسیم سریع داده‌ها و پیش‌هرس
        سميه لطفي محمد قاسم زاده مهران محسن زاده ميترا ميرزارضايي
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. چکیده کامل
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. الگوريتم‌هاي ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتم‌هایی که به علت انتخاب زیرمجموعه‌ای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف‌ می‌کنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاس‌پذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی‌ مجموعه داده‌های حجیم ارائه شده است. الگوریتم ارائه‌شده درخت تصمیم را با استفاده از کل مجموعه داده‌ آموزش اما بدون نیاز به ذخیره‌سازی داده در حافظه اصلی می‌سازد. همچنین جهت کاهش پیچیدگی درخت از روش پیش‌هرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه داده‌های UCI نشان می‌دهد الگوریتم ارائه‌شده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتم‌ها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است. پرونده مقاله
      • دسترسی آزاد مقاله

        29 - ترکیب تکنیک‌های انتخاب نمونه و داده‌افزایي برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن
        پرستو محقق سميرا نوفرستی مهری رجائی
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌ب چکیده کامل
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        30 - ارائه مدلی برای پیش بینی بقای بیماران مبتلا به ملانوم بر اساس الگوریتم های داده کاوی
        فریناز صناعی سید عبدالله امین موسوی عباس طلوعی اشلقی علی  رجب زاده قطری
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق ب چکیده کامل
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق برآوردهاي انجمن سرطان آمریکا براي ملانوم در ایالاتمتحده براي سال 2022 عبارتاند از: حدود 99،780 ز افراد مبتلابه ملانوم تشخیص داده شدند و حدود 7،650 نفر در اثر ملانوم جان خود را از دست ميدهند. لذا هدف از این مطالعه، طراحي بهبود دقت الگوریتم براي پیش بیني بقاي این بیماران است. روش پژوهش: روش حاضر کاربردي، توصیفي- تحلیلي و گذشتهنگر است. جامعه پژوهش را بیماران مبتلابه سرطان ملانوم پایگاه داده مرکز تحقیقات کشوري سرطان دانشگاه شهید بهشتي ) 1۳87 تا 1۳91 ( که تا 5 سال مورد پیگیري قرارگرفته بودند، تشکیل داده است. مدل پیشبیني بقاي ملانوم بر اساس شاخص هاي ارزیابي الگوریتم هاي داده کاوي انتخاب شد. یافته ها: الگوریتم هاي شبکه عصبي، بیز ساده، شبکه بیزي، ترکیب درخت تصمیم گیري با بیز ساده، رگرسیون لجستیک، J48 ، ID3 بهعنوان مدل هاي استفاده شده ي پایگاه داده کشور انتخاب شدند . عملکرد شبکه عصبي در همه شاخصهاي ارزیابي ازلحاظ آماري نسبت به سایر الگوریتم هاي منتخب بالاتر بود. نتیجه گیري: نتایج مطالعه حاضر نشان داد که شبکه عصبي با مقدار 97 / 0 ازلحاظ دقت پیش بیني عملکرد بهینه دارد. بنابراین مدل پیش بیني کننده بقاي ملانوم، هم ازلحاظ قدرت تمایز و هم ازلحاظ پایایي، عملکرد بهتري از خود نشان داد؛ بنابراین، این الگوریتم به عنوان مدل پیش بیني بقاي ملانوم پیشنهاد شد پرونده مقاله
      • دسترسی آزاد مقاله

        31 - ارائه یک سیستم توصیه گر وب برای پیش بینی صفحات مورد علاقه کاربر با استفاده از الگوریتم خوشه بندی DBSCAN و روش SVM یادگیری ماشین
        رضا  مولایی فرد محمد مصلح
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد چکیده کامل
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد کرد که این کار می‌تواند مشکل شروع سرد سیستم را حل و باعث کیفیت بخشیدن به جستجو شود. در این تحقیق به ارائه روش جدیدی به‌منظور بهبود سیستم‌های توصیه گر در زمینه وب پرداخته می‌شود که از الگوریتم خوشه‌بندی DBSCAN جهت خوشه‌بندی داده‌ها استفاده می‌شود که این الگوریتم امتیاز کارایی ۹۹٪ را به دست آورد. سپس با استفاده از الگوریتم Page rank، صفحات موردعلاقه کاربر وزن دهی می‌شوند. سپس با استفاده از روش SVM، داده‌ها را دسته‌بندی و جهت تولید پیش‌بینی به کاربر به یک سیستم توصیه گر ترکیبی داده می‌دهیم که درنهایت این سیستم توصیه گر لیستی از صفحات را در اختیار کاربر قرار خواهد داد که می‌تواند موردعلاقه وی باشند. ارزیابی نتایج حاصل از تحقیق حاکی از آن بود که استفاده از این روش پیشنهادی می‌تواند امتیاز ۹۵% را در قسمت فراخوانی و امتیاز ۹۹% را در قسمت دقت به دست آورد که این نتایج اثبات می‌کند که این سیستم توصیه گر تا بیش از ۹۰٪ می‌تواند صفحات موردنظر کاربر را به‌درستی تشخیص داده و تا حدود زیادی نقاط ضعف سایر سیستم های پیشین را برطرف سازد. پرونده مقاله
      • دسترسی آزاد مقاله

        32 - پیش بینی اختلال اضطراب فراگیر در بین زنان دانشجو با استفاده از رویکرد جنگل تصادفی
        زهرا غلامی حبیبه زارع
        <p>سلامت روان یکی از بزرگترین چالش ها برای نسل کنونی است. اختلال اضطراب فراگیر (GAD) یکی از بسیاری از مشکلات سلامت روان است. افراد مبتلا به این اختلال نگرانی ها و تنش های اغراق آمیزی را در مورد رویدادهای روزمره تجربه می کنند. گزارش شده است که حدود 5 درصد از جمعیت کشورها چکیده کامل
        <p>سلامت روان یکی از بزرگترین چالش ها برای نسل کنونی است. اختلال اضطراب فراگیر (GAD) یکی از بسیاری از مشکلات سلامت روان است. افراد مبتلا به این اختلال نگرانی ها و تنش های اغراق آمیزی را در مورد رویدادهای روزمره تجربه می کنند. گزارش شده است که حدود 5 درصد از جمعیت کشورهای توسعه یافته به GAD مبتلا هستند و زنان دو برابر بیشتر از مردان به این بیماری مبتلا می شوند و یک اتفاق رو به رشد در بین زنان بالاخص زنان دانشجو است. این پژوهش با هدف پیش بینی اختلال اضطراب فراگیر در بین زنان دانشجو با رویکرد جنگل تصادفی، انجام شده است. از روش داده کاوی جهت پیش بینی استفاده شد.جامعه پژوهشی را زنان دانشجوی دانشگاه آزاد شیرازتشکیل دادند. تعداد 150 نفر از دانشجویان زن به روش تصادفی ساده انتخاب و با پرسشنامه DSM-IV, مورد ارزیابی قرار گرفتند. در این فرآیند، الگوریتم جنگل تصادفی برای تولید مدل پیش&zwnj;بینی پیشنهاد شده است. NetBeans IDE ابزاری بود که برای ساخت این پیاده سازی استفاده شد. جاوا زبان برنامه نویسی انتخاب شده برای کدگذاری این نمونه اولیه بود و از کتابخانه WEKA در این پیاده سازی استفاده شد. نتایج نشان داد که دقت پیش&zwnj;بینی با روش جنگل تصادفی بالای 0.9 است که نشان می&zwnj;دهد رویکرد جنگل تصادفی قادر به پیش&zwnj;بینی دقیق اختلال اضطراب فراگیر GAD است. برای ارزیابی ویژگی، رویکرد جنگل تصادفی در پیش&zwnj;بینی دقیق فردی که از GAD رنج نمی&zwnj;برد سازگاری نشان می&zwnj;دهد. نتایج به&zwnj;دست&zwnj;آمده از نمونه اولیه در مقایسه با خط پایه که در ابزار R پیاده&zwnj;سازی شده است، نسبتاً سازگار است. به طور خلاصه، رویکرد جنگل تصادفی عملکرد پیش&zwnj;بینی بالایی تولید می&zwnj;کند و می&zwnj;تواند روابط مهم بین پارامتر پیشنهادی و پارامتر وابسته را استخراج کند.</p> پرونده مقاله
      • دسترسی آزاد مقاله

        33 - تشخیص نفوذ و ناهنجاری ها با استفاده از داده کاوی و انتخاب ویژگی ها بوسیله الگوریتم PSO
        فریدون  رضائی محمدعلی افشار کاظمی محمد علی کرامتی
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد چکیده کامل
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد با استفاده از حملات سایبری به سایت‌ها و فروشگاه‌های مجازی نفوذ کرده و در آنها اخلال ایجاد می‌کنند. آشکارسازی حملات و ناهنجاری‌ها یکی از چالش‌های جدید در مسیر پیشبرد تکنولوژی تجارت الکترونیک می‌باشد. تشخیص ناهنجاری‌های یک شبکه و فرآیند شناسایی فعالیت‌های مخرب در کسب و کارهای تجارت الکترونیک با تجزیه و تحلیل رفتار ترافیک شبکه امکان‌پذیر است. سیستم‌های داده‌کاوی بطور گسترده‌ای در سیستمهای تشخیص نفوذ (IDS) برای تشخیص ناهنجاری‌ها استفاده می‌شوند. کاهش ابعاد ویژگی‌ها نقش بسیار مهمی در تشخیص نفوذ ایفا می‌کند، زیرا تشخیص ناهنجاری‌ها از ویژگی‌های ترافیک شبکه با ابعاد بالا فرآیندی زمان‌بری است. انتخاب ویژگی‌های درست و مناسب بر سرعت تجزیه و تحلیل و کار پیشنهادی تاثیر می‌گذارد و می‌تواند سرعت تشخیص را بهبود بخشد. در این مقاله با استفاده از الگوریتم‌های داده‌کاوی مانند بیزین، پرسپترون چندلایه، CFS، Best First، J48 و PSO، میزان دقت تشخیص ناهنجاری‌ها و حملات به 0.996 و میزان خطای آن 0.004 رسانده شده است. پرونده مقاله