-
دسترسی آزاد مقاله
1 - تکنیک های دادهکاوی در سهمیهبندی مناطق برای کنکور
نرجس سرعتی آَشتیانی سمیه علیزاده علی مبصّـریتعداد زیادی از فارغالتحصیلان دبیرستانها در سیستم آموزشی ایران خواهان ورود به دانشگاهها میباشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر میباشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمانهای ذیربط، تخصیص سهمیه چکیده کاملتعداد زیادی از فارغالتحصیلان دبیرستانها در سیستم آموزشی ایران خواهان ورود به دانشگاهها میباشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر میباشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمانهای ذیربط، تخصیص سهمیه را راهکاری مناسب برای حل این مسأله میدانند و به دنبال استفاده از دانش نهفته در دادههای موجود در این حوزه هستند. با منطقهبندی کلیه بخشهای کشور، داوطلبان هر منطقه با هم مقایسه میشوند و در واقع با این روش از اینکه درصد پذیرفتهشدگان یک شهر چند برابر شهر دیگری باشد، جلوگیری میشود. تعیین میزان سهمیه کنکور برای بخشهای کشور در سال های اخیر، برمبنای میزان توسعهیافتگی مناطق با استفاده از روش تاکسونومی صورت گرفته است که خروجی حاصل از این روش نوعی رتبهبندی مناطق میباشد که در آن امکان تحلیل گروهی مناطق وجود ندارد، همچنین تعداد مناطق بصورت نظری تعیین می شود. برای رفع این مسائل بخشبندی میتواند به عنوان یک راهکار مناسب مورد استفاده قرار گیرد. تحقیق حاضر برای اولین بار در حوزه توسعهیافتگی، با استفاده از تکنیکهای دادهکاوی و روش کریسپ و در قالب متدولوژی پیشنهادی، بر روی دادههای مرتبط، در وزارت آموزش و پرورش، وزارت کشور، وزارت بهداشت و درمان، مرکز آمار و سازمان سنجش، صورت گرفته است. پس از شناسایی استانداردها و شاخصهای اثرگذار در این زمینه، آمادهسازی دادهها انجام شده و به ساخت انبارهداده و ترکیب شاخصها جهت استخراج عوامل جدید پرداخته شده است. در گام بعدی با بکارگیری الگوریتم K-means بخشهای شبیه به هم در خوشههای مربوطه قرار گرفته و سپس با استفاده از روش پیشبینی شبکه های عصبی و درخت تصمیم امکان اختصاص بخشهای جدید به هر کلاس (خوشههای ایجاد شده) فراهم شده و جهت ارزیابی مدلهای ایجاد شده، دقت خروجی با سایر روشها مقایسه شده است. دستاوردهای این تحقیق عبارتند از: تعیین تعداد بهینه بخشها، بخشبندی مناطق، تحلیل هر بخش، استخراج قواعد تصمیمگیری، امکان پیشبینی سریعتر و دقیقتر برچسب کلاس برای مناطق جدید، فراهم نمودن امکان تدوین راهبردهای مناسب برای هر بخش. پرونده مقاله -
دسترسی آزاد مقاله
2 - ارائه روشی برای بخشبندی مشتریان با استفاده از مدل RFM در شرایط عدم قطعیت
عظیمه مظفریهدف از انجام این پژوهش ارائه روشی برای بخشبندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت میباشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخصهای مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاک چکیده کاملهدف از انجام این پژوهش ارائه روشی برای بخشبندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت میباشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخصهای مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاکم بر آنها، از تئوری اعداد خاکستری استفاده شده و با استفاده از یک روش متفاوت به بخشبندی مشتریان پرداخته شده است. به این ترتیب مشتریان بانک به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شده اند. پس از اعتبارسنجی خوشهها با استفاده از شاخصهای دان و دیویس بولدین، ویژگیهای مشتریان در هر یک از بخشها شناسایی شده است. در پایان نیز پیشنهادهایی جهت بهبود سیستم مدیریت ارتباط با مشتری ارائه میگردد. پرونده مقاله -
دسترسی آزاد مقاله
3 - ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متنکاوی در حوزه یادگیری الکترونیکی
سمیه آهاریهنگامیکه شبکههای کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روشهای متنکاوی استفاده میشود. متنکاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید بهوسیله استخراج اطل چکیده کاملهنگامیکه شبکههای کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روشهای متنکاوی استفاده میشود. متنکاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید بهوسیله استخراج اطلاعات از اسناد مختلف است. همچنین متنکاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان میدهد و از طرف دیگر اجازه مدیریت ابهام و شک را میدهد. علاوه بر آن، متنکاوی به عنوان دادهکاوی متن بیان میشود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن میپردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج میکند. همچنین به عنوان دادهکاوی متن یا کشف دانش از پایگاه دادههای متنی شناخته میشود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان میشود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهشهای انجام شده در حوزه متنکاوی با تأکید بر روشها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهشهای مرتبط در حوزه آموزش الکترونیکی طبقهبندی گردیدند. پس از طبقهبندی پژوهشها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متنکاوی پرداخته میشود. سپس فرایند متنکاوی و حوزههای کاربرد متنکاوی در آموزش الکترونیکی مورد بررسی قرار میگیرند. در ادامه روشهای متنکاوی معرفی شده و تک تک این روشها در حوزه آموزش الکترونیکی مطرح میگردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهرهبرداری از روشهای متنکاوی در یادگیری الکترونیکی پیشنهاد میشود. پرونده مقاله -
دسترسی آزاد مقاله
4 - کشف اسپم در شبکه اجتماعی فیسبوک با استفاده از دادهکاوی
امین نظریدر سالهای اخیر با توسعهی فنآوریهای نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکههای اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونهی شبکههای اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکهها از طرفی دیگر، بستر مناسبی را برای چکیده کاملدر سالهای اخیر با توسعهی فنآوریهای نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکههای اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونهی شبکههای اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکهها از طرفی دیگر، بستر مناسبی را برای افراد سودجو فراهم نموده است. در اغلب موارد، کلاهبردارن در تلاشند تا انواع مختلف اسپم را در محیطهایی با پتانسیل بالا گسترش دهند. به همین دلیل در شبکههای اجتماعی نیازمند یک روش موثر برای تشخیص اسپم به منظور افزایش سطح امنیت اطلاعات هستیم. در این مقاله روش جدیدی برای کشف اسپمرها در شبکه اجتماعی فیسبوک ارائه میدهیم. نتایج حاصل، دقت 99.96% روش پیشنهادی را نشان میدهد. در مقالات پیشین کاربران به دودستهی کاربران عادی و کاربران اسپمر تقسیم میشوند. روش دستهبندی در این مقالات بهگونهای است که کاربرانی را که موردحمله اسپمرها قرارگرفتهاند را نیز بهعنوان اسپمر شناسایی میکنند. بنابراین در این مقاله با دستهبندی کاربران به سه دستهی کاربران عادی، اسپمرها و کاربرانی که موردحمله اسپمرها قرارگرفتهاند، صحت تشخیص الگوریتم را افزایش دادیم. پرونده مقاله -
دسترسی آزاد مقاله
5 - بررسی صحت ارزیابی کارشناسان املاک با استفاده از یک مدل مبتنی بر دادهکاوی (مطالعه موردی بانک ملت)
فاطمه داوربانکها به عنوان بخش اصلی نظام مالی همواره با ریسکهای متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر چکیده کاملبانکها به عنوان بخش اصلی نظام مالی همواره با ریسکهای متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر اساس شاخصهای قیمت گذاری، اقدام به ارزیابی املاک مینمایند. در این تحقیق سعی شده است تا صحت ارزیابی کارشناسان ارزیابی اموال با استفاده از مدلهای دادهکاوی بررسی گردد. این اقدام در جهت کمک به مدیران بانک و مسئولان ممیزی گزارشات ارزیابی، انجام گرفته است تا آنها بتوانند در مورد کارشناسان و ارزیابیهای انجام شده توسط آنها، تصمیمات بهتری اخذ نمایند. با استفاده از شاخصهای ارزیابی املاک و دادهکاوی به یک مدل پیش بینی کننده جهت پیش بینی قیمت املاک دست یافته و به منظور رسیدن به یک مدل پیش بینی با عملکرد بالا، از ترکیب الگوریتم های FCM و K-NN بهره گرفته شده است که این اقدام توانست میزان دقت پیش بینی را تا حد زیادی افزایش داده و کارایی مدل پیشنهادی را بالا می برد. میزان دقت[1] در پیش بینی مبالغ ارزیابی، برابر 84.21 % و میزان خطای RMSE در پیش بینی آن برابر 0.43، بدست آمد. رویکرد پیشنهادی بر روی دادههای ارزیابی املاک بانک ملت آزموده شد. [1] accuracy پرونده مقاله -
دسترسی آزاد مقاله
6 - بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری ایران با رویکرد داده کاوی
مهرناز مطهری نیاامروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی بر چکیده کاملامروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی برای سازمانها امکانپذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری میباشد. به این منظور دادههای تراکنشهای پایانههای فروش کلیه بانکهای ایران از یک شرکت ارائهدهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفتهاست. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانههای فروش در هر ماه از نظر رویگردانی و وفاداری بخشبندی شدهاند سپس با استفاده از روش انتخاب ویژگی افزودن L، حذف R و الگوریتم رگرسیون خطی چند متغیره ویژگیهای موثر بر درصد مشتریان رویگردان از بین شاخصهای اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شدهاند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخصهای اقتصادی مورد بررسی هستند.امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی برای سازمانها امکانپذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری میباشد. به این منظور دادههای تراکنشهای پایانههای فروش کلیه بانکهای ایران از یک شرکت ارائهدهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفتهاست. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانههای فروش در هر ماه از نظر رویگردانی و وفاداری بخشبندی شدهاند سپس با استفاده از روش انتخاب ویژگی افزودن L، حذف R و الگوریتم رگرسیون خطی چند متغیره ویژگیهای موثر بر درصد مشتریان رویگردان از بین شاخصهای اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شدهاند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخصهای اقتصادی مورد بررسی هستند. پرونده مقاله -
دسترسی آزاد مقاله
7 - ارائه روشی برای بخشبندي مشتريان با استفاده از مدل RFM در شرایط عدم قطعیت
محمدرضا غلامیان عظیمه مظفریهدف از انجام اين پژوهش ارائه روشی برای بخشبندی مشتریان یکی از بانکهای خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت دادههای مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخصهاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پول چکیده کاملهدف از انجام اين پژوهش ارائه روشی برای بخشبندی مشتریان یکی از بانکهای خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت دادههای مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخصهاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولي مبادله (M) از پایگاه داده مشتریان استخراج و پیشپردازش شدند. با توجه به گستردگی دامنه دادههای مذکور، برای تعیین وضعیت خوب یا بد بودن مشتری نمیتوان عدد دقیقی تعیین نمود؛ لذا برای از بین بردن این عدم قطعیت، از تئوری اعداد خاکستری استفاده شد که وضعیت مشتری را به صورت یک بازه در نظر میگیرد. به این ترتیب با استفاده از یک روش متفاوت به بخشبندی مشتريان بانک پرداخته شد که طبق نتایج، مشتریان به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شدند. پس از اعتبارسنجی خوشهها با استفاده از شاخصهای دان و دیویس بولدین، ویژگیهای مشتریان در هر یک از بخشها شناسایی شد و در پایان نيز پيشنهادهايي جهت بهبود سيستم مديريت ارتباط با مشتري ارائه گردید. پرونده مقاله -
دسترسی آزاد مقاله
8 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از دادهکاوی روی صفحات وب
مهدیه بهارلو علیرضا یاریفیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسبوکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایتهای فیشینگ با استفاده از داد چکیده کاملفیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسبوکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایتهای فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگیهای برجسته از فیشینگ یکی از پیششرطهای مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگیهای نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وبسایتهای فیشینگ آماده گردید. سپس برای افزایش کارایی سامانههای تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگیها بهطور قابلتوجهی کاهش یابند. پسازآن عملکرد روشهای درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگیهای کاهشیافته موردبررسی قرار گرفت. نتایج نشان میدهند دقت مدل ایجاد شده برای تعیین وب سایتهای فیشینگ با استفاده از کاهش ویژگی دومرحلهای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% میباشد که نسبت به سایر روشها نتیجه مطلوبی است. پرونده مقاله -
دسترسی آزاد مقاله
9 - راهبرد مدیریت منابع انسانی در عصر دیجیتال با تکیهبر کلان داده
غلامرضا ملک زاده صدیقه صادقیامروزه ابزارهای هوشمند، محیطهای مجازی و خلاقیتهای فناورانه، بخشی از زندگی همه انسانها شده است. اگرچه این پیشرفتها میتواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند میتوانند از آنها در فرصتهای فراروی سازمان خود بهرهبرداری ک چکیده کاملامروزه ابزارهای هوشمند، محیطهای مجازی و خلاقیتهای فناورانه، بخشی از زندگی همه انسانها شده است. اگرچه این پیشرفتها میتواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند میتوانند از آنها در فرصتهای فراروی سازمان خود بهرهبرداری کنند. از سوی دیگر فراگیر شدن فناوری اطلاعات در سازمانها از یکسو و گستردگی انواع شبکههای اجتماعی از سوی دیگر بستری برای جمعآوری حجم انبوهی از دادهها و اطلاعات مربوط به افراد را فراهم آورده است. با توجه به این حقایق میتوان گفت تفکر خلاق و همسویی با جریان امکانات، نیازها و الزامات عصر امروز و آگاهی از ارزش مدیریت دانش و بکارگیری آن موضوعی است که بهویژه در رابطه با سرمایههای انسانی باید بیشتر موردتوجه قرار گیرد. تأثیر توجه به فلسفه وجودی سازمان در انعطافپذیری و خلاقیت سرمایههای انسانی و نیز برخورداری از سواد بهرهبرداری بهینه از سامانههای اطلاعاتی از عمدهترین محورهای این موضوع است. با عنایت به این مهم که نسل جدیدی از افراد در شرف ورود به بازار کار هستند، در این مقاله با تکیه بر پژوهشها و مطالعات انجام شده در سازمانهای معتبری همچون مکنزی، بهرهگیری از سامانههای اطلاعاتی بهویژه کلان داده در مدیریت منابع انسانی در حال حاضر و برای دهه پیش رو مورد بررسی قرار میگیرد. با توجه این واقعیت میتوان انتظار داشت در حوزه مدیریت منابع انسانی، جایگزین کردن ساختارهای سنتی با نتایج تحلیلی حاصل از کلان دادههای سامانههای اطلاعاتی تناسب بیشتری برای تعامل و مدیریت نسل کاری آتی خواهد داشت. پرونده مقاله -
دسترسی آزاد مقاله
10 - طراحی سامانه تصمیم یار با استفاده از ابزار داده کاوی(مطالعه موردی معاونت فرهنگی دانشگاه علم و صنعت)
روزبه قوسی عماد چیذری هانی وحدانیتصمیمگیری یکی از وظایف اصلی مدیران تلقی میشود؛ درعصر کنونی فرآیند تصمیمگیری با پیچیدگیها و ظرافتهای فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوریهای روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتج چکیده کاملتصمیمگیری یکی از وظایف اصلی مدیران تلقی میشود؛ درعصر کنونی فرآیند تصمیمگیری با پیچیدگیها و ظرافتهای فراوانی همراه است به طوری که اخذ تصمیم بدون استفاده از فناوریهای روز و تحلیل و بررسی اطلاعات، اهداف را به صورت مطلوب محقق نخواهد ساخت. مدیریت کارا علاوه بر دانش وتجربه مدیریت نیازمند به کارگیری صحیح سامانههای اطلاعاتی است؛ سیستم پشتیبان تصمیم یکی از این سامانههای میباشد که پشتوانهای برای فرآیند تصمیمگیری مدیران سازمانی میباشد. در این مقاله ابتدا ادبیات مربوط به سیستم پشتیبان تصمیم بررسی شده است؛ سپس دادهکاوی به عنوان ابزاری برای استخراج دانش و اطلاعات کاربردی از دادههای خام سازمانی معرفی شده است. این دانش به دست آمده حاوی مفاهیم و اطلاعاتی است که ممکن است پیش از این در سازمان مغفول مانده باشد لذا کمک شایانی به روند تصمیم گیری مدیران خواهد داشت. در نهایت یافتههای این مطالعه در دانشگاه علم و صنعت به کار گرفته شده است تا راهنما و پشتیبان تصمیمات مدیران دانشگاهی باشد. پرونده مقاله -
دسترسی آزاد مقاله
11 - ارائه یک الگوریتم خوشهبندی مبتنی بر چگالی با قابلیت کشف خوشههای با چگالی متفاوت در پایگاه دادههای مکانی
علی زاده ده بالایی علیرضا باقری حامد افشارخوشهبندی یکی از تکنیکهای مهم کشف دانش در پایگاه دادههای مکانی است. الگوریتمهای خوشهبندی مبتنی بر چگالی یکی از روشهای اصلی برای خوشهبندی در دادهکاوی هستند. الگوریتم DBSCAN پایه روشهای خوشهبندی مبتنی بر چگالی است که علیرغم مزایایی که دارد دارای مشکلاتی نظیر سخت چکیده کاملخوشهبندی یکی از تکنیکهای مهم کشف دانش در پایگاه دادههای مکانی است. الگوریتمهای خوشهبندی مبتنی بر چگالی یکی از روشهای اصلی برای خوشهبندی در دادهکاوی هستند. الگوریتم DBSCAN پایه روشهای خوشهبندی مبتنی بر چگالی است که علیرغم مزایایی که دارد دارای مشکلاتی نظیر سختبودن تعیین پارامترهای ورودی و عدم توانایی کشف خوشههای با چگالی متفاوت نیز است. در این مقاله الگوریتمی ارائه شده که برخلاف الگوریتم DBSCAN، قابلیت تشخیص خوشههای با چگالی متفاوت را دارد. این الگوریتم همچنین خوشههای تودرتو و چسبیده به هم را نیز به خوبی تشخیص میدهد. ایده الگوریتم پیشنهادی به این صورت است که ابتدا با استفاده از تکنیکی چگالیهای مختلف مجموعه داده را تشخیص داده و برای هر چگالی یک شعاع Eps تعیین میکند. سپس الگوریتم DBSCAN جهت اعمال بر روی مجموعه داده، با پارامترهای به دست آمده تطبیق داده میشود. الگوریتم پیشنهادی بر روی مجموعه دادههای استاندارد و مصنوعی تست شده است و نتایج به دست آمده با نتایج حاصل از الگوریتم DBSCAN و پنج بهبود الگوریتم DBSCAN شامل: VDBSCAN، VMDBSCAN، LDBSCAN، DVBSCAN و MDDBSCAN که همگی برای رفع مشکل تغییرات چگالی الگوریتم DBSCAN ارائه شدهاند، بر اساس معیارهای ارزیابی روشهای خوشهبندی مقایسه شدهاند. نتایج ارزیابیها نشان میدهد که الگوریتم پیشنهادی از دقت بالا و درصد خطای پایینی برخوردار بوده و نتایج بهتری نسبت به سایر الگوریتمها داشته است. پرونده مقاله -
دسترسی آزاد مقاله
12 - کاهش ابعاد ویژگی مبتنی بر تئوری راف با استفاده از الگوریتم رقابت لیگ فوتبال
مجید عبدالرزاق نژاد علی ادیبیانافزایش حجم پایگاه دادهها، مسئله کاهش ویژگی را ایجاد و پراهمیت میسازد. از این رو در علم دادهکاوی، یکی از زیربخشهای مهم، مسئله کاهش ابعاد (انتخاب ویژگی) میباشد که در آن زیرمجموعهای از ویژگیهایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب میشوند چکیده کاملافزایش حجم پایگاه دادهها، مسئله کاهش ویژگی را ایجاد و پراهمیت میسازد. از این رو در علم دادهکاوی، یکی از زیربخشهای مهم، مسئله کاهش ابعاد (انتخاب ویژگی) میباشد که در آن زیرمجموعهای از ویژگیهایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب میشوند. در سالهای اخیر، تئوری مجموعه راف به عنوان یکی از ابزارهای موثر و کارآمد در کاهش ویژگی مورد توجه محققان قرار گرفته است. در این مقاله الگوریتم رقابت لیگ فوتبال برای اولین بار به منظور حل این مسئله مورد استفاده قرار گرفته شده است. توانایی فرار از بهینهای موضعی، امکان بهرهگیری از اطلاعات بازیکنان توزیعشده در فضای جستجو، همگرایی سریع به جوابهای بهین و پارامترهای کم این الگوریتم، انگیزه این انتخاب بود. علاوه بر این نوآوری، ارائه تغییراتی همچون بهرهگیری از مجموع توان بازیکنان ثابت و ذخیره در محاسبه توان هر تیم، در نظر گرفتن ترکیب ساختارهای پیوسته و گسسته برای هر بازیکن، ارائه یک مکانیزم ابتکاری گسستهسازی جدید، ارائه تحلیل هیدرولیک متناسب با مسئله تحقیق برای فرایند برازش هر بازیکن، ارائه اصلاح در عملگرهای تقلید و تهییج بر اساس چالشهای نسخه اصلی را میتوان به عنوان ایدههای پیشنهادی به منظور اصلاح و سازگاری این الگوریتم برای مسئله کاهش ویژگی برشمرد. ایدههای پیشنهادشده بر روی سه سطح داده در ابعاد کوچک، متوسط و بزرگ به همراه چهار الگوریتم فراابتکاری مشهور ژنتیک و بهینهسازی ازدحام ذارت، سیستم ایمنی مصنوعی و لیگ قهرمانان پیادهسازی گردیده و مقایسه نتایج به دست آمده نشان از مزیتهای رقابتی قابل توجه الگوریتم رقابت لیگ فوتبال با سایر الگوریتمها دارد. پرونده مقاله -
دسترسی آزاد مقاله
13 - انتخاب ویژگی و طبقهبندی سلولهای سرطانی بر پایه دادههای ریزآرایه با استفاده از الگوریتم جستجوی فاخته چندهدفه
خدیجه کمری فرزان رشیدی عبدالله خلیلیدادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچ چکیده کاملدادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچیدگی در طبقهبندی سلولهای سرطانی خواهد شد. یک راهکار مناسب جهت افزایش کارایی طبقهبندها، حذف ژنهای نامربوط و انتخاب نمونههای مناسب برای آموزش طبقهبندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینهسازی جستجوی فاخته چندهدفه و خوشهبندی فازی برای طبقهبندی دادههای ریزآرایه پیشنهاد شده است. در اين مطالعه از نسخه دودویی الگوريتم جستجوی فاخته چندهدفه به منظور انتخاب ويژگيهاي مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونههای مناسب برای آموزش طبقهبندها استفاده شده است. به منظور تسریع در فرایند بهینهسازی و جلوگیری از گیرافتادن الگوریتم در بهینههای محلی، راهکارهای ابتکاری جدیدی نیز به الگوریتم اضافه شدهاند. برای بررسی عملکرد مدل پیشنهادی، شبیهسازیهای متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان میدهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روشها، با انتخاب مجموعه کوچکتری از ژنهای متمایز، منجر به افزایش کارایی طبقهبندها شود. پرونده مقاله -
دسترسی آزاد مقاله
14 - ارزیابی پتانسیل منابع سمت تقاضا در حضور تجهیزات سرمایشی و گرمایشی با استفاده از روش داده-کاوی مبتنی بر الگوریتم طبقه¬بندی k-means
فاطمه شیبانی مژگان ملاحسنیپور هنگامه کشاورزدر بستر سیستمهای قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاستهای تصمیمگیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقهبندی k-means به ع چکیده کاملدر بستر سیستمهای قدرت هوشمند، تعیین پتانسیل منابع پاسخگویی تقاضا به علت اثرگذاری بر تمامی سیاستهای تصمیمگیری حوزه انرژی حایز اهمیت است. در مقاله حاضر، پتانسیل منابع پاسخگویی تقاضا در حضور تجهیزات سرمایشی و گرمایشی، با استفاده از روش الگوریتم طبقهبندی k-means به عنوان یک روش دادهکاوی، تعیین میشود. ابتدا دادههای انرژی مصرفی در ساعات پیک دورههای گرم (بهار و تابستان) و دورههای سرد (پاییز و زمستان)، با توجه به تغییرات قیمت و دما، با استفاده از الگوریتم k-means در خوشههای مختلفی گروهبندی میشوند. خوشههایی با امکان حضور وسایل سرمایشی و گرمایشی، انتخاب میشوند. سپس نمودار بازه اطمینان دادههای انرژی مصرفی در خوشههای منتخب با توجه به تغییرات قیمت انرژی ترسیم میگردد. با توجه به فاصله کمینه و بیشینه در میانگین دادههای موجود در آستانه بالا و آستانه متوسط نمودار بازه اطمینان، پتانسیل نامی منابع پاسخگویی تقاضا (بار انعطافپذیر) به دست میآید. اطلاعات انرژی مصرفی، دما و قیمت انرژی شبکه برق BOSTON در یک افق زمانی ششساله به منظور ارزیابی مدل پیشنهادی استفاده میشود. پرونده مقاله -
دسترسی آزاد مقاله
15 - ساخت درخت تصمیم مقیاسپذیر مبتنی بر تقسیم سریع دادهها و پیشهرس
سميه لطفي محمد قاسم زاده مهران محسن زاده ميترا ميرزارضاييدستهبندی، یکی از وظایف مهم دادهکاوی و یادگیری ماشین است و درخت تصمیم به عنوان یکی از الگوریتمهای پرکاربرد دستهبندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با دادههای حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیتهای حافظه و زمان اجرا مواجه است. چکیده کاملدستهبندی، یکی از وظایف مهم دادهکاوی و یادگیری ماشین است و درخت تصمیم به عنوان یکی از الگوریتمهای پرکاربرد دستهبندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با دادههای حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیتهای حافظه و زمان اجرا مواجه است. الگوريتمهاي ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتمهایی که به علت انتخاب زیرمجموعهای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف میکنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاسپذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی مجموعه دادههای حجیم ارائه شده است. الگوریتم ارائهشده درخت تصمیم را با استفاده از کل مجموعه داده آموزش اما بدون نیاز به ذخیرهسازی داده در حافظه اصلی میسازد. همچنین جهت کاهش پیچیدگی درخت از روش پیشهرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه دادههای UCI نشان میدهد الگوریتم ارائهشده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتمها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است. پرونده مقاله -
دسترسی آزاد مقاله
16 - ترکیب تکنیکهای انتخاب نمونه و دادهافزایي برای حل مسئله طبقهبندی مجموعه دادههای نامتوازن
پرستو محقق سميرا نوفرستی مهری رجائیدر عصر کلاندادهها، تکنیکهای تجزیه و تحلیل خودکار مانند دادهکاوی بهطور گستردهای برای تصمیمگیری بهکار گرفته شده و بسیار مؤثر واقع شدهاند. از جمله تکنیکهای دادهکاوی میتوان به طبقهبندی اشاره کرد که یک روش رایج برای تصمیمگیری و پیشبینی است. الگوریتمهای طبقهب چکیده کاملدر عصر کلاندادهها، تکنیکهای تجزیه و تحلیل خودکار مانند دادهکاوی بهطور گستردهای برای تصمیمگیری بهکار گرفته شده و بسیار مؤثر واقع شدهاند. از جمله تکنیکهای دادهکاوی میتوان به طبقهبندی اشاره کرد که یک روش رایج برای تصمیمگیری و پیشبینی است. الگوریتمهای طبقهبندی بهطور معمول بر روی مجموعه دادههای متوازن بهخوبی عمل میکنند. با وجود این، یکی از مشکلاتی که الگوریتمهای طبقهبندی با آن مواجه هستند، پیشبینی صحیح برچسب نمونههای جدید بر اساس یادگیری بر روی مجموعه دادههای نامتوازن است. در این نوع از مجموعه دادهها، توزیع ناهمگونی که دادهها در کلاسهای مختلف دارند باعث نادیده گرفتهشدن نمونههای کلاس با تعداد نمونه کمتر در یادگیری طبقهبند میشوند؛ در حالی که این کلاس در برخی مسائل پیشبینی دارای اهمیت بیشتری است. بهمنظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادلسازی مجموعه دادههای نامتوازن ارائه میشود که با متعادلنمودن تعداد نمونههای کلاسهای مختلف در مجموعه دادهای نامتوازن، پیشبینی صحیح برچسب کلاس نمونههای جدید توسط الگوریتم یادگیری ماشین را بهبود میبخشد. بر اساس ارزیابیهای صورتگرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقهبندی مجموعه دادههای نامتوازن به نامهای «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روشهای دیگر دارد. پرونده مقاله -
دسترسی آزاد مقاله
17 - ارائه یک سیستم توصیه گر وب برای پیش بینی صفحات مورد علاقه کاربر با استفاده از الگوریتم خوشه بندی DBSCAN و روش SVM یادگیری ماشین
رضا مولایی فرد محمد مصلحسیستمهای توصیه گر میتوانند درخواستهای آینده کاربر را پیشبینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. بهعبارتدیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیشبینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد چکیده کاملسیستمهای توصیه گر میتوانند درخواستهای آینده کاربر را پیشبینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. بهعبارتدیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیشبینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد کرد که این کار میتواند مشکل شروع سرد سیستم را حل و باعث کیفیت بخشیدن به جستجو شود. در این تحقیق به ارائه روش جدیدی بهمنظور بهبود سیستمهای توصیه گر در زمینه وب پرداخته میشود که از الگوریتم خوشهبندی DBSCAN جهت خوشهبندی دادهها استفاده میشود که این الگوریتم امتیاز کارایی ۹۹٪ را به دست آورد. سپس با استفاده از الگوریتم Page rank، صفحات موردعلاقه کاربر وزن دهی میشوند. سپس با استفاده از روش SVM، دادهها را دستهبندی و جهت تولید پیشبینی به کاربر به یک سیستم توصیه گر ترکیبی داده میدهیم که درنهایت این سیستم توصیه گر لیستی از صفحات را در اختیار کاربر قرار خواهد داد که میتواند موردعلاقه وی باشند. ارزیابی نتایج حاصل از تحقیق حاکی از آن بود که استفاده از این روش پیشنهادی میتواند امتیاز ۹۵% را در قسمت فراخوانی و امتیاز ۹۹% را در قسمت دقت به دست آورد که این نتایج اثبات میکند که این سیستم توصیه گر تا بیش از ۹۰٪ میتواند صفحات موردنظر کاربر را بهدرستی تشخیص داده و تا حدود زیادی نقاط ضعف سایر سیستم های پیشین را برطرف سازد. پرونده مقاله -
دسترسی آزاد مقاله
18 - تشخیص نفوذ و ناهنجاری ها با استفاده از داده کاوی و انتخاب ویژگی ها بوسیله الگوریتم PSO
فریدون رضائی محمدعلی افشار کاظمی محمد علی کرامتیامروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاریهای مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد چکیده کاملامروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاریهای مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد با استفاده از حملات سایبری به سایتها و فروشگاههای مجازی نفوذ کرده و در آنها اخلال ایجاد میکنند. آشکارسازی حملات و ناهنجاریها یکی از چالشهای جدید در مسیر پیشبرد تکنولوژی تجارت الکترونیک میباشد. تشخیص ناهنجاریهای یک شبکه و فرآیند شناسایی فعالیتهای مخرب در کسب و کارهای تجارت الکترونیک با تجزیه و تحلیل رفتار ترافیک شبکه امکانپذیر است. سیستمهای دادهکاوی بطور گستردهای در سیستمهای تشخیص نفوذ (IDS) برای تشخیص ناهنجاریها استفاده میشوند. کاهش ابعاد ویژگیها نقش بسیار مهمی در تشخیص نفوذ ایفا میکند، زیرا تشخیص ناهنجاریها از ویژگیهای ترافیک شبکه با ابعاد بالا فرآیندی زمانبری است. انتخاب ویژگیهای درست و مناسب بر سرعت تجزیه و تحلیل و کار پیشنهادی تاثیر میگذارد و میتواند سرعت تشخیص را بهبود بخشد. در این مقاله با استفاده از الگوریتمهای دادهکاوی مانند بیزین، پرسپترون چندلایه، CFS، Best First، J48 و PSO، میزان دقت تشخیص ناهنجاریها و حملات به 0.996 و میزان خطای آن 0.004 رسانده شده است. پرونده مقاله