• فهرست مقالات Decision Tree

      • دسترسی آزاد مقاله

        1 - تلفیق مدل تحلیل پوششی داده ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کار چکیده کامل
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی بهDMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - تلفیق مدل تحلیل پوششی داده¬ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی علی علی نژاد سمیه  شفقی زاده
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری ک چکیده کامل
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی به DMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - Membrane Cholesterol Prediction from Human Receptor using Rough Set based Mean-Shift Approach
        Rudra Kalyan Nayak Ramamani  Tripathy Hitesh  Mohapatra Amiya  Kumar Rath Debahuti  Mishra
        In human physiology, cholesterol plays an imperative part in membrane cells which regulates the function of G-protein-coupled receptors (GPCR) family. Cholesterol is an individual type of lipid structure and about 90 percent of cellular cholesterol is present at plasma چکیده کامل
        In human physiology, cholesterol plays an imperative part in membrane cells which regulates the function of G-protein-coupled receptors (GPCR) family. Cholesterol is an individual type of lipid structure and about 90 percent of cellular cholesterol is present at plasma membrane region. Cholesterol Recognition/interaction Amino acid Consensus (CRAC) sequence, generally referred as the CRAC (L/V)-X1−5-(Y)-X1−5-(K/R) and the new cholesterol-binding domain is similar to the CRAC sequence, but exhibits the inverse orientation along the polypeptide chain i.e. CARC (K/R)-X1−5-(Y/F)-X1−5-(L/V). GPCR is treated as a biggest super family in human physiology and probably more than 900 protein genes included in this family. Among all membrane proteins GPCR is responsible for novel drug discovery in all pharmaceuticals industry. In earlier researches the researchers did not find the required number of valid motifs in terms of helices and motif types so they were lacking clinical relevance. The research gap here is that they were not able to predict the motifs effectively which are belonging to multiple motif types. To find out better motif sequences from human GPCR, we explored a hybrid computational model consisting of hybridization of Rough Set with Mean-Shift algorithm. In this paper we made comparison among our resulted output with other techniques such as fuzzy C-means (FCM), FCM with spectral clustering and we concluded that our proposed method targeted well on CRAC region in comparison to CARC region which have higher biological relevance in medicine industry and drug discovery. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - ساخت درخت ‌تصمیم مقیاس‌پذیر مبتنی بر تقسیم سریع داده‌ها و پیش‌هرس
        سميه لطفي محمد قاسم زاده مهران محسن زاده ميترا ميرزارضايي
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. چکیده کامل
        دسته‌بندی، یکی از وظایف مهم داده‌کاوی و یادگیری ماشین است و درخت تصمیم به ‌عنوان یکی از الگوریتم‌های پرکاربرد دسته‌بندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با داده‌های حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیت‌های حافظه و زمان اجرا مواجه‌ است. الگوريتم‌هاي ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتم‌هایی که به علت انتخاب زیرمجموعه‌ای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف‌ می‌کنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاس‌پذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی‌ مجموعه داده‌های حجیم ارائه شده است. الگوریتم ارائه‌شده درخت تصمیم را با استفاده از کل مجموعه داده‌ آموزش اما بدون نیاز به ذخیره‌سازی داده در حافظه اصلی می‌سازد. همچنین جهت کاهش پیچیدگی درخت از روش پیش‌هرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه داده‌های UCI نشان می‌دهد الگوریتم ارائه‌شده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتم‌ها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - راهکاری مبتنی بر ساخت درخت دودویی تقریبی برای سرعت‌بخشیدن به جستجوی نزدیک‌ترین همسایگی در داده‌های حجیم
        حسین کلاته نگین دانشپور
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات ط چکیده کامل
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات طبقه‌بندی داده‌های حجیم بسیار کند است. نزدیک‌ترین همسایگی به دلیل سادگی و دقت عملی که ارائه می‌دهد یک روش محبوب در زمینه طبقه‌بندی داده‌ها می‌باشد. روش پیشنهادی مبتنی بر مرتب‌سازی بردارهای ویژگی داده‌های آموزشی در یک درخت جستجوی دودویی است تا طبقه‌بندی داده‌های بزرگ را با استفاده از روش نزدیک‌ترین همسایگی تسریع بخشد. این کار با استفاده از یافتن تقریبی دو دورترین داده محلی در هر گره درخت انجام می‌شود. این دو داده به عنوان معیار برای تقسیم داده‌های موجود در گره فعلی بین دو گروه، مورد استفاده قرار می‌گیرند. مجموعه داده‌های موجود در هر گره بر اساس شباهت آنها به این دو داده، به فرزند چپ یا راست گره فعلی تخصیص داده می‌شوند. نتایج آزمایش‌های متعدد انجام‌شده بر روی مجموعه داده‌های مختلف از مخزن UCI، میزان دقت خوب با توجه به زمان اجرای کم روش پیشنهادی را نشان می‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - ارائه یک روش جامع برای تعیین ضریب اهمیت عوامل زمین شناسی،محیط زیست واقتصادی برای بکار گیری فناوری چاه نفتی هوشمند
        تورج بهروز سید مهدیا مطهری مهدی ندری پری
        مخازن نفتی در اعماق چند هزار متری سطح زمین واقع شده وبا شرایط دمایی وفشاری بالا ، به لحاظ پارامتر های زمین شناسی به شدت ناهمگن است .مدیریت مخازن نفتی شامل تلفیق فناوری ،نیروی انسانی وفرایند ها به گونه ای است که منجر به حداکثر تولید وبازیافت از مخزن در کنار حداقل شدن هز چکیده کامل
        مخازن نفتی در اعماق چند هزار متری سطح زمین واقع شده وبا شرایط دمایی وفشاری بالا ، به لحاظ پارامتر های زمین شناسی به شدت ناهمگن است .مدیریت مخازن نفتی شامل تلفیق فناوری ،نیروی انسانی وفرایند ها به گونه ای است که منجر به حداکثر تولید وبازیافت از مخزن در کنار حداقل شدن هزینه های سرمایه ای وعملیاتی شود .یکی از فناوری های جدید در حوزه مدیریت مخازن که از آن به عنوان نسل آینده مخازن نفتی یاد می شود ،فناوری چاه هوشمند است .این فناوری اخیراً مورد توجه اکثر شرکت های بزرگ نفتی قرار گرفته است .این تکنولوژی با استفاده از کاهش هزینه های عملیاتی وسرمایه گذاری ،شتاب دهی به روند تولید ،امکان تولید آمیخته وهم زمان وامکان افزایش بازیافت نهائی از مخازن سبب بهبود مدیریت مخازن می شود . تعداد پارامتر های توصیف کننده مخزن نفتی وروابط غیر خطی پیچیده بین آن ها منجر به ایجاد محیط ناهمگنی می شود که با توجه به ابعاد بزرگ مخزن ودر دسترس نبودن آن به شدت با عدم قطعیت همراه است .این شرایط ریسک سرمایه گذاری های هنگفت برای توسعه مخزن نفتی با استفاده از فناوری چاه هوشمند را تشدید می کند .از این رو ضروری است که با توجه به ارزش افزوده ناشی از به کار گیری این فناوری در مخازن نفتی ومحدودیت منابع مالی وتجهیزات هوشمندی ، اولویت بندی دارائی ها(مخازن هیدرو کربوری )برای استفاده از این فناوری انجام شود .با توجه به این نیاز در این مقاله با استفاده از یک روش جدید وطراحی یک جعبه ابزار تصمیم گیری چند معیاره ،مخازن نفتی جهت بکار گیری این فناوری غربا لگری می شوند عمده ابزار های مراحل مختلف ،نظریات کار شناسی کارشناسان مبتنی بر تجربیات ومطالعات خویش واستفاده از روش های تحلیل سلسله مراتبی می باشد .در این مقاله پارامتر های اصلی فنی ،زمین شناسی ،اقتصادی ،زیست محیطی وجغرافیائی استخراج وبا توجه به اهمیت هر کدام در بهبود تابع هدف وزن دهی می شوند .این روش شامل مراحلی نظیر ساخت سلسله مراتبی ،مقایسه های زوجی پارامتر ها،ترکیب وزن ها،تحلیل حساسیت ورتبه بندی /اولویت بندی میباشد .که خروجی این مطالعات ،استخراج وارائه پارامتر های موثر زیست محیطی ،جغرافیائی ،فنی واقتصادی در غربالگری مخازن ودر صد سهم وزنی هرکدام نسبت به دیگران وجعبه ابزار تصمیم گیری چند معیاره می باشد . پرونده مقاله
      • دسترسی آزاد مقاله

        7 - الگوریتم هوشمند پیش‌بینی ناپایداری گذرای ناحیه گسترده زاویه روتور مبتنی بر تئوری درخت تصمیم 0. 5C و سیگنال‌های سراسری
        سهیل رنجبر
        در این مقاله، طرح حفاظتی هوشمند به‌منظور پیش‌بینی برخط ناپایداری گذرای ناحیه گسترده در سیستم‌های قدرت بر اساس تئوری درخت تصمیم معرفی می‌شود. برای این منظور با بررسی نوسان توان شبکه و شرایط معادلات دینامیک ژنراتور سنکرون در دو حالت پایدار و شرایط خروج از همگامی، شاخص‌های چکیده کامل
        در این مقاله، طرح حفاظتی هوشمند به‌منظور پیش‌بینی برخط ناپایداری گذرای ناحیه گسترده در سیستم‌های قدرت بر اساس تئوری درخت تصمیم معرفی می‌شود. برای این منظور با بررسی نوسان توان شبکه و شرایط معادلات دینامیک ژنراتور سنکرون در دو حالت پایدار و شرایط خروج از همگامی، شاخص‌های برخط مبتنی بر واحدهای اندازه‌گیری فازوری معرفی و تحت شرایط متفاوت بهره‌برداری و توپولوژیکی شبکه در زمان‌های وقوع خطا و برطرف‌شدن خطا به‌منظور عملکرد سریع طرح پیشنهادی اندازه‌گیری می‌شوند. در ادامه، شاخص‌های پیشنهادی به‌صورت جفت‌داده ورودی- خروجی برای آموزش درخت تصمیم در محیط برون‌خط مورد استفاده قرار می‌گیرند. نمونه‌های آموزشی شامل یک سری اندازه‌گیری‌ها تحت خطاهای متفاوت شامل نوع و مکان خطا هستند. توانایی حفاظتی طرح پیشنهادی بر روی یک شبکه 39باسه با پتانسیل ناپایداری گذرای ناحیه گسترده ژنراتورهای سنکرون، پیاده‌سازی و عملکرد درخت تصمیم تحت سناریوهای از پیش آموزش داده‌نشده صحت‌سنجی می‌شود. نتایج شبیه‌سازی نشان‌دهنده توانایی طرح پیشنهادی درخت تصمیم در زمینه پیش‌بینی صحیح خروج از همگامی ناحیه گسترده سیستم قدرت تحت طیف وسیعی از شرایط دینامبک شبکه است. پرونده مقاله
      • دسترسی آزاد مقاله

        8 - تشخیص خودکار بیماری های ریوی با استفاده از ویژگی های مبتنی بر تبدیل کسینوسی گسسته در تصاویر رادیوگرافی
        شمیم یوسفی صمد نجارقابل
        استفاده از نتایج خام رادیوگرافي در تشخیص بیماريهاي ریوي عملکرد قابلقبولي ندارد. یادگیري ماشین ميتواند به تشخیص دقیقتر بیماريها کمک کند. مطالعات گستردهاي در حوزه تشخیص خودکار بیماريها با کمک یادگیري ماشین کلاسیک و عمیق انجام شده؛ اما این روشها دقت و کارایي قابلقبولي ندار چکیده کامل
        استفاده از نتایج خام رادیوگرافي در تشخیص بیماريهاي ریوي عملکرد قابلقبولي ندارد. یادگیري ماشین ميتواند به تشخیص دقیقتر بیماريها کمک کند. مطالعات گستردهاي در حوزه تشخیص خودکار بیماريها با کمک یادگیري ماشین کلاسیک و عمیق انجام شده؛ اما این روشها دقت و کارایي قابلقبولي ندارند یا به دادههاي یادگیري زیادي نیاز دارند. براي مقابله با این چالشها، در این مقاله، روش جدیدي براي تشخیص خودکار بیماريهاي ریوي بینابیني در تصاویر رادیوگرافي ارائه ميشود. در گام اول، اطلاعات بیمار از تصاویر حذف شده؛ سپس، پیکسلهاي باقیمانده، جهت پردازشهاي دقیقتر، استانداردسازي ميشوند. در گام دوم، پایایي روش پیشنهادي با کمک تبدیل رادان بهبود یافته، دادههاي اضافي با استفاده از فیلتر Top-hat حذف شده و نرخ تشخیص با بهرهبرداري از تبدیل موجک گسسته و تبدیل کسینوسي گسسته افزایش ميیابد. سپس، تعداد ویژگيهاي نهایي با کمک آنالیز تشخیصي حساس به مکان کاهش ميیابد. در گام سوم، تصاویر پردازششده به دو دسته یادگیري و تست تقسیم ميشوند؛ با استفاده از دادههاي یادگیري، مدلهاي مختلفي ایجاد شده و با کمک دادههاي تست، بهترین مدل انتخاب ميشود. نتایج شبیهسازيها بر روي مجموعه داده NIH نشان ميدهد که روش پیشنهادي مبتني بر درخت تصمیم با بهبود میانگین هارمونیک حساسیت و صحت تا 08 / 1 برابر، دقیقترین مدل را ارائه ميدهد. پرونده مقاله
      • دسترسی آزاد مقاله

        9 - ارائه مدلی برای پیش بینی بقای بیماران مبتلا به ملانوم بر اساس الگوریتم های داده کاوی
        فریناز صناعی سید عبدالله امین موسوی عباس طلوعی اشلقی علی  رجب زاده قطری
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق ب چکیده کامل
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق برآوردهاي انجمن سرطان آمریکا براي ملانوم در ایالاتمتحده براي سال 2022 عبارتاند از: حدود 99،780 ز افراد مبتلابه ملانوم تشخیص داده شدند و حدود 7،650 نفر در اثر ملانوم جان خود را از دست ميدهند. لذا هدف از این مطالعه، طراحي بهبود دقت الگوریتم براي پیش بیني بقاي این بیماران است. روش پژوهش: روش حاضر کاربردي، توصیفي- تحلیلي و گذشتهنگر است. جامعه پژوهش را بیماران مبتلابه سرطان ملانوم پایگاه داده مرکز تحقیقات کشوري سرطان دانشگاه شهید بهشتي ) 1۳87 تا 1۳91 ( که تا 5 سال مورد پیگیري قرارگرفته بودند، تشکیل داده است. مدل پیشبیني بقاي ملانوم بر اساس شاخص هاي ارزیابي الگوریتم هاي داده کاوي انتخاب شد. یافته ها: الگوریتم هاي شبکه عصبي، بیز ساده، شبکه بیزي، ترکیب درخت تصمیم گیري با بیز ساده، رگرسیون لجستیک، J48 ، ID3 بهعنوان مدل هاي استفاده شده ي پایگاه داده کشور انتخاب شدند . عملکرد شبکه عصبي در همه شاخصهاي ارزیابي ازلحاظ آماري نسبت به سایر الگوریتم هاي منتخب بالاتر بود. نتیجه گیري: نتایج مطالعه حاضر نشان داد که شبکه عصبي با مقدار 97 / 0 ازلحاظ دقت پیش بیني عملکرد بهینه دارد. بنابراین مدل پیش بیني کننده بقاي ملانوم، هم ازلحاظ قدرت تمایز و هم ازلحاظ پایایي، عملکرد بهتري از خود نشان داد؛ بنابراین، این الگوریتم به عنوان مدل پیش بیني بقاي ملانوم پیشنهاد شد پرونده مقاله