• فهرس المقالات Big Data

      • حرية الوصول المقاله

        1 - راهکارانتخاب پایگاههای‌ داده مناسب برای داده‌های عظیم و الگوهای مهاجرت به آنها
        محمد رضا احمدی
        توسعه زیرساخت‌ها و برنامه‌های کاربردی بخصوص سرویس‌های همگانی در قالب رایانش ابری، الگوهای سنتی خدمات پایگاه‌ها‌‌ی داده و روش‌های ذخیره‌سازی آنها را با محدودیتها و چالش‌های جدی روبرو ساخته است. توسعه روز افزون ابزارهای مولد خدمات داده‌ای و لزوم ذخیره‌سازی نتایج پردازش ها أکثر
        توسعه زیرساخت‌ها و برنامه‌های کاربردی بخصوص سرویس‌های همگانی در قالب رایانش ابری، الگوهای سنتی خدمات پایگاه‌ها‌‌ی داده و روش‌های ذخیره‌سازی آنها را با محدودیتها و چالش‌های جدی روبرو ساخته است. توسعه روز افزون ابزارهای مولد خدمات داده‌ای و لزوم ذخیره‌سازی نتایج پردازش های بزرگ وگسترده حاصل از فعالیت‌های مختلف دولتی، خصوصی و شبکه‌های فراگیر اجتماعی، لزوم مهاجرت به پایگاه‌ها‌‌ی جدید داده با ویژگی‌های متفاوت را اجتناب ناپذیر کرده است. در مدلهای سنتی، داده‌های دیجیتال در سیستم های ذخیره‌سازی یا پایگاه داده مستقل ذخیره می‌شدند. ولی با گسترش و تغییر حجم و ترکیب داده‌ها و شکل‌گیری داده‌های عظیم،‌ عملکردها و الگوهای سنتی پاسخگوی نیازهای جدید نبوده و لزوم استفاده از سیستم‌های ذخیره‌سازی اطلاعات در قالب‌ها و مدل‌های بسیارگسترده‌تر را ضروری ساخته است. در این مقاله ابعاد ساختاری و کارکردهای مختلف پایگاه‌ها‌‌ی داده سنتی و سیستم‌های ذخیره‌سازی جدید مناسب برای داده‌های عظیم بررسی گردیده و راهکارهای فنی جهت مهاجرت از پایگاه‌های داده ساختاریافته سنتی به غیرساختار یافته در داده‌های عظیم ارائه می‌گردد. در پایان ویژگیهای بارز سیستم های ذخیره سازی توزیع شده با مدلهای سنتی مورد مقایسه قرار گرفته و عملکرد و کارایی کلی ارائه شده است. تفاصيل المقالة
      • حرية الوصول المقاله

        2 - Privacy Preserving Big Data Mining: Association Rule Hiding
        Golnar Assadat  Afzali شهریار  محمدی
        Data repositories contain sensitive information which must be protected from unauthorized access. Existing data mining techniques can be considered as a privacy threat to sensitive data. Association rule mining is one of the utmost data mining techniques which tries to أکثر
        Data repositories contain sensitive information which must be protected from unauthorized access. Existing data mining techniques can be considered as a privacy threat to sensitive data. Association rule mining is one of the utmost data mining techniques which tries to cover relationships between seemingly unrelated data in a data base.. Association rule hiding is a research area in privacy preserving data mining (PPDM) which addresses a solution for hiding sensitive rules within the data problem. Many researches have be done in this area, but most of them focus on reducing undesired side effect of deleting sensitive association rules in static databases. However, in the age of big data, we confront with dynamic data bases with new data entrance at any time. So, most of existing techniques would not be practical and must be updated in order to be appropriate for these huge volume data bases. In this paper, data anonymization technique is used for association rule hiding, while parallelization and scalability features are also embedded in the proposed model, in order to speed up big data mining process. In this way, instead of removing some instances of an existing important association rule, generalization is used to anonymize items in appropriate level. So, if necessary, we can update important association rules based on the new data entrances. We have conducted some experiments using three datasets in order to evaluate performance of the proposed model in comparison with Max-Min2 and HSCRIL. Experimental results show that the information loss of the proposed model is less than existing researches in this area and this model can be executed in a parallel manner for less execution time تفاصيل المقالة
      • حرية الوصول المقاله

        3 - A Novel Approach for Cluster Self-Optimization Using Big Data Analytics
        Abbas Mirzaei Amir Rahimi
        One of the current challenges in providing high bitrate services in next generation mobile networks is limitation of available resources. The goal of proposing a self-optimization model is to maximize the network efficiency and increase the quality of services provided أکثر
        One of the current challenges in providing high bitrate services in next generation mobile networks is limitation of available resources. The goal of proposing a self-optimization model is to maximize the network efficiency and increase the quality of services provided to femto-cell users, considering the limited resources in radio access networks. The basis for our proposed scheme is to introduce a self-optimization model based on neighbouring relations. Using this model, we can create the possibility of controlling resources and neighbouring parameters without the need of human manipulation and only based on the network’s intelligence. To increase the model efficiency, we applied the big data technique for analyzing data and increasing the accuracy of the decision-making process in a way that on the uplink, the sent data by users is to be analyzed in self-optimization engine. The experimental results show that despite the tremendous volume of the analyzed data – which is hundreds of times bigger than usual methods – it is possible to improve the KPIs, such as throughput, up to 30 percent by optimal resource allocation and reducing the signaling load. Also, the presence of feature extraction and parameter selection modules will reduce the response time of the self-optimization model up to 25 percent when the number of parameters is too high Moreover, numerical results indicate the superiority of using support vector machine (SVM) learning algorithm. It improves the accuracy level of decision making based on the rule-based expert system. Finally, uplink quality improvement and 15-percent increment of the coverage area under satisfied SINR conditions can be considered as outcome of the proposed scheme. تفاصيل المقالة
      • حرية الوصول المقاله

        4 - راهبرد مدیریت منابع انسانی در عصر دیجیتال با تکیه‌بر کلان داده
        غلامرضا ملک زاده صدیقه صادقی
        امروزه ابزارهای هوشمند، محیط‌های مجازی و خلاقیت‌های فناورانه، بخشی از زندگی همه انسان‌ها شده است. اگرچه این پیشرفت‌ها می‌تواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند می‌توانند از آن‌ها در فرصت‌های فراروی سازمان خود بهره‌برداری ک أکثر
        امروزه ابزارهای هوشمند، محیط‌های مجازی و خلاقیت‌های فناورانه، بخشی از زندگی همه انسان‌ها شده است. اگرچه این پیشرفت‌ها می‌تواند متضمن تهدیدهای بسیاری برای جامعه انسانی باشد، اما مدیران و رهبران خلاق و هوشمند می‌توانند از آن‌ها در فرصت‌های فراروی سازمان خود بهره‌برداری کنند. از سوی دیگر فراگیر شدن فناوری اطلاعات در سازمان‌ها از یک‌سو و گستردگی انواع شبکه‌های اجتماعی از سوی دیگر بستری برای جمع‌آوری حجم انبوهی از داده‌ها و اطلاعات مربوط به افراد را فراهم آورده است. با توجه به این حقایق می‌توان گفت تفکر خلاق و همسویی با جریان امکانات، نیازها و الزامات عصر امروز و آگاهی از ارزش مدیریت دانش و بکارگیری آن موضوعی است که به‌ویژه در رابطه با سرمایه‌های انسانی باید بیشتر موردتوجه قرار گیرد. تأثیر توجه به فلسفه وجودی سازمان در انعطاف‌پذیری و خلاقیت سرمایه‌های انسانی و نیز برخورداری از سواد بهره‌برداری بهینه از سامانه‌های اطلاعاتی از عمده‌ترین محورهای این موضوع است. با عنایت به این مهم که نسل جدیدی از افراد در شرف ورود به بازار کار هستند، در این مقاله با تکیه‌ بر پژوهش‌ها و مطالعات انجام‌ شده در سازمان‌های معتبری همچون مکنزی، بهره‌گیری از سامانه‌های اطلاعاتی به‌ویژه کلان داده در مدیریت منابع انسانی در حال حاضر و برای دهه پیش رو مورد بررسی قرار می‌گیرد. با توجه این واقعیت می‌توان انتظار داشت در حوزه مدیریت منابع انسانی، جایگزین کردن ساختارهای سنتی با نتایج تحلیلی حاصل از کلان داده‌های سامانه‌های اطلاعاتی تناسب بیشتری برای تعامل و مدیریت نسل کاری آتی خواهد داشت. تفاصيل المقالة
      • حرية الوصول المقاله

        5 - بررسی تطبیقی، کاربردها و چالش‌های فناوری‌های تحلیل بزرگ داده
        یاسر قاسمی نژاد سید عباسعلی کتابچی
        امروزه سازمان‌ها، با به‌کارگیری فناوری بزرگ داده‌، از طریق دریافت و به اشتراک‌گذاری ساده‌تر و ارزان‌تر اطلاعات، قادر به اداره حجم زیادی داده‌ها، با سرعت و تنوع زیاد شده‌اند. فناوری داده‌های عظیم، در صورت حل صحیح مشکلات مرتبط، فرصت‌های زیادی را فراهم می‌کنند. فناوری‌های أکثر
        امروزه سازمان‌ها، با به‌کارگیری فناوری بزرگ داده‌، از طریق دریافت و به اشتراک‌گذاری ساده‌تر و ارزان‌تر اطلاعات، قادر به اداره حجم زیادی داده‌ها، با سرعت و تنوع زیاد شده‌اند. فناوری داده‌های عظیم، در صورت حل صحیح مشکلات مرتبط، فرصت‌های زیادی را فراهم می‌کنند. فناوری‌های گذشته، در پردازش داده‌های موجود برای مواجهه با مقادیر زیاد داده‌های تولید شده، مناسب نیستند. درصورتیکه قالب‌های پیشنهادی برای کاربردهای بزرگ داده، به ذخیره، تجزیه و تحلیل و پردازش داده‌های عظیم کمک می‌کنند. در این تحقیق، ابتدا تعاریف و چالش‌های بزرگ داده، بررسی شده و سپس تعدادی از چارچوب‌های بزرگ دادۀ موجود ( هادوپ، فلینک، استورم، اسپارک و سمزا)، مورد مطالعه و مقایسه تطبیقی قرار گرفته است. چارچوب بزرگ داده‌های مورد مطالعه، به طور کلی در دو دسته طبقه‌بندی می‌شود: (۱) حالت دسته‌ای و (۲) حالت جریانی.‌ چارچوب ‌ هادوپ،‌ داده‌ها را در حالت دسته‌ای پردازش می‌کند، در حالی که چارچوب‌های دیگر، اجازۀ پردازش جریانی یا بلادرنگ را می‌دهند. نهایتاً مهم‌ترین کاربردهای فناوری بزرگ داده تشریح شده است. مهم‌ترین کاربردهای تحلیل بزرگ داده عبارتند از: کاربردهای برنامه‌های بهداشتی، سیستم‌های توصیه‌گر، شهر هوشمند و تحلیل شبکه‌های اجتماعی. با توجه به رشد دستگاه‌‌ها‌ی متصل به اینترنت، داده‌‌ها‌ی شبکه‌های اجتماعی به طور گسترده در حال رشد بوده و نیاز بیشتری به فناوری بزرگ داده دارند. همچنین مهم‌ترین چالش‌های کاربرد بزرگ داده‌ها، شامل محرمانگی در سیستم‌های ذخیره‌سازی، كمبودهاي نرم‌افزاري و محدوديت ابزارها و امكانات سخت‌افزاری موجود، لزوم سرمايه‌گذاري بزرگ اوليه و فقدان مهارت‌هاي تكنيكي و نيروي كار خبره می‌باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        6 - کلان‌داده‌های مبتنی بر اینترنت‌اشیاء از چشم‌انداز کشاورزی هوشمند
        بهاره جمشیدی حسین دهقانی سانیج
        اینترنت اشیاء یک فناوری نوظهورِ مرتبط با اینترنت است که به جای تمرکز بر ارتباط بین افراد، بر ارتباط بین اشیاء تمرکز دارد. ظهور راه‌کارهای هوشمند و فناوری‌های جدید اینترنت‌اشیاء در کشاورزی با ایجاد تغییر بنیادی در همه وجوه شیوه‌های جاری، بسترساز توسعه الگوی جدیدی در کشاو أکثر
        اینترنت اشیاء یک فناوری نوظهورِ مرتبط با اینترنت است که به جای تمرکز بر ارتباط بین افراد، بر ارتباط بین اشیاء تمرکز دارد. ظهور راه‌کارهای هوشمند و فناوری‌های جدید اینترنت‌اشیاء در کشاورزی با ایجاد تغییر بنیادی در همه وجوه شیوه‌های جاری، بسترساز توسعه الگوی جدیدی در کشاورزی به نام کشاورزی هوشمند شده است. کشاورزی هوشمند مبتنی بر اینترنت‌اشیاء سبب بهبود بهره‌وری کشاورزی با تولید بیشینه غذا از طریق استفاده بهینه از منابع پایه، کمینه‌کردن اثرات محیطی، کاهش هزینه‌ها و افزایش درآمد با ارتباط به بازار کسب و کار خواهد شد که دستیابی به اهداف توسعه‌پایدار کشاورزی را تسهیل می‌کند. داده‌های مبتنی بر اینترنت‌اشیاء، کلان‌داده هستند. در این مقاله فناوری‌های اینترنت‌اشیاء و کلان‌داده معرفی شده است. همچنین با هدف کمک به تصمیم‌گیری راهبرد از مرحله پیش از تولید تا بازاریابی کسب‌ وکارها در کشور، چرخه عمر و روند این فناوری‌ها بررسی و تحلیل شده است. براساس Google Trends، محبوبیت جهانی این فناوری‌ها نیز بررسی و تحلیل و ارتباط بین آنها از چشم‌انداز کشاورزی هوشمند ارائه شده است. همچنین در این مقاله، کاربردهای کلان‌داده‌های مبتنی بر اینترنت‌اشیاء در چرخه‌ کشاورزی هوشمند بر پایه مطالعه مروری و تحلیل موضوعی پژوهش‌های اجراشده، معرفی شده‌اند. طبق یافته‌ها‌، کاربرد فناوری‌های اینترنت‌اشیاء و کلان‌داده در کشاورزی و کسب و کارهای مرتبط رو به افزایش است و می‌توان پیش‌بینی کرد که آیندة کشاورزی بهینه در جهان برای پاسخگویی به نیاز غذایی و پایداری در تولید بدون یکپارچگی این فناوری‌ها و هوشمندسازی کشاورزی امکان‌پذیر نباشد. کاربردهای کلان‌داده‌های مبتنی بر اینترنت‌اشیاء در دسته‌بندی چرخه کشاورزی هوشمند شامل سنجش و پایش هوشمند شرایط محیطی، تجزیه و تحلیل و برنامه‌ریزی هوشمند، کنترل هوشمند، و استفاده در فضاهای ابری قرار می‌گیرند. تفاصيل المقالة
      • حرية الوصول المقاله

        7 - نقش مدیریت کلان داده در بهبود تصمیم‌گیری سازمان‌های بانکی (مورد مطالعه بانک سپه)
        یاسر قاسمی نژاد پیمان حاجی زاده حامد  کردی
        در سالهاي اخیر، اندازه داده‌ها در جهان به طور چشم‌گیري به صورت نمایی به چندین برابر افزایش پیدا کرده است. بانک‌ها نیز در فرایندهای خود مقادیر زیادی داده ایجاد و گاه هزینه‌های گزافی برای جمع‌آوری و نگهداری آن‌ها صرف می‌کنند. برخی از کارشناسان صنعت بانکی رشد هفت برابری حج أکثر
        در سالهاي اخیر، اندازه داده‌ها در جهان به طور چشم‌گیري به صورت نمایی به چندین برابر افزایش پیدا کرده است. بانک‌ها نیز در فرایندهای خود مقادیر زیادی داده ایجاد و گاه هزینه‌های گزافی برای جمع‌آوری و نگهداری آن‌ها صرف می‌کنند. برخی از کارشناسان صنعت بانکی رشد هفت برابری حجم موجود داده‌ها را تا سال ۲۰۲۰ برآورد می‌کنند. امروزه فناوری کلان‌داده به ‌عنوان راه‌حلی برای بهره‌برداری و استفاده این حجم از اطلاعات مطرح است. اما بررسی و پردازش داده‌های بزرگ و نیز بررسی اثربخشی به کارگیری آن در حوزه بانکداری به عنوان یک چالش تلقی می‌گردد. از این رو، در این تحقیق به بررسی نقش مدیریت کلان داده در بهبود تصمیم گیری سازمان های بانکی (مطالعه موردی بانک سپه) پرداخته شد. بدین منظور جامعه آماری این تحقیق شامل 130 نفر از کلیه کارشناسان بخش اداره فناوری اطلاعات بانک سپه میباشد که به دلیل محدودیت جامعه آماری نمونه‌گیری صورت نگرفت. پرسشنامه‌های استاندارد مدیریت کلان داده 20 گویه‌ای، پرسشنامه توانمندسازی بهبود تصمیم‌گیری 22 گویه‌ای و پرسشنامه کیفیت تصمیم‌گیری10 گویه‌ای با استناد بر تحقیقات شمیم و همکاران (2019)، بعد از بومی‌سازی مبنای تحقیق قرار گرفت. نتایج توصیفی و استنباطی داده‌های پژوهش با استفاده از نرم‌افزار 19SPSS وPLS ، مورد بررسی و تحلیل قرار گرفت. نتایج تحقیق، حاکی از آن بوده است که فرهنگ سازمانی با ضریب 0.446 بیشترین رابطه مثبت و معناداری را بر توانمندسازی دارد. همچنین توانمندسازی رابطه مثبت و معنادار با ضریب 0.645 با اثربخشی تصمیم گیری و ضریب 0.884 با کارایی تصمیم‌گیری دارد. تفاصيل المقالة
      • حرية الوصول المقاله

        8 - راهکاری توزیع‌شده برای خوشه‌بندی کلان‌داده‌های ترکیبی
        محسن محمودی نگین دانشپور
        با توجه به سرعت روزافزون تولید اطلاعات و همچنین وجود نیازمندی تبدیل اطلاعات به دانش، نیاز به الگوریتم‌های داده‌کاوی به شدت لمس می‌شود. خوشه‌بندی یکی از تکنیک‌های داده‌کاوی است و توسعه آن سبب پیشرفت در جهت فهم بیشتر محیط پیرامون می‌شود. در این مقاله، راهکاری پویا و مقیاس أکثر
        با توجه به سرعت روزافزون تولید اطلاعات و همچنین وجود نیازمندی تبدیل اطلاعات به دانش، نیاز به الگوریتم‌های داده‌کاوی به شدت لمس می‌شود. خوشه‌بندی یکی از تکنیک‌های داده‌کاوی است و توسعه آن سبب پیشرفت در جهت فهم بیشتر محیط پیرامون می‌شود. در این مقاله، راهکاری پویا و مقیاس‌پذیر برای خوشه‌بندی داده‌های ترکیبی با ابعاد کلان به همراه نقصان در داده‌ها ارائه گردیده است. به علت هدف‌گذاری حوزه کلان‌داده‌ها، راهکار پیشنهادی به صورت توزیع‌شده، داده‌ها را پردازش می‌کند. در این راهکار از ادغام معیارهای فاصله رایج با مفهوم نزدیک‌ترین همسایگی مشترک و همچنین به کارگیری نوعی از کدگذاری هندسی بهره برده شده است. همچنین روشی برای ترمیم داده‌های از دست رفته در مجموعه داده نیز در آن در نظر گرفته شده است. با بهره‌گیری از تکنیک‌های موازی‌سازی و توزیع پردازش فی‌‌مابین گره‌های متعدد می‌توان به مقیاس‌پذیری و تسریع دست یافت. الگوریتم پیشنهادی نیزاز این روش‌ها به جهت دستیابی به این مهم بهره‌ می‌برد. ارزیابی این راهکار بر اساس معیارهای سرعت، دقت و حافظه مصرفی با مقایسه با دیگر موارد انجام می‌شود. تفاصيل المقالة
      • حرية الوصول المقاله

        9 - رایانش سریع از طریق ارتقای جنگل تصادفی با استفاده از دو تکنیک فشرده‌سازی و موازی‌سازی
        نعیمه محمدکریمی محمد قاسم زاده مهدی یزدیان دهکردی امین نظارات
        در این پژوهش به دنبال ارتقای یکی از الگوریتم‌های کارامد در یادگیری ماشین، به نام جنگل تصادفی هستیم. برای این منظور از تکنیک‌های فشرده‌سازی و موازی‌سازی بهره می‌بریم. چالش اساسی مورد توجه در این پژوهش، در رابطه با به کارگیری جنگل تصادفی در پردازش و تحلیل داده‌های حجیم می أکثر
        در این پژوهش به دنبال ارتقای یکی از الگوریتم‌های کارامد در یادگیری ماشین، به نام جنگل تصادفی هستیم. برای این منظور از تکنیک‌های فشرده‌سازی و موازی‌سازی بهره می‌بریم. چالش اساسی مورد توجه در این پژوهش، در رابطه با به کارگیری جنگل تصادفی در پردازش و تحلیل داده‌های حجیم می‌باشد. در چنین مواردی، این الگوریتم به دلیل مراجعات پرشمار به حافظه، کارایی معمول و مورد نیاز را ندارد. این پژوهش نشان می‌دهد که چگونه می‌توان با به کارگیری یک شیوه فشرده‌سازی ابتکاری، در کنار تکنیک‌های موازی‌سازی به هدف مورد نظر دست یافت. در این رابطه، اجزای مشترک درختان در جنگل تصادفی با یکدیگر به اشتراک گذاشته می‌شوند. علاوه بر این، روش موازی‌سازی مبتنی بر دستورات برداری‌سازی به همراه روش موازی‌سازی مبتنی بر حافظه اشتراکی در جریان پردازش داده‌ها به کار می‌روند. به منظور ارزیابی عملکرد روش پیشنهادی، آن را بر روی مجموعه داده‌های محک Kaggle که در رقابت‌های مربوط به الگوریتم‌های یادگیری به وفور به کار می‌روند، اجرا نمودیم. نتایج به‌دست‌آمده حاکی از آن است که به کارگیری روش فشرده‌سازی پیشنهادی، 66 درصد بهبود در سرعت پردازش داده‌ها به دنبال داشته است. همچنین به کارگیری فشرده‌سازی به همراه موازی‌سازی یادشده، 96 درصد بهبود را به همراه داشته است. به طور کلی نتایج آزمایشی و تحلیل‌ها دلالت بر این دارند که راهکارهای پیشنهادی، قدمی مؤثر در راستای رسیدن به رایانش سریع برای جنگل تصادفی در اختیار می‌گذارد. تفاصيل المقالة
      • حرية الوصول المقاله

        10 - راهکاری مبتنی بر ساخت درخت دودویی تقریبی برای سرعت‌بخشیدن به جستجوی نزدیک‌ترین همسایگی در داده‌های حجیم
        حسین کلاته نگین دانشپور
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات ط أکثر
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات طبقه‌بندی داده‌های حجیم بسیار کند است. نزدیک‌ترین همسایگی به دلیل سادگی و دقت عملی که ارائه می‌دهد یک روش محبوب در زمینه طبقه‌بندی داده‌ها می‌باشد. روش پیشنهادی مبتنی بر مرتب‌سازی بردارهای ویژگی داده‌های آموزشی در یک درخت جستجوی دودویی است تا طبقه‌بندی داده‌های بزرگ را با استفاده از روش نزدیک‌ترین همسایگی تسریع بخشد. این کار با استفاده از یافتن تقریبی دو دورترین داده محلی در هر گره درخت انجام می‌شود. این دو داده به عنوان معیار برای تقسیم داده‌های موجود در گره فعلی بین دو گروه، مورد استفاده قرار می‌گیرند. مجموعه داده‌های موجود در هر گره بر اساس شباهت آنها به این دو داده، به فرزند چپ یا راست گره فعلی تخصیص داده می‌شوند. نتایج آزمایش‌های متعدد انجام‌شده بر روی مجموعه داده‌های مختلف از مخزن UCI، میزان دقت خوب با توجه به زمان اجرای کم روش پیشنهادی را نشان می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        11 - خوشه‌بندی مدیران صنعت گاز ایران و اولویت‌بندی شایستگی‌های مدیران مبتنی بر نتایج ارزیابی مدل تعالی سازمانی با رویکرد هوش مصنوعی
        علی رضا زمانیان مجید جهانگیرفرد فرشاد حاج علیان
        در این مقاله تلاش شده تا بسترسازی مناسبی در جهت ایجاد رابطه بین داده های منابع انسانی به عنوان کلان داده و هوش مصنوعی ایجاد شود و با استفاده از نتایج مدل تعالی سازمان در صنعت بزرگ گاز ایران و برای حدود 51 شرکت، به یک مدل برای خوشه بندی مدیران موفق منابع انسانی سازمان بر أکثر
        در این مقاله تلاش شده تا بسترسازی مناسبی در جهت ایجاد رابطه بین داده های منابع انسانی به عنوان کلان داده و هوش مصنوعی ایجاد شود و با استفاده از نتایج مدل تعالی سازمان در صنعت بزرگ گاز ایران و برای حدود 51 شرکت، به یک مدل برای خوشه بندی مدیران موفق منابع انسانی سازمان بر اساس نتایج ارزیابی شرکت ها با مدل تعالی سازمانی (EFQM) دست یابیم. در این مقاله تلاش شده تا بسترسازی مناسبی در جهت ایجاد رابطه بین داده های منابع انسانی با استفاده از نتایج مدل تعالی سازمانی، برای حدود 51 شرکت فرعی و ستادی شرکت ملی گاز ایران با بهره گیری از روش های هوش مصنوعی و یادگیری ماشین صورت پذیرد و به یک مدل برای خوشه بندی مدیران ارشد سازمان براساس نتایج ارزیابی شرکت ها با مدل تعالی سازمانی (مبتنی بر مدل تعالی EFQM) دست یابیم. ویژگی منحصربه فرد این روش این است که براساس خروجی و عملکرد واقعی سازمان های موفق به دست می آید که در رأس آن ها مدیران و رهبران موفق سازمان حضور داشته اند و براساس آن در آینده می توان به یک مدل شایستگی مبتنی بر عملکرد دست یافت. در این مقاله ابتدا بر اساس نتایج حاصل از ارزیابی مدل تعالی سازمان، به خوشه بندی نتایج مدل تعالی در 51 شرکت صنعت گاز ایران بر اساس نتایج ارزیابی های سال های 1396، 1397 و 1398 اقدام می کنیم. خوشه بندی برای 3776 داده با روش های مبتنی بر هوش مصنوعی و کدنویسی با نرم افزار پایتون صورت می گیرد. تحقیق حاضر از لحاظ هدف کاربردی بوده و به دنبال طراحی و تدوین یک مدل جدید برای کشف خبرگان و دسته بندی علمی منابع انسانی سازمان بر اساس داده های معتبر می باشد. این پژوهش همچنین به دنبال تلفیق مباحث جدید علمی هوش مصنوعی شامل خوشه بندی در ایجاد زیرساخت های پژوهشی در منابع انسانی است و در بعد کاربردی از نتایج به دست آمده در تصمیم گیری و برنامه ریزی های سازمانی استفاده می کند و به دنبال تولید ابزاری است که با آن بتواند در آینده با داشتن داده های مناسب در حرفه منابع انسانی، عملکرد مدیریتی کارکنان این حرفه و سازمان را پیش بینی نماید. در انتها با استفاده از نرخ تفکیک پذیری فیشر یک اولویت بندی برای آموزش و توسعه مدیران براساس شکاف شایستگی های ایشان بدست خواهد آمد. تفاصيل المقالة
      • حرية الوصول المقاله

        12 - ارائه راهكار نوين جهت انتخاب پايگاه‌هاي‌ داده مناسب برای ذخيره‌سازي کلان داده‌ها در خدمات شبکه ملی اطلاعات
        محمد رضا احمدی داود ملکی احسان آریانیان
        توسعه روزافزون ابزارهاي مولد خدمات داده‌اي و لزوم ذخيره‌سازي نتايج پردازش‌هاي بزرگ وگسترده حاصل از فعاليت‌هاي مختلف در خدمات شبکه ملی اطلاعات و داده‌های تولیدی بخش خصوصي و شبكه‌هاي فراگير اجتماعي، روند مهاجرت به پايگاه‌ها‌‌ي نوين با ويژگي‌هاي مناسب را اجتناب ناپذير كرده أکثر
        توسعه روزافزون ابزارهاي مولد خدمات داده‌اي و لزوم ذخيره‌سازي نتايج پردازش‌هاي بزرگ وگسترده حاصل از فعاليت‌هاي مختلف در خدمات شبکه ملی اطلاعات و داده‌های تولیدی بخش خصوصي و شبكه‌هاي فراگير اجتماعي، روند مهاجرت به پايگاه‌ها‌‌ي نوين با ويژگي‌هاي مناسب را اجتناب ناپذير كرده است. با گسترش و تغيير حجم و تركيب داده‌ها و شكل‌گيري کلان داده‌ها،‌ عملكردها و الگوهاي سنتي پاسخگوي نيازهاي جديد نيستند. بنابراين لزوم استفاده از سيستم‌هاي ذخيره‌سازي اطلاعات در قالب‌ها و مدل‌هاي نوین و مقیاس‌پذیر را ضروري ساخته است. در اين مقاله راهكارهاي اساسي در خصوص ابعاد ساختاري و كاركردهاي مختلف پايگاه‌ها‌‌ي داده سنتي و سيستم‌هاي ذخيره‌سازي نوين بررسي گرديده و راهكارهاي فني جهت مهاجرت از پايگاه‌هاي داده سنتي به نوین و مناسب برای کلان داده‌ها ارائه مي‌گردد. همچنین، ويژگي‌هاي اساسي در خصوص پيوند پايگاه‌هاي داده سنتي و نوين جهت ذخيره و پردازش داده‌هاي حاصل از خدمات فراگير شبکه ملی اطلاعات ارائه شده و پارامترها و قابليت‌های پايگاه‌های داده در بستر استاندارد و هدوپ بررسی شده است. علاوه بر آن، به عنوان یک نمونه عملیاتی یک راهکار ترکیب پایگاه داده سنتی و نوین با استفاده از روش BSC ارائه شده و مورد ارزیابی و مقایسه قرار گرفته است و نشان داده شده است كه در مجموعه داده‌های مختلف با حجم داده‌های متفاوت، استفاده ترکيبی از هر دو نوع پايگاه هاي داده سنتي و نوين مي تواند بيشترين کارايی را به همراه داشته باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        13 - بازاریابی داده محور در کسب و کارهای دیجیتال از دیدگاه قابلیت های پویا
        مائده  امینی ولاشانی ایوب محمدیان سید محمدباقر جعفری
        زمینه و هدف: علیرغم حجم بسیار زیاد داده و فوایدی که استفاده از آن می تواند برای فعالیت های بازاریابی داشته باشد، هنوز نحوه بکارگیری آن در ادبیات پژوهش بصورت روشن مشخص نبوده و مطالعات بسیار محدودی در این زمینه انجام گرفته است. در این راستا ﭘﮋوﻫﺶ ﺣﺎﺿﺮ با بهره گیری از نظری أکثر
        زمینه و هدف: علیرغم حجم بسیار زیاد داده و فوایدی که استفاده از آن می تواند برای فعالیت های بازاریابی داشته باشد، هنوز نحوه بکارگیری آن در ادبیات پژوهش بصورت روشن مشخص نبوده و مطالعات بسیار محدودی در این زمینه انجام گرفته است. در این راستا ﭘﮋوﻫﺶ ﺣﺎﺿﺮ با بهره گیری از نظریه قابلیت های پویا به شناسایی قابلیت های پویای بازاریابی داده محور به منظور محوریت دادن به داده در شکل گیری راهبردهای بازاریابی، انجام تصمیم گیری های اثربخش و بهبود کارایی در فرایندها و عملیات بازاریابی پرداخته است. روش‌شناسی: این پژوهش به روش ﮐﯿﻔﯽ و ﺑﺎ اﺳﺘﺮاﺗﮋي تحلیل مضمون و بهره گیری از ﻣﺼﺎﺣﺒﻪ با متخصصان این حوزه، اﻧﺠﺎم گرفته است. افراد مورد مطالعه ﭘﮋوﻫﺶ تعداد 18 متخصص حرفه ای در زمینه تحلیل داده و بازاریابی ﺑﻮده اﻧﺪ ﮐﻪ ﺑﺎ روش ﻧﻤﻮﻧﻪﮔﯿﺮي ﻫﺪﻓﻤﻨﺪ اﻧﺘﺨﺎب ﺷﺪه اﻧﺪ. یافته‌ها: ﯾﺎﻓﺘﻪﻫﺎي این مطالعه ﻧﺸﺎن می دهد قابلیت های پویای بازاریابی داده محور شامل؛ قابلیت جذب داده های بازاریابی، قابلیت تجمیع و تحلیل گری داده های بازاریابی، قابلیت تصمیم گیری داده محور، قابلیت بهبود تجربه داده محور با مشتری، قابلیت نوآوری داده محور، قابلیت شبکه سازی، قابلیت چابکی و قابلیت ایجاد تحول داده محور می باشند. نتیجه‌گیری: نتایج این مطالعه می تواند گامی در جهت تکامل تئوری قابلیت های پویا در حوزه بازاریابی با رویکرد داده محوری باشد. از این رو می تواند در آموزش و ایجاد قابلیت های جدید سازمانی به منظور بکارگیری کلان داده در فعالیت های بازاریابی سازمان ها و توسعه و بهبود محصولات و خدمات داده محور و بهبود تجربه مشتریان مورد استفاده قرار گیرد تفاصيل المقالة
      • حرية الوصول المقاله

        14 - خوشه بندی فازی چندهسته ای کلان داده ها در چارچوب نگاشت کاهش هدوپ
        سیدامید  آذرکسب سید حسین خواسته مصطفی امیری
        یک راهحل منطقي براي لحاظکردن همپوشاني خوشهها، انتساب مجموعهاي از درجه عضویت به هر داده است. بهدلیل کمشدن افرازها و کوچکشدن فضايجستجو، خوشهبندي فازي عموما داراي سربار محاسباتي کمتري بوده، تشخیص و مدیریت دادههاي مبهم، نویزدار و دادههايپرت نیز در آن بهسهولت انجام ميگیرد. ا أکثر
        یک راهحل منطقي براي لحاظکردن همپوشاني خوشهها، انتساب مجموعهاي از درجه عضویت به هر داده است. بهدلیل کمشدن افرازها و کوچکشدن فضايجستجو، خوشهبندي فازي عموما داراي سربار محاسباتي کمتري بوده، تشخیص و مدیریت دادههاي مبهم، نویزدار و دادههايپرت نیز در آن بهسهولت انجام ميگیرد. ازاینرو خوشهبندي فازي از نوع پیشرفته روشهاي خوشهبندي به شمار ميرود. اما روشهاي خوشهبندي فازي در مواجه با روابط غیرخطي دادهها ناتوانند. روش پیشنهادي این مقاله ميکوشد تا مبتني بر ایدههاي امکان پذیري، از یادگیري چندهستهاي در چارچوب نگاشتکاهش هدوپ براي تشخیص خوشههاي خطيجدایيناپذیر با ساختار کلاندادههاي پیچیده، استفاده کند. مدل یادگیري چندهستهاي قادر به کشف روابط پیچیده بین دادهاي بوده و در عین حال هدوپ ما را قادر خواهد ساخت تا به جاي تعامل با سیستم عامل و پردازنده، با یک کلاستر منطقي از پردازشها و گرههاي انباره داده تعامل داشته باشیم و عمده کار را بر عهده فریمورک بیندازیم. به طور خلاصه مدلسازي روابط غیرخطي دادهها با استفاده از مدل یادگیري چندهستهاي، تعیین مقادیر مناسب براي پارامترهاي فازيسازي و امکانپذیري، و ارائه الگوریتم در مدل نگاشتکاهش هدوپ از دستاوردهاي کلیدي مقاله حاضر ميباشد. آزمایشها برروي یکي از مجموعه دادههاي پر استفاده مخزن یادگیري UCI و همچنین برروي دیتاست شبیهساز CloudSim پیاده سازي شده است و نتایج قابل قبولي به دست آمده است. طبق مطالعات منتشر شده، مخزن یادگیري UCI براي مقاصد رگرسیون و خوشهبندي کلان داده، و مجموعه داده CloudSim براي شبیهسازي موارد مربوط به رایانش ابري، محاسبه تأخیرهاي زماني و زمانبندي انجام وظایف معرفي شدهاند. تفاصيل المقالة
      • حرية الوصول المقاله

        15 - مولفه های اصلی ارزیابی اعتبار کاربران با توجه به اهداف سازمانی در چرخۀ حیات کلان داده
        سوگند  دهقان شهریار  محمدی روجیار پیرمحمدیانی
        شبکههاي اجتماعي بهدلیل سرعت انتشار رویدادها و نیز حجم زیاد اطلاعات، به یکي از مهمترین منابع تصمیمگیري در سازمانها تبدیل شدهاند. ولي پیش از استفاده، صحت، قابلیت اطمینان و ارزش اطلاعات تولید شده توسط آنها، باید مورد ارزیابي قرار گیرد. به این منظور، بررسي اعتبار اطلاعات با أکثر
        شبکههاي اجتماعي بهدلیل سرعت انتشار رویدادها و نیز حجم زیاد اطلاعات، به یکي از مهمترین منابع تصمیمگیري در سازمانها تبدیل شدهاند. ولي پیش از استفاده، صحت، قابلیت اطمینان و ارزش اطلاعات تولید شده توسط آنها، باید مورد ارزیابي قرار گیرد. به این منظور، بررسي اعتبار اطلاعات با توجه به ویژگيهاي شبکههاي اجتماعي در سه سطح کاربر، محتوا و رویداد امکانپذیر ميباشد. سطح کاربر، قابل اطمینانترین سطح این حوزه ميباشد، زیرا کاربر معتبر، معمولا اقدام به انتشار محتواي معتبر مينماید. از این رو، ارزیابي سطح کاربر مورد توجه این پژوهش ميباشد. بیشتر مقالات مرتبط به حوزۀ ارزیابي اعتبار کاربران شبکههاي اجتماعي به ارزیابي اعتبار کاربران در حالت کلي پرداختهاند و از اهداف سازماني مانند ارزیابي اعتبار کاربران به منظور یافتن افراد خلاق چشم پوشي نمودهاند. همچنین چرخه حیات کلان داده و مولفههاي مهم در فرآیند ارزیابي اعتبار کاربران کمتر مورد توجه قرار گرفتهاند. از این رو، این تحقیق با بررسي 50 مقاله مهم در این حوزه، مولفههاي مهم را به سه مولفه اصلي )تعیین موضوع محتوا، انتخاب ویژگيها و ارزیابي اعتبار( دسته بندي مينماید و روشها و ویژگيهاي مربوط به هر یک را مورد بحث قرار ميدهد. نهایتا یک چارچوب اولیه ارزیابي اعتبار کاربران شبکههاي اجتماعي با توجه به اهداف سازماني و چرخه حیات کلان داده ارائه گردید. هدف این چارچوب، ارائه یک راهنما مناسب به سازمانها، براي محاسبۀ میزان اعتبار کاربران در فرآیند تصمیمگیري ميباشد. تفاصيل المقالة
      • حرية الوصول المقاله

        16 - راهكاری نوين در انتخاب پايگاه‌هاي‌ داده مناسب جهت ذخيره‌سازي کلان داده‌ها در شبکه ملی اطلاعات
        محمد رضا احمدی داود ملکی احسان آریانیان
        توسعه زيرساخت‌ها و برنامه‌هاي كاربردي به خصوص سرويس‌هاي همگاني در قالب رايانش ابري، الگوهاي سنتي خدمات پايگاه‌ها‌‌ي داده و روش‌هاي ذخيره‌سازي آنها را با محدوديت‌ها و چالش‌هاي جدي روبرو ساخته است. توسعه روزافزون ابزارهاي مولد خدمات داده‌اي و لزوم ذخيره‌سازي نتايج پردازش‌ أکثر
        توسعه زيرساخت‌ها و برنامه‌هاي كاربردي به خصوص سرويس‌هاي همگاني در قالب رايانش ابري، الگوهاي سنتي خدمات پايگاه‌ها‌‌ي داده و روش‌هاي ذخيره‌سازي آنها را با محدوديت‌ها و چالش‌هاي جدي روبرو ساخته است. توسعه روزافزون ابزارهاي مولد خدمات داده‌اي و لزوم ذخيره‌سازي نتايج پردازش‌هاي بزرگ وگسترده حاصل از فعاليت‌هاي مختلف در شبکه ملی اطلاعات و داده‌های تولیدی بخش خصوصي و شبكه‌هاي فراگير اجتماعي، روند مهاجرت به پايگاه‌ها‌‌ي داده نوين با ويژگي‌هاي مناسب را اجتناب‌ناپذير كرده است. با گسترش و تغيير حجم و تركيب داده‌ها و شكل‌گيري کلان داده‌ها،‌ عملكردها و الگوهاي سنتي پاسخگوي نيازهاي جديد نيستند. بنابراين لزوم استفاده از سيستم‌هاي ذخيره‌سازي داده در قالب‌ها و مدل‌هاي نوین و مقیاس‌پذیر را ضروري ساخته است. در اين مقاله راهكارهاي اساسي در خصوص ابعاد ساختاري و كاركردهاي مختلف پايگاه‌ها‌‌ي داده سنتي و سيستم‌هاي ذخيره‌سازي نوين بررسي گرديده و راهكارهاي فني جهت مهاجرت از پايگاه‌هاي داده سنتي به نوین و مناسب برای کلان داده‌ها ارائه مي‌گردد. همچنین ويژگي‌هاي اساسي در خصوص پيوند پايگاه‌هاي داده سنتي و نوين جهت ذخيره و پردازش داده‌هاي حاصل از شبکه ملی اطلاعات ارائه شده و پارامترها و قابليت‌های پايگاه‌های داده در بستر استاندارد پایه و بستر هدوپ بررسی شده است. به عنوان یک نمونه عملیاتی یک راهکار ترکیبی از پایگاه داده سنتی و نوین با استفاده از روش کارت امتيازی متوازن ارائه شده و مورد ارزیابی و مقایسه قرار گرفته است. تفاصيل المقالة