مروری بر سازگاری تکثیر داده در سیستمهای توزیع شده
محورهای موضوعی : فناوری اطلاعات و ارتباطات
1 - مدرس دانشگاه
کلید واژه:
چکیده مقاله :
سیستمهای توزیع شده مانند گرید و ابر به منظور مواجهه با مشکلات کارایی، تضمین کیفیت سرویس و افزایش دسترسیپذیری به دادهها از تکثیر داده استفاده میکنند. تکثیر با وجود مزایای بسیار هزینههای مدیریتی نیز به همراه دارد. سازگار نگه داشتن تکثیرها از جمله مهم ترین هزینه های ناشی از تکثیر است. تعادل بین هزینه سازگاری تکثیر و مزایای تکثیر یک موضوع مورد بحث و داغ در بین محققان این حیطه است. لذا توجه به سازگاری تکثیر نقش موثری در کارایی این سیستمها بازی می کند. استراتژیهای بسیاری توسط محققان در حیطه سازگاری تکثیر داده ارائه شده است. هر کدام از این استراتژیها با در نظر گرفتن پارامترهای مختلفی مانند نرخ خواندن، نرخ نوشتن، نرخ تحمل دادههای قدیمی، تعداد تکثیرها و پهنای باند ارتباطی در تعیین سطوح سازگاری تکثیرها سعی در کاهش هزینههای سازگاری و ارائه راهکارهای مؤثر در این حوزه دارند. در این مقاله به مفاهیم تکثیر و سازگاری تکثیر پرداخته می-شود. دستهبندی ها و روش های سازگاری موجود در این حوزه بررسی می شود. کارهای انجام شده در حیطه سازگاری تکثیر داده از دیدگاه های مختلفی مانند نوع سیستم، پارامترهای تصمیم گیری، ابزار شبیه سازی، مدل سازگاری و پارامترهای بهبود داده شده مقایسه می شوند. همچنین در پایان، موضوعات باز در این حوزه مطرح می شود.
Nowadays, applications generate huge amounts of data, in the range of several terabytes or petabytes. This data is shared among many users around the world. Distributed systems such as grid and cloud provide a suitable platform for these applications, enabling the use of these diverse mass data applications in a distributed manner. In these systems, they use data replication to face performance problems, guarantee service quality, and increase data accessibility. Replication, despite its many advantages, also brings administrative costs. The balance between the consistency cost of replication and the benefits of replication is a hotly debated topic among researchers in this field. Therefore, paying attention to the consistency of replication plays an effective role in the efficiency of these systems. Many strategies have been proposed by researchers in the field of data replication consistency. Each of these strategies try to reduce consistency costs and provide effective solutions in this field by considering various parameters such as read rate, write rate, old data tolerance rate, number of replicas and communication bandwidth in determining the consistency levels of replicas. In this article, we will examine the concepts related to replication and replica consistency and categorize its types and review previous works in this field. The done works have been compared from the perspective of system type, decision parameters, compatibility model and improved parameters. At the end, the open issues in this field are raised.
