APK Blog - Virtualization, Services, Datacenter, Infrastructure

بررسی فنی قابلیت حذف داده‌های تکراری و فشرده‌سازی در vSAN 6.7 آپدیت 1

ویژگی‌های موثر برای فضا مانند حذف داده‌های تکراری، فشرده‌سازی و Erasure Coding، هزینه‌های کلی مالکیت ذخیره‌ساز (TCO) را کاهش می‌دهد. با وجود اینکه ظرفیت Flash درحال حاضر از ظرفیت دیسک‌های مغناطیسی گران‌تر است، استفاده از ویژگی‌های موثر بر فضا هزینه‌های برآوردی بر هر گیگابایت از تجهیزات Flash را کمتر یا هم اندازه درایوهای مغناطیسی می‌کند. مزیت‌های عملکرد بیشتر Flash را درنظر بگیرید و با این‌کار محبوبیت بیشتر پیکربندی‌های تمام Flash را ساده‌تر درک کنید.

فعال‌سازی فرآیندهای فشرد ه‌سازی و حذف داده‌های تکراری می‌تواند میزان فضای فیزیکی ذخیره‌سازی استفاده شده را تا 7 برابر کاهش دهد. محیط‌هایی با داده‌های اضافی مانند سیستم عامل‌های  یکسان معمولا بیشترین سود را می‌برند. به همین ترتیب، فرآیند فشرده‌سازی داده‌هایی که به خوبی فشرده می‌شوند مانند پیام‌ها، Bitmap و فایل‌های برنامه، نتایج مساعدتری را ارائه می‌دهند. داده‌هایی که از قبل فشرده شده‌اند مانند برخی از فرمت‌های گرافیکی مشخص و فایل‌های ویدیویی به همراه فایل‌های رمزگذاری شده، هیچ کاهشی در فضای ذخیره‌سازی حاصل از فشرده‌سازی حاصل نمی‌کنند یا حداقل کاهش آنها بسیار ناچیز است. ممکن است نتایج این فرآیند براساس نوع داده‌های ذخیره‌شده در محیط vSAN تمام Flash تفاوت داشته باشند.

فرآیندهای حذف داده‌های تکراری و فشرده‌سازی از تنظیمات Cluster-Wide واحد هستند که بطور پیش‌فرض غیرفعال شده‌اند و با استفاده از منو Drop-Down ساده فعال می‌شوند.

توجه: به هنگام فعال‌سازی فرآیندهای حذف داده‌های تکراری و فشرده‌سازی در یک کلاستر vSAN، به یک فرمت پیوسته از تمامی دیسک‌ها در آن کلاستر نیاز است. این کار زمان قابل توجهی را می‌گیرد. با این حال، این فرآیند موجب Downtime در ماشین مجازی نمی‌شود.

حذف داده‌های تکراری و فشرده‌سازی پس از تصدیق رونوشت‌ها در لایه vSAN Cache صورت می‌گیرد تا کمترین تاثیر را بر روی عملکرد بگذارند. الگوریتم حذف داده‌های تکراری از یک بلاک ثابت 4K استفاده می‌کند و درون هر گروه دیسک انجام می‌شود. به عبارت دیگر، نسخه‌های اضافه از یک بلاک در همان گروه دیسک، به یک نسخه کاهش می‌یابند اما بلاک‌های اضافی در کل گروه‌های دیسک چندگانه حذف نمی‌شوند.

شرکت APK دارای مجرب ترین تیم طراحی شبکه و نخستین شرکت دانش محور در اجرای پروژه های انفورماتیکی کشور

داده‌های «Cold» در سطح Cache که آماده Destage شدن هستند به حافظه منتقل می‌شوند تا فشرده‌سازی و حذف شده و سپس در سطح ظرفیت نوشته می‌شوند.

الگوریتم فشرده‌سازی پس از حذف صورت می‌گیرد درست پیش از آنکه در سطح ظرفیت نوشته شوند. با درنظرگیری منبع محاسبه اضافی و سربار نقشه تخصیص فضای فایل‌ها، vSAN تنها داده‌های فشرده‌شده را ذخیره می‌کند اگر یک بلاک 4K به 2K کاهش یابد. در غیراین صورت بلاک بطور فشرده نشده نگاشته می‌گردد تا از مصرف منابع اضافی خودداری کند.     

این فرآیند در هر پلتفرم ذخیره‌سازی منجر به هزینه و تاثیراتی از قبیل تاخیر و میزان حداکثر IOPS در عملکرد می‌شوند. vSAN نیز از این قاعده مستثنی نیست. با این حال، با درنظرگیری اینکه فشرده‌سازی و حذف داده‌های تکراری  تنها در پیکربندی‌های vSAN تمام Flash پشتیبانی می‌شوند، این تاثیرات در اغلب موارد قابل پیشبینی هستند. عملکرد فوق‌العاده و تاخیر کم تجهیزات Flash به سادگی نسبت به الزامات حذف داده‌های تکراری و فشرده‌سازی منابع اضافی برتری دارد. مزیت فضایی که با این فرآیند ایجاد می‌شود هزینه استفاده از هر گیگابایت تمام Flash را کاهش می‌دهد.     

 

اشتراک ایمیل