استفاده از Big Data Cluster در SQL Server 2019 باعث هوشمندسازی تمام دادههای کاربر شده و با تلفیق دادههای ساختاریافته و ساختارنیافته در سراسر منطقه داده، به از میان بردن Siloهای داده کمک میکند. این کلاستر، Microsoft SQL Server را با بهترین راهکارهای منبعباز Big Data ادغام میکند و با استفاده از Apache Spark، Containerهای HDFS با Kubernetes و SQL Server بر کلاسترهای مقیاسپذیر اجرا میگردد. همچنین این کلاستر راهکار ایدهآل Big Data برای هوش مصنوعی، ML،M/R ، Streaming، BI، T-SQL و Spark است.
شرکتهای مایکروسافت و اینتل در اکتبر 2019 با استفاده از بارهای کاری ناشی از طرح TPC-DS با مجموعههای بزرگ داده، تست عملکرد و مقیاسپذیری را اجرا نمودند. این مجموعههای داده، دادههای خام ساختاریافته و نیمه ساختاریافته به ارزش 1، 10، 30 و 100 ترابایت تولید میکنند که در Big Data Cluster در Microsoft SQL Server 2019 اجرا میشوند.
TPC-DC نخستین معیار استاندارد صنعت در جهان است که برای سنجش عملکرد سیستم پشتیبانی تصمیمگیری (DSS) شامل Queryها و نگهداری از داده طراحی شده است. این معیار متشکل از 99 عدد Query است که با استفاده از Spark SQL، حجم بزرگی از داده را به دقت بررسی کرده و به سوالات کسبوکار موجود در دنیای واقعی پاسخ میدهد. همچنین پیکربندیهای کلاستر را میآزماید تا CPU، حافظه و I/O را همراه با سیستم عامل و راهکار Big Data به بیشترین بازدهی برساند.
برای اجرای تست عملکرد از 2nd Gen Intel Xeon Scalable processors استفاده شده است. Intel® Xeon® Scalable platform برای مدرنسازی مرکز داده طراحی شده تا بازده عملیاتی را که منجر به بهبود هزینه کل مالکیت (TCO) و بهرهوری بالاتر برای کاربران میشود، بالا ببرد.
نتایج استفاده از Big Data Clusters
معیارهای Big Data Cluster که از TC-DC نشات گرفتهاند، مقیاسپذیری و عملکرد رفرنس Big Data Cluster در Microsoft SQL Server را نشان میدهند.
تست انجام شده نشان میدهد که عملکرد، مقیاسی خطی از 1 ترابایت تا 100 ترابایت مجموعه داده را به صورت یکدست در بر میگیرد و منابع متنوع سیستم به گونهای موثر مورد استفاده قرار میگیرند. استفاده از Big Data Cluster درMicrosoft SQL Server 2019، باعث عملکرد بالای پردازنده (Processor)های Intel® Xeon® و Intel® SSDها شده تا بهترین عملکرد را برای Queryهای پیچیده ارائه دهند. به علاوه، نتایج معیار، قابلیت بالای الاستیکی و عملکرد قوی کل پلتفورم را نشان میدهد.
بیشتر بخوانید: معرفی و بررسی کلاستر Big Data در SQL Server
ترکیب Big Data Cluster در Microsoft SQL Server 2019 و Intel’s Xeon Scalable platform میتواند بسیاری از چالشهای Big Data درکسبوکار را مورد توجه و بررسی قرار دهد. میتوان دادهها را از در مقیاس مختلف از منابع متفاوت، در فرمتهای متنوع داده، با محاسبه Scale-Out برای پردازش داده و یادگیری ماشینی، به همراه تجربه پیشتاز SQL Server در صنعت، تجزیه و تحلیل نمود.