APK Blog - Virtualization, Services, Datacenter, Infrastructure

دسترسی به بهترین عملکرد Big Data با استفاده از Big Data Clusters در SQL 2019

استفاده از Big Data Cluster در SQL Server 2019 باعث هوشمندسازی تمام داده‌های کاربر شده و با تلفیق داده‌های ساختاریافته و ساختارنیافته در سراسر منطقه داده، به از میان بردن Siloهای داده کمک می‌کند. این کلاستر، Microsoft SQL Server را با بهترین راهکارهای منبع‌باز Big Data ادغام می‌کند و با استفاده از Apache Spark، Containerهای HDFS با Kubernetes و SQL Server بر کلاسترهای مقیاس‌پذیر اجرا می‌گردد. ‌همچنین این کلاستر راهکار ایده‌آل Big Data برای هوش مصنوعی، ML،M/R ، Streaming، BI، T-SQL و Spark است.

استفاده از Big Data Clusters در SQL 2019

شرکت‌های مایکروسافت و اینتل در اکتبر 2019 با استفاده از بارهای کاری ناشی از طرح TPC-DS با مجموعه‌های بزرگ داده، تست عملکرد و مقیاس‌پذیری را اجرا نمودند. این مجموعه‌های داده، داده‌های خام ساختاریافته و نیمه ساختاریافته به ارزش 1، 10، 30 و 100 ترابایت تولید می‌کنند که در Big Data Cluster در Microsoft SQL Server 2019 اجرا می‌شوند.

TPC-DC نخستین معیار استاندارد صنعت در جهان است که برای سنجش عملکرد سیستم پشتیبانی تصمیم‌گیری (DSS) شامل Queryها و نگهداری از داده طراحی شده است. این معیار متشکل از 99 عدد Query است که با استفاده از Spark SQL، حجم بزرگی از داده را به دقت بررسی کرده و به سوالات کسب‌وکار موجود در دنیای واقعی پاسخ می‌دهد. همچنین پیکربندی‌های کلاستر را می‌آزماید تا CPU، حافظه و I/O را همراه با سیستم عامل و راهکار  Big Data به بیشترین بازدهی برساند.

برای اجرای تست عملکرد از 2nd Gen Intel Xeon Scalable processors استفاده شده است. Intel® Xeon® Scalable platform برای مدرن‌سازی مرکز داده طراحی شده تا بازده عملیاتی را که منجر به بهبود هزینه کل مالکیت (TCO) و بهره‌وری بالاتر برای کاربران می‌شود، بالا ببرد.

شرکت APK دارای مجرب ترین تیم طراحی شبکه و نخستین شرکت دانش محور در اجرای پروژه های انفورماتیکی کشور

نتایج استفاده از Big Data Clusters

معیارهای Big Data Cluster که از TC-DC نشات گرفته‌اند، مقیاس‌پذیری و عملکرد رفرنس Big Data Cluster در Microsoft SQL Server را نشان می‌دهند.

تست انجام شده نشان می‌دهد که عملکرد، مقیاسی خطی از 1 ترابایت تا 100 ترابایت مجموعه داده را به صورت یکدست در بر می‌گیرد و منابع متنوع سیستم به گونه‌ای موثر مورد استفاده قرار می‌گیرند. استفاده از Big Data Cluster درMicrosoft SQL Server 2019،  باعث عملکرد بالای پردازنده (Processor)های Intel® Xeon® و Intel® SSDها شده تا بهترین عملکرد را برای Queryهای پیچیده ارائه دهند. به علاوه، نتایج معیار، قابلیت بالای الاستیکی و عملکرد قوی کل پلتفورم را نشان می‌دهد.

بیشتر بخوانید: معرفی و بررسی کلاستر Big Data در SQL Server

ترکیب Big Data Cluster در Microsoft SQL Server 2019 و Intel’s Xeon Scalable platform می‌تواند بسیاری از چالش‌های Big Data درکسب‌وکار را مورد توجه و بررسی قرار دهد. می‌توان داده‌ها را از در مقیاس مختلف از منابع متفاوت، در فرمت‌های متنوع داده، با محاسبه Scale-Out برای پردازش داده و یادگیری ماشینی، به همراه تجربه پیشتاز SQL Server در صنعت، تجزیه و تحلیل نمود.

اشتراک ایمیل