دریافت مقالات

زیرساخت

بررسی IBM BigInsights برای Apache Hadoop – قسمت سوم (پایانی)

117 مشاهده ۲۸ مهر, ۱۳۹۵ 4

بررسی IBM BigInsights برای Apache Hadoop

در قسمت اول و دوم از سری مقالات IBM BigInsights به تشریح این تکنولوژی و همچنین مفهوم Big SQL و برخی قابلیت های مهم آن پرداختیم. در این قسمت به نحوه عملکرد آن در سطوح مختلف می پردازیم.

فرآیند بهینه‌سازی بارکاری در IBM BigInsights

IBM BigInsights، با ارائه چندین ویژگی به ارتقای عملکرد و همچنین قابلیت انطباق و سازگاری در محیط‌های سازمانی کمک می‌نماید.

شرکت امن پایه ریزان کارن APK نخستین شرکت دانش محور در اجرای پروژه های انفورماتیکی کشور تماس با کارشناسان

زمان‌بندی اختصاص بارکاری با BigInsights Scheduler

با توجه به اینکه تمامی بارهای کاری از اولویت یکسانی برخوردار نیستند، BigInsights Scheduler به ارائه‌ی طرح تخصیص جریان کاریِ سازگار برای وظایف MapReduce می‌پردازد تا پردازش داده‌ها را بر اساس یک Policy انتخاب شده توسط کاربر، بهینه‌ ‌نماید. Scheduler، یک Extension برای Hadoop Fair Scheduler می‌باشد که با هدف تخصیص سهم برابری از منابع کلاستر برای تمامی بخش‌ها، طراحی شده است.

مفهوم Adaptive MapReduce  و نقش آن در تسریع روند انجام وظایف

Jobهایی که درHadoop اجرا می‌شوند، می‌توانند روند ایجاد وظایف کوچک و متعددی که حجم زیادی از منابع سیستم را مصرف می‌کنند، پایان بخشد. IBM نیز برای مقابله با این موضوع تکنیک جدیدی تحت عنوان Adaptive MapReduce را معرفی نموده است که طراحی آن با هدف سرعت بخشیدن به انجام Jobهای کوچک از طریق تغییر در نحوه‌ی مدیریت وظایف MapReduce، بدون اعلام هشدار در مورد نحوه ایجاد وظایف می‌باشد. Adaptive MapReduce برای عملیات‌های MapReduce و عملیات‌های Hadoop application programming interface یا API، کاملا به صورت Transparent می‌باشد.

مدیریت و امنیت

الزامات دقیق امنیتی که به سایر منابع اطلاعاتی سازمان‌ها اعمال می‌گردد، باید به Big Data نیز، تعمیم یابند. BigInsights با ارائه چندین گزینه سطح بالا می‌تواند امنیت و حریم خصوصی داده‌ها را تضمین ‌نماید.

احراز هویت یا Authentication

مدیران می‌توانند از میان روش‌های موجود برای احراز هویت که شامل Flat File ،Lightweight Directory Access Protocol  یا به اختصار LDAP و همچنین (Pluggable Authentication Modules (PAM می‌باشند، روش مناسب برای احراز هویت در کنسول تحت وب BigInsights را انتخاب نمایند. با استفاده از روش LDAP برای احراز هویت، برنامه‌ی نصب BigInsights با یک منبع ذخیره‌سازی که شامل اکانت‌های LDAP برای احراز هویت می‌باشد، ارتباط برقرار می‌کند. مدیران سیستم می‌توانند دسترسی به کنسول BigInsights را بر اساس نقش‌ها یا Role‌های کاربران در گروه‌های مختلف ارائه نموده و روند تنظیم دسترسی برای گروه‌های کاربری مختلف را تسهیل نماید.

نقش‌ها یا Roleها

تکنولوژی IBM BigInsights، چهار نقش را برای کاربران ارائه می‌نماید که عبارتند از: مدیران سیستم (System Administrator)، مدیران داده (Data Administrator)، مدیران برنامه‌های کاربردی (Application Administrator) و کاربران بدون دسترسی مدیریتی (Non-Administrative User). نحوه دسترسی به داده‌ها و ویژگی‌ها منوط به نقش محول شده به کاربر می‌باشد.

ممیزی (Auditing) و امنیت (Security)

Jobهای MapReduce با استفاده از Account IDهای طراحی شده قابل اجرا بوده و به افزایش امنیت، کنترل دسترسی و ممیزی کمک می‌نماید. یکپارچه‌سازی BigInsights با نرم‌افزار امنیت داده‌ی IBM InfoSphere Guardium برای سازمان‌ها این امکان را فراهم می‌سازد تا نیازهای امنیتی و رسیدگی Hadoop را همچون شیوه به کار رفته در مدیریت منابع داده‌ی ساختاریافته، مدیریت نمایند.

همچنین BigInsights از پروتکل احراز هویت Kerberos به صورت Service-To-Service پشتیبانی نموده و توانایی امنیتی برای جلوگیری از حملات Middle Man را افزایش می‌دهد.

بهبود یکپارچه‌سازی در سطح سازمانی

بررسی IBM Watson Explorer

 BigInsights شامل یک License با کاربری محدود برای Watson Explorer می‌باشد که به سازمان‌ها در فرآیند شناسایی، جهت‌یابی و تصویرسازیِ حجم زیادی از اطلاعات ساختاریافته و بدون ساختار کمک می‌نمایند. همچنین یک نقطه ورود کارآمد و مقرون‌به‌صرفه را جهت شناسایی ارزش تکنولوژیِ Big Data به واسطه یک چارچوب قدرتمند برای توسعه برنامه‌های کاربردی ارائه می‌نماید که از داده‌های فعلی سازمان استفاده می‌کند.

InfoSphere Streams

تکنولوژی BigInsights در برگیرنده‌ی یک License از InfoSphere Streams با کاربری محدود است که تحلیل داده‌های در جریان را به صورت Real-Time امکانپذیر می‌سازد. InfoSphere Streams، یک سیستم پردازش Stream درسطح سازمانی می‌باشد که علاوه بر قابلیت استخراج داده‌های در جریان می‌تواند داده‌ها را تغییر داده و با سرعت بالا به BigInsights منقل ‌نماید. بدین ترتیب سازمان‌ها می‌توانند داده‌های کسب‌و‌کار را به صورت Real Time بررسی نموده و کارهای لازم را بر روی آن‌ها انجام داده (تحلیل و مرتبط ساختن داده‌ها به محض ورود) و عملکرد پردازش را به صورت اساسی ارتقا بخشند.

Cognos Business Intelligence

BigInsights دارای License برای Cognos Business Intelligence با کاربری محدود می‌باشد که کاربران تجاری را قادر به دسترسی و آنالیز اطلاعات مورد نیاز جهت بهبود فرآیند تصمیم‌گیری، کسب دیدگا‌ه‌های بهتر ومدیریت عملکرد می‌نماید. Cognos Business Intelligence شامل نرم‌افزارهایی برای جستجو، گزارش‌گیری و آنالیز و همچنین داشبوردها و نرم‌افزارهایی برای جمع‌آوری و سازماندهی اطلاعات از منابع متعدد می‌باشد.

InfoSphere Master Data Management

BigInsights برای کاربرانی که قصد آنالیز مشتریان را دارند از InfoSphere Master Data Management جهت انطباق و مرتبط ساختن اطلاعات مشتریان در Hadoop، به صورت مستقیم و با سرعت بالا استفاده می‌نماید. با تخصیص یک ID منحصر به فرد برای هر مشتری، تضمین می‌گردد که فرآیند تجزیه و تحلیل با اطلاعات دقیق‌تری اجرا می‌شود.

بررسی کلی IBM BigInsights برای Apache Hadoop

بطور کلی IBM BigInsights برای Hadoop، به طور صد در صدی یک Apache Hadoop متن باز بوده و شامل قابلیت‌های سازمانی برای پشتیبانی از کلیه موارد کاربردیِ Big Data می‌باشد. تجربه Hadoop با قابلیت دسترس‌پذیری بالا، آموزش، پشتیبانی و ارائه سرویس‌های مورد نیاز توسط IBM ارتقا می‌یابد تا نرخ بازگشت سرمایه و پیاده‌سازی موفق را تضمین ‌نماید.

در زیر به ارائه قابلیت‌های اساسی این تکنولوژی می‌پردازیم:

  • پلتفرم منطبق با نیازهای سازمانی با محوریت Apache Hadoop، جهت پردازش، ذخیره‌سازی و آنالیز داده‌ها
  • آنالیز پیشرفته برای داده‌های ساختاریافته، نیمه ‌ساختار و بدون ساختار
  • ابزار مجازی‌سازی، توسعه و مدیریت در سطح حرفه‌ای برای افزایش بهره‌وری
  • تسریع‌کننده‌های برنامه‌ کاربردی که به اجرای سریع کمک نموده و زمان دستیابی به نتیجه را سرعت می‌بخشند.
  • ادغام با موارد پیشنهادی و تایید شده‌ی IBM همانند راهکارهای Third-Party

ــــــــــــــــــــــــــــــــــــــــــــ

بررسی IBM BigInsights برای Apache Hadoop – قسمت اول

بررسی IBM BigInsights برای Apache Hadoop – قسمت دوم

بررسی IBM BigInsights برای Apache Hadoop – قسمت سوم (پایانی)

مطلب مفید بود؟


?