دریافت مقالات

زیرساخت

بررسی IBM BigInsights برای Apache Hadoop – قسمت دوم

77 مشاهده ۲۴ مهر, ۱۳۹۵ 1

بررسی IBM BigInsights برای Apache Hadoop

در قسمت اول از سری مقالات “بررسی IBM BigInsights برای Apache Hadoop” به تشریح این تکنولوژی شرکت IBM و همچنین مفهوم Big SQL پرداختیم. در این قسمت به صورت تخصصی تر به قابلیت های آن می پردازیم.

تصویرسازی و شناسایی داده ها در IBM BigInsights

با استفاده از تکنولوژی BigInsights، قابلیت شناسایی و آنالیز موردی، برای تمامی داده‌های ذخیره ‌شده در این پلتفرم فراهم شده و کاربران می‌توانند تصویرسازی داده‌ها را به چندین شیوه مختلف انجام دهند.

شرکت امن پایه ریزان کارن APK نخستین شرکت دانش محور در اجرای پروژه های انفورماتیکی کشور تماس با کارشناسان

BigSheets، شناسایی داده‌ها و داشبوردها

BigSheets، یک ابزار مبتنی بر مرورگر و به صورت Spreadsheet می‌باشد که امکان شناسایی، تغییر و آنالیز Big Data را برای کارشناسان داده و کاربران تجاری فراهم می‌نماید.

BigSheetsها می‌توانند در اجرای موارد زیر به کاربران تجاری کمک نمایند:

  • ادغام و شناسایی حجم زیادی از داده‌ها با فرمت‌ها و ساختارهای متفاوت
  • استخراج و غنی‌سازی داده‌ها با استفاده از فرآیند تجزیه و تحلیل متن
  • شناسایی و مجازی‌سازی داده‌ها با چارت‌ها و Pivot Tableها

علاوه بر موارد ذکرشده، BigInsights دارای داشبوردهای متمرکزی می‌باشد که کسب اطلاعات و آنالیز نتایج در مقیاس‌های بزرگ را برای تحلیل‌گران تجاری ممکن می‌سازد. مدیران سیستم می‌توانند برای مانیتور نمودن شاخص‌های کلیدی عملکرد درIBM BigInsights برای کلاستر Hadoop، از داشبورد استفاده نمایند.

ابزارهای توسعه ی IBM BigInsights

BigInsights، از یک فضای توسعه مبتنی بر Eclipse جهت ساخت و پیاده‌سازی برنامه‌های کاربردی استفاده می‌نماید. نحوه عملکرد این پلتفرم بدین صورت می‌باشد که، Editorهایی را برای اجزای مختلف Hadoop مانند Java MapReduce، Hive و Pig فراهم نموده و همچنین یک واسط کاربری برنامه‌نویسی را برای Big SQL، Oozie Workflow و Text Analytics یا آنالیز متنی ارائه می‌‌نماید.

BigInsights IBM دارای یک ابزار چرخه‌عمر توسعه‌ی یکپارچه می‌باشد و این ابزار به کاربران کمک می‌نماید تا داده‌ها را از Hadoop نمونه برداری کرده و به محیط توسعه منتقل نمایند و برنامه‌های کاربردی را در کلاستر، توسعه، تست و پیاده‌سازی نمایند.

ابزارهای تجزیه و تحلیل و موتورهای پیشرفته در IBM BigInsights

تکنولوژی IBM BigInsights شامل مجموعه‌ی پیچیده‌ای از ابزارها و قابلیت‌های تجزیه و تحلیل می‌باشد که هیچ هزینه‌ی اضافی را در بر نمی‌گیرد. سازمان‌ها می‌توانند به سرعت الگوهای مربوط به داده‌های خود را شناسایی نموده و متناسب با آن برنامه‌های آنالیز قدرتمند و سفارشی ایجاد کنند. این برنامه‌ها می‌توانند نتایج و اطلاعاتی را که برای نیاز‌های خاصی از کسب و کار طراحی شده‌اند، ارائه نمایند.

آنالیز متنی پیشرفته یا Text Analytics

BigInsights دربر گیرنده‌ی یک موتور قدرتمند آنالیز متنی می‌باشد که توسط IBM Research ارائه شده است. کاربران با استفاده از یک مجموعه جامع از قواعد یا با ارائه قوانین مورد نظر خود می‌توانند آیتم‌های مورد توجه در اسناد و پیام‌ها، شامل افراد، آدرس ایمیل، آدرس پستی، شماره تلفن، URL، شرکت‌های سرمایه‌گذاری‌ مشترک، اتحادیه‌ها و موارد دیگر را به سرعت استخراج و شناسایی نمایند.

 آنالیز داده‌های عمومی با قابلیت Social Data Analytics Accelerator

Social Data Analytics Accelerator، این امکان را برای کاربران فراهم می‌نماید تا انواع مختلفی از داده‌های عمومی را آنالیز نموده و به اطلاعات کلیدی کاربران برای پشتیبانی از (BI (Business Intelligence دست یابند. این بخش می‌تواند اطلاعات مهم مشتریان که شامل  تشخیص مواردی همچون احساسات مشتریان در هنگام خرید، تمایل آنها نسبت به خرید، مالکیت سرویس/محصول و همچنین ویژگی‌های دیگر جمعیت شناختی مانند جنسیت، موقعیت مکانی، وضعیت پدر و مادر، وضعیت تاهل، وضعیت شغلی، علایق و محصولی که مشتری آن هستند، را هوشمندانه جمع‌آوری نماید. سازمان‌ها می‌توانند از این ویژگی‌ها برای ساخت برنامه‌های کاربردی نظیر برنامه‌های حفظ مشتری، جلوگیری از کاهش مشتری، کسب مشتری و کمپین‌های بازاریابیِ بهره گیرند.

آنالیز داده‌های ماشینی با Machine Data Analytics Accelerator

Machine Data Analytics Accelerator می‌تواند طیف وسیعی از داده‌های ماشینی را از منابعی همچون Log‌فایل‌ها، تجهیزات هوشمند و Telemetry تجزیه و استخراج نموده و کمک نماید تا این فرآیند به جای چند روز یا چندین هفته در عرض چند دقیقه انجام شود. بدین ترتیب سازمان‌ها می‌توانند در مورد عملیات‌ها، تراکنش‌ها و رفتار سیستمی اطلاعات مطلوبی کسب کنند و از این اطلاعات برای افزایش کارایی عملیاتی، عیب‌یابی یا شناسایی ریشه مشکلات و بررسی رویدادها استفاده نموده و مانع قطعی یا کاهش سطح سرویس شوند.

کانکتورهای IBM BigInsights

تکنولوژی Big Data می‌تواند نقش مهمی را در زنجیره عرضه اطلاعاتِ سازمان‌ها ایفا نماید، اما این تاثیر تنها در صورتی به وجود می‌آید که این تکنولوژی کاملا با سیستم‌های فعلی یکپارچه شده باشد. IBM این موضوع را تشخیص داده و BigInsights را با کانکتورهای پرسرعت برای تمامی انواع داده‌ها (ساختاریافته، بدون ساختار و Streaming) و تمامی منابع (انبار داده یا Data Warehouse، رسانه اجتماعی یا Social Media، Log Data و غیره) ارائه نموده است. کانکتورهای یکپارچه‌سازی Built-In از این قابلیت برخوردارند که داده‌ها را به سیستم‌های ساختاریافته همانند فایل سیستم Hadoop منتقل نمایند، در حالی که BigInsights می‌تواند داده‌های بدون ساختار را به طور مستقیم تجزیه و تحلیل نماید.

BigInsights به ارائه کانکتور برای نرم‌افزار پایگاه‌داده IBM DB2، IBM PureData Systems (که از شاخه‌ی تجهیزات مربوط به انبار‌های داده می‌باشد)، تجهیزات IBM Netezza، IBM InfoSphere Warehouse و IBM Smart Analytics System می‌پردازد. این کانکتورهای پرسرعت به تسهیل و تسریع فرآیندهای استفاده از داده‌ها کمک می‌نمایند. کانکتورهای Standard Java Database Connectivity یا به اختصار JDBC، این امکان را برای سازمان‌ها فراهم می‌نمایند تا با طیف وسیعی از سیستم‌های اطلاعاتی و داده شامل Oracle، Microsoft SQL Server، MySQL و Teradata ترکیب گردند.

علاوه بر قابلیت‌های ذکر شده، IBM InfoSphere DataStage دارای کانکتوری است که داده‌های BigInsights می‌توانند در کارهای ETL یعنی Load Extract, Transform, یا ELT یعنی Extract, Load, Transform در InfoSphere DataStage استفاده شوند.

در قسمت بعدی از این تکنولوژی که قسمت پایانی نیز می باشد به مقوله امنیت و مدیریت این تکنولوژی بیشتر می پردازیم.

ــــــــــــــــــــــــــــــــــــــــــــ

بررسی IBM BigInsights برای Apache Hadoop – قسمت اول

بررسی IBM BigInsights برای Apache Hadoop – قسمت دوم

بررسی IBM BigInsights برای Apache Hadoop – قسمت سوم (پایانی)

مطلب مفید بود؟


?