دریافت مقالات

زیرساخت

مفهوم IBM DataWorks و کاربردهای آن – قسمت اول

73  مشاهده ۲۳ مرداد, ۱۳۹۵ 7

IBM DataWorks چیست

آماده‌سازی و جابجایی ساده، قدرتمند و یکپارچه‌ی داده‌ها در Cloud

در عصر Cloud Computing، سازمان ها حجم انبوهی از اطلاعات را که شامل Big Data و (Internet of Things (IoT می شود، تولید می‌کنند. در مقایسه با Business Intelligence یا BI، در حال حاضر حجم بیشتری از داده‌ها ایجاد می‌شوند و تیم‌های کارشناسی داده نیز زمان و منابعی را برای تجزیه و تحلیل در اختیار دارند. در واقع، طبق تحقیقات Forrester مشخص شد که اجرای ۶۸ درصد از درخواست‌های ساده BI برای سازمان‌‌های IT، به مدت چندین هفته، چندین ماه و یا حتی مدت زمان بیشتری به طول می‌انجامد.

سازمان‌ها برای آنکه در میان درخواست‌ها برای داده جدید، در مسیر پیشرفت قرار گرفته و همچنان موقعیت رقابتی خود را نیز حفظ نمایند، باید به دنبال روش‌هایی باشند تا مسیر کارشناسان تجاری را تغییر داده و آنها را به کاربران متخصص در زمینه داده تبدیل نمایند و بدین ترتیب بخشی از مسئولیت‌های IT را بر عهده گیرند. بهرحال این فرآیند با چالش‌های خاصی همراه می‌باشد: به عبارتی توانمند‌سازی کاربران تجاری با برخی از ابزارها با هدف دسته‌بندی، آماده‌سازی و تجزیه و تحلیل سریع داده‌ها از تعداد زیادی از منابع، به صورت On-Premise و Cloud بدون نیاز به تخصص فنی و دقیقِ مدیر پایگاه‌داده یا کارشناسان داده صورت می‌گیرد.

اما با سرویس‌های جدید Cloud شرکت IBM، نظیر IBM DataWorks این امکان وجود دارد که کاربران تجاریِ فنی و غیرفنی قادر به کسب دانش مفیدی از داده‌های ذخیره شده به صورت Local در صفحات Excel یا پایگاه‌های داده حجیم در Cloud، همراه با دسترسی Point یا Click گردند.

IBM DataWorks چیست؟

DataWorks، یک سرویس کاملا مدیریت شده برای آماده‌سازی و جابجایی داده‌ می‌باشد و این قابلیت را برای تحلیل‌گران، Developerها، کارشناسان داده و مهندسین داده فراهم می‌سازد تا داده‌ها را از طریق یک واسط کاربری ساده اما قدرتمندِ مبتنی بر Cloud مورد استفاده قرار دهند. تحلیل‌گران تجاری یا کاربران Power Excel ، با این تکنولوژی به عنوان یکی از اجزای مهم مجموعه سرویس‌های IBM Cloud Data، می‌توانند فرآیند شناسایی، استانداردسازی، جابجایی و تغییر داده‌ها را با پشتیبانی توسعه برنامه و تجزیه و تحلیل موارد استفاده، انجام دهند.

DataWorks به واسطه ادغام شدن با سرویس‌های داده Cloud نظیر Data Warehouse یا به عبارتی انبار داده‌ی IBM dashDB Cloud، پایگاه‌دادهIBM Cloudant NoSQL و IBM Watson Analytics، یک ابزار یکپارچه و بدون محدودیت برای آماده‌سازی و جابجایی داده‌ها از موقعیت On-Premise و Off-Premise به اکوسیستم Cloud به شمار می‌رود که به سرعت تجزیه و تحلیل شده و تصویرسازی می‌گردد. به علاوه، این تکنولوژی با ارائه مستمر خدمات و افزودن ویژگی‌ها و قابلیت‌های جدید به طور منظم، پشتیبانی می‌شود. همچنین موتور پردازشگر آن بر روی Apache Spark ارائه می‌گردد که به دلیل رشد و توسعه مستمر به عنوان پروژه برتر برای تجزیه و تحلیل متن باز به شمار می‌رود. نتیجه، ارائه بهترین راهکار است که از قابلیت همگام شدن با رشد سریع نوآوری در Big Data و Cloud Computing برخوردار است.

IBM DataWorks چیست

IBM DataWorks: آماده‌سازی داده‌های Point-and-Click به صورت یک سرویس که در Cloud به طور کامل مدیریت می‌شود.

ایجاد دسترسی عمومی به داده‌ها در سراسر سازمان

با استفاده از تکنولوژی‌های روز، نمی‌توان به این زودی نتیجه گرفت که هر کسی می‌تواند یک کارشناس داده باشد؛ اما در عین حال ابزاری مانند DataWorks، فرآیند دسترسی عمومی به داده‌ها و تجزیه و تحلیل پیشرفته برای همه افراد را در سازمان میسر می‌نماید. روش‌های بی‌شماری برای استفاده از DataWorks در سازمان‌ها وجود دارد اما موارد کاربرد اصلی آن شامل موارد زیر می‌شود:

۱-ترکیب داده‌ها از چندین منبع مختلف: دسترسی به داده‌ها از هر منبع پشتیبانی شده و ترکیب آنها به منظور ایجاد یک فایل یا جدول مرتبط با موضوع تحلیلِ مورد نظر

-مثال: کارشناس داده قصد دارد الگوریتم‌هایی را بر اساس تحلیل اطلاعات مشتریان و داده‌های مربوط به مخاطبان از منابع Third-Party نظیر Nielsen، Rovi، Twitter، Rotten Tomatoes و EIDR جهت طراحی آگهی ارائه نماید. dashDB به عنوان مخزن داده‌های مهم رسانه، Cloudant برای ذخیره‌ی محتوای چندساختاری و DataWorks برای شکل‌دهی و تصحیح داده‌های ترکیبی به کار برده‌ می‌شوند تا داده‌ها برای ارائه گزارش‌گیری آماده ‌گردند.

۲-دسترسی به داده‌ها در فضای Hybrid Cloud: دسترسی به داده‌ها در هر جایی که باشند با اتصال به اشتراکی‌ترین منبع داده در کسب‌وکار صورت گرفته و به راحتی و در شرایط ایمن به داده‌های پشت فایروال دسترسی می‌یابد.

– مثال: یک کاربر برای ارزیابی میزان اثربخشی طرح‌های بازاریابی، نیازمند دسترسی به داده‌های حاصل از ارزیابی احساسی مشتریان خود که بر روی Cloud ذخیره‌شده‌ است و همچنین داده‌های کمپین بازاریابی از یک پایگاه On-Premise می‌باشد. در این صورت با DataWorks، می‌تواند یک مسیر امن را برای بازیابی داده‌های پشت فایروال تنظیم نماید.

۳- ایجاد داده‌های خام برای تجزیه و تحلیل: مقادیر و ستون‌های داده را فیلتر نموده و پس از دسته بندی، موارد تکراری را حذف می‌نماید تا کیفیت داده‌ها را از طریق امتیازات استاندارد شده مشخص نماید.

– مثال: تحلیل‌گر تجاری باید پیش‌بینی فروش را بر اساس داده‌های بازه‌های زمانی گذشته (مثلا داده‌های مربوط به فروش در سال قبل) انجام دهد. برای این تحلیل‌گر، قابلیت دسترسی به پایگاه‌داده فروش On-Premise وجود دارد اما در مورد کیفیت و میزان مرتبط بودن داده‌ها قبل از ارائه گزارش اطمینانی وجود ندارد. این تکنولوژی، یک امتیاز کیفیت را ارائه نموده و امکان پیش‌نمایش داده‌ها را برای کاربران فراهم می‌نماید، بنابراین قادرند به صورت دیداری تایید کنند که داده‌های مناسب و درست را در اختیار دارند. به علاوه، DataWorks قابلیت فیلتر نمودن موارد نامناسب را نیز دارد.

۴- بارگذاری داده‌ها جهت انجام فرآیند تجزیه و تحلیل: امکان دسترسی به داده‌های آماده را در هر جایی فراهم نموده و آن را در سرویس داده بر روی Cloud بارگذاری می‌نماید.

– مثال: کارشناس داده باید تعداد کمی فایل را از یک منبع داده On-Premise در dashDB Cloud مربوط به خود بارگذاری نماید تا بتواند مدل‌های آماری را برای پروژه‌های حفظ مشتری ارائه نماید. تکنولوژی DataWorks، دسترسی آسان Point-And-Click را ارائه می‌نماید تا جدول‌ها و فایل‌ها را جهت جابجایی منبع داده مورد نظر انتخاب نماید.

۵- کنترل جریان کاری داده‌ها از برنامه تحت وب: از APIهای DataWorks برای ایجاد و کنترل عملکردهای جریان کاری حاصل از یک برنامه استفاده می‌نماید.

-مثال: ارائه‌دهندگان برنامه بر اساس رویدادهایی که از سنسورهای اینترنت اشیا (IoT) و سیستم‌های تعاملی مانند سیستم‌های اجتماعی و Mobile (سیار) ناشی می‌شود، می‌توانند باعث ایجاد فعالیتی توسط تحلیل‌گران تجاری، کارشناسان داده یا مدیران IT گردنند و داده‌ها را با استفاده از APIهای DataWorks جابجا و اصلاح نموده و تغییر ‌دهند.

۶-داده‌های رابطه‌ای و ساختاریافته را برای داده‌های نیمه‌ساختار یافته طراحی می‌نماید: داده‌های استاندارد جدولی را در مخزن NoSQL مربوط به Cloudant بارگذاری می‌نماید.

-مثال: Developer باید داده‌های رابطه‌ای را برای استفاده در برنامه‌های وب در Cloudant بارگذاری نموده و داده‌های استاندارد را در ساختارهای سلسله مراتبی JSON وارد نماید. DataWorks بر منبع داده‌های رابطه‌ای و Cloudant مربوط به NoSQL اشاره می‌کند و بدین طریق داده‌های رابطه‌ای را به اسناد JSON تبدیل می‌کند.

IBM DataWorks چیست

دسترسی، شکل دادن و ارائه داده ها به سرویس‌های آنالیز Cloud و تکرار مداوم آن

ــــــــــــــــــــــــــــــــــــــــــــــ

مفهوم IBM DataWorks و کاربردهای آن – قسمت اول

مفهوم IBM DataWorks و کاربردهای آن – قسمت دوم

مفهوم IBM DataWorks و کاربردهای آن – قسمت سوم (پایانی)

جهت مشاوره و کسب اطلاعات بیشتر در مورد این تکنولوژی و یا نیاز به پیاده سازی آن با کارشناسان ما تماس حاصل نمایید.

APK | امن پایه ریزان کارن

مطلب مفید بود؟


?