معرفی شغل های هوش تجاری
نوامبر 23, 2022داده محوری (Data driven) چیست؟
نوامبر 30, 2022دریاچه داده مکانی است که حجم زیادی از داده ها را به صورت خام و بدون نرمال سازی در خود نگهداری می کند و معمولا اولین اقدام برای رفتن سازمان ها به سمت داده کاوی است.
اولین تفاوتی را که بین یک دریاچه داده و انبار داده می توان مطرح نمود نوع ذخیره سازی داده است که در انبار داده ذخیره سازی به صورت پوشه و فایل و ساسله مراتبی صورت می گیرد اما در دریاچه داده داده ها به صورت مسطح ذخیره می شوند.
در واقع هنگامی که صحبت از ذخیره سازی تمامی داده های یک سازمان و استفاده از معماری هایی می شود که در آن دسترسی به داده ها با ارزان ترین سخت افزارهای ممکن و بر اساس اولویت باشد، استفاده از دریاچه داده بهترین انتخاب خواهد بود.
شما در Data Lake از ساختارهای متن بازی استفاده خواهید کرد که نیاز به هزینه های بالای خرید لیسانس را نخواهند داشت.
با سان تا انتهای این مقاله جذاب همراه باشید.
تفاوت دریاچه داده و انبار داده
در تهیه انبار داده شما به دنبال یکپارچه سازی داده های مختلف از برنامه های مختلف درون سازمان با شرایطی هستید که در آن از تکرار داده ها جلوگیری شود و به اصطلاح قبل از برداشت هر گزارشی داده های اضافی درون حذف گردد.
نکته مهم دیگری که در رابطه با دریاچه داده وجود دارد این است که این ساختار برای ذخیره سازی داده های ساختار یافته، نیمه ساختار یافته و بدون ساختار در نظر گرفته می شود.
در حالی که در انبار داده امکان استفاده استراتژیک از داده ها فراهم می شود و آنچه که مورد نیاز است قبل از ذخیره سازی داده ها تعریف و مشخص می شود.
با توجه به ویژگی هایی که در دریاچه داده وجود دارد قطعا افراد با تخصص دانشمند داده که به دنبال تحلیل داده ها و یادگیری عمیق هستند به دنبال دریاچه داده خواهند رفت و این در حالی است که انبار داده در اختیار مهندسان عملیاتی داده قرار می گیرد تا گزارشات مورد نیاز در داشبورد را از آن استخراج نماید.
مزایای استفاده از دریاچه داده
همانطور که گفته شد برای استفاده از دریاچه داده ها شما با طیف وسیعی از نرم افزارهای متن باز با تکنولوژی های روز سر و کار خواهید داشت.
هنگامی که صحبت از نرم افزارهای متن باز می گردد یعنی شما هزینه ای را برای خرید و بروزرسانی آنها نخواهید کرد و این موضوع برای سازمان های مشتری از اهمیت ویژه ای برخوردار خواهد بود.
از طرفی دانشمندان داده و مهندسان و تحلیلگران داده بسیار سریع تر از آنچه در ساختار های سنتی وجود دارد می توانند به داده ها دسترسی پیدا کنند. این دسترسی می تواند بر روی سخت افزارهای مختلف و بر اساس نیاز شما در دوره های مختلف زمانی باشد.
یعنی دسترسی به داده های بسیار ضروری که روزانه با آنها سر و کار دارید در سخت افزار های گران تر، بروز تر و سریع تر و در مقابل استفاده از سخت افزارهای ارزان تر برای داده هایی که نیاز به دسترسی روزانه و آنی ندارند.
در واقع صحبت از کلان داده یا همان Big Data یعنی صحبت از الگوریتم هایی که سازمان را هوشمند تر ساخته و آماده بهره برداری از داده ها به صورت عمیق می کند و این موضوعات وابسته با ساختار دریاچه داده خواهد بود.
1 دیدگاه
[…] رشد داده ها و دیگر فاکتورها موضوع نیاز به انبار داده و دریاچه داده مورد بررسی قرار گیرد. البته هزینه و تکنولوژی انبار […]