انبار داده یک مخزن مرکزی برای ذخیرهی دادهی ساختاریافته، یکپارچه و تاریخی از منابع گوناگون سازمان است که بهطور خاص برای پرسوجوهای تحلیلی، گزارشگیری و هوش تجاری (BI) بهینه شده است. برخلاف پایگاههای دادهی عملیاتی که برای تراکنشهای پرتکرار طراحی میشوند، انبار داده برای خواندن حجیم و تجمیعهای پیچیده ساخته شده است.
ویژگیهای بنیادین
- موضوعمحور: داده حول موضوعات کسبوکار مانند مشتری، فروش و محصول سازماندهی میشود
- یکپارچه: دادهی منابع مختلف استانداردسازی و یکدست میشود
- زمانمند: تاریخچهی داده برای تحلیل روند نگهداری میشود
- غیرفرّار: داده پس از بارگذاری بهسادگی تغییر نمیکند و قابل اتکا است
مدلسازی داده
انبارهای داده معمولاً با مدل ابعادی طراحی میشوند؛ جداول واقعیت (Fact) حاوی سنجههای عددی و جداول بُعد (Dimension) حاوی زمینهی توصیفی. طرحوارههای ستاره و دانهبرف رایجترین الگوها برای سادهسازی پرسوجوهای تحلیلی هستند.
تفاوت با دریاچه داده
انبار داده عمدتاً دادهی ساختاریافته و پالایششده را با طرحوارهی از پیش تعریفشده (schema-on-write) نگه میدارد، در حالی که دریاچهی داده هر نوع دادهی خام را با طرحواره هنگام خواندن (schema-on-read) ذخیره میکند.
انبار داده، حافظهی سازمانیافتهی سازمان است؛ جایی که دادهی پراکنده به روایتی منسجم برای تصمیمگیری بدل میشود.
GoldData Gateway با اتصالدهندهها و جریانهای ETL/ELT، بارگذاری قابلاعتماد داده به انبار داده را خودکار میکند و GoldData Dashboards لایهی تحلیل و بصریسازی روی آن را فراهم میسازد.