لیکهاوس یک معماری دادهی نوین است که میکوشد بهترین ویژگیهای دریاچهی داده و انبار داده را در یک سکوی واحد گرد آورد. هدف آن این است که هم انعطاف، تنوع داده و هزینهی پایین ذخیرهسازی دریاچه را داشته باشد و هم قابلیتهای تراکنشی، کیفیت و کارایی پرسوجوی انبار داده را ارائه دهد.
چه چیزی لیکهاوس را ممکن کرد؟
ظهور فرمتهای جدول باز و تراکنشی مانند Delta Lake، Apache Iceberg و Apache Hudi امکان افزودن لایهای از مدیریت فراداده و تضمینهای ACID را روی دادهی ذخیرهشده در دریاچه فراهم کرد و عملاً مرز میان دریاچه و انبار را کمرنگ ساخت.
مزایای کلیدی
- تراکنشهای ACID روی دادهی دریاچه برای یکپارچگی و قابلیت اطمینان
- اعمال و تکامل طرحواره (Schema Enforcement & Evolution)
- پشتیبانی همزمان از بارهای کاری BI و یادگیری ماشین روی یک نسخه از داده
- حذف کپیهای تکراری داده و کاهش هزینه و پیچیدگی نگهداری
چه زمانی مناسب است؟
لیکهاوس برای سازمانهایی ایدهآل است که میخواهند از نگهداری همزمان دو سامانهی جداگانه (دریاچه برای علم داده و انبار برای BI) پرهیز کنند و یک منبع واحد حقیقت برای همهی بارهای کاری تحلیلی داشته باشند.
لیکهاوس پایان دوگانگی دریاچه و انبار است؛ یک معماری برای همهی بارهای کاری داده، از گزارش تا یادگیری ماشین.
GoldData Gateway میتواند جریانهای داده را بهسوی معماری لیکهاوس هدایت کند و تیم مهندسی دادهی GoldData در طراحی و استقرار آن همراه سازمان است.