پرش به محتوای اصلی
هوش مصنوعی مولد

الگوهای معماری RAG در سطح سازمانی

از RAG ساده تا الگوهای پیشرفته مانند بازیابی ترکیبی، rerank، RAG عامل‌محور و GraphRAG؛ به‌همراه ملاحظات امنیت و استقرار سازمانی.

تیم هوش مصنوعی گلدیتا۴ شهریور ۱۴۰۴۱۳ دقیقه مطالعه

RAG به استاندارد عملی تزریق دانش سازمانی به مدل‌های زبانی تبدیل شده است، اما الگوی ساده‌ای که در آموزش‌های مقدماتی می‌بینید به‌ندرت برای محیط تولید سازمانی کافی است. سامانه‌های واقعی با حجم زیاد سند، تنوع قالب، پرسش‌های پیچیده و الزامات امنیتی سخت روبه‌رو هستند. این مقاله الگوهای معماری RAG را از پایه تا پیشرفته بررسی می‌کند تا بدانید برای هر سطح از پیچیدگی چه انتخابی درست است.

هیچ معماری واحدی برای همه مناسب نیست. درست‌ترین رویکرد، شروع از ساده‌ترین الگویی است که نیاز را برآورده می‌کند و افزودن پیچیدگی تنها زمانی که ارزیابی، ضرورتش را نشان دهد.

RAG پایه و اجزای آن

در ساده‌ترین شکل، RAG چهار مرحله دارد: قطعه‌بندی اسناد، تولید embedding و ذخیره در پایگاه‌داده برداری، بازیابی نزدیک‌ترین قطعات به پرسش، و تولید پاسخ توسط مدل با تکیه بر آن قطعات. کیفیت قطعه‌بندی نقطه‌ی شروع تعیین‌کننده است؛ قطعات بیش از حد بزرگ بافت را رقیق و قطعات بیش از حد کوچک انسجام معنایی را قطع می‌کنند.

  • قطعه‌بندی آگاه از ساختار سند مانند سرفصل‌ها و پاراگراف‌ها، بهتر از برش با طول ثابت است.
  • هم‌پوشانی میان قطعات از قطع شدن مفاهیم در مرز برش جلوگیری می‌کند.
  • نگه‌داری فراداده‌ی هر قطعه مانند منبع و عنوان، برای فیلتر و ذکر مرجع حیاتی است.

بازیابی ترکیبی و بازرتبه‌بندی

بازیابی صرفاً برداری برای پرسش‌های مفهومی عالی است اما در برابر نام‌های خاص، کدها و اصطلاحات دقیق ضعف دارد. بازیابی ترکیبی نتایج جست‌وجوی برداری و جست‌وجوی واژگانی مانند BM25 را ادغام می‌کند و از نقاط قوت هر دو بهره می‌برد. ادغام نتایج معمولاً با روش‌هایی مانند ترکیب رتبه‌ای انجام می‌شود.

گام بعدی، بازرتبه‌بندی است. یک مدل reranker که جفت پرسش و سند را با هم می‌بیند، بسیار دقیق‌تر از مقایسه‌ی برداری ساده است اما کندتر. الگوی رایج، بازیابی گسترده با روش سریع و سپس بازرتبه‌بندی دقیق چند نتیجه‌ی برتر است. این الگو تعادل عالی میان recall بالا و precision نهایی برقرار می‌کند.

بازرتبه‌بندی ارزان‌ترین ارتقای کیفیت در بیشتر سامانه‌های RAG است؛ پیش از پیچیدگی‌های سنگین، آن را امتحان کنید.

الگوهای پیشرفته

RAG عامل‌محور

در RAG عامل‌محور، به‌جای یک بازیابی ثابت، عامل تصمیم می‌گیرد چه چیزی، چند بار و از کدام منبع بازیابی کند. عامل می‌تواند پرسش پیچیده را به زیرپرسش‌ها بشکند، نتایج میانی را ارزیابی کند و در صورت ناکافی بودن، بازیابی را تکرار کند. این رویکرد برای پرسش‌های چندبخشی و تحلیلی قدرتمند است اما هزینه و تأخیر بیشتری دارد.

GraphRAG و بازیابی مبتنی بر دانش‌نگاشت

وقتی پاسخ نیازمند درک روابط میان موجودیت‌هاست، نه فقط شباهت متنی، گراف دانش ارزش پیدا می‌کند. در GraphRAG اطلاعات به‌صورت موجودیت‌ها و روابطشان مدل می‌شوند و بازیابی می‌تواند مسیرهای میان مفاهیم را دنبال کند. این الگو برای پرسش‌های کل‌نگر و استنتاجی که از چند سند ترکیب می‌شوند مناسب است.

ملاحظات امنیت و استقرار سازمانی

در سطح سازمانی، RAG فقط یک مسئله‌ی کیفیت نیست بلکه مسئله‌ی حاکمیت و امنیت است. کنترل دسترسی باید در لایه‌ی بازیابی اعمال شود تا هر کاربر فقط اسنادی را که مجاز است ببیند؛ نشت اطلاعات از طریق بازیابی یک ریسک واقعی است. همچنین داده‌ی حساس نباید بدون کنترل به مدل‌های بیرونی ارسال شود.

برای محیط‌های با داده‌ی حساس، استقرار اختصاصی کل پشته شامل مدل embedding، پایگاه‌داده برداری و مدل زبانی روی زیرساخت سازمان، اغلب یک الزام است. به‌روزرسانی افزایشی ایندکس هنگام تغییر اسناد، ذکر منبع در پاسخ برای قابلیت ممیزی، و پایش کیفیت در تولید، اجزای جدایی‌ناپذیر یک معماری بالغ هستند.

گلدیتا معماری RAG سطح سازمانی با بازیابی ترکیبی، بازرتبه‌بندی، کنترل دسترسی در لایه‌ی بازیابی و استقرار کاملاً اختصاصی را ارائه می‌دهد تا سازمان‌ها دانش خود را بدون به‌خطر افتادن حریم داده به کار بگیرند.

آماده‌اید داده را به طلا تبدیل کنید؟

با کارشناسان گلدیتا درباره‌ی نیاز سازمان خود گفت‌وگو کنید؛ از معماری داده تا استقرار هوش مصنوعی، کنار شما هستیم.