پرش به محتوای اصلی
هوش مصنوعی مولد

تولید تقویت‌شده با بازیابی

RAG (Retrieval-Augmented Generation)

تکنیکی که پاسخ مدل زبانی را با بازیابی اطلاعات مرتبط از منابع دانش بیرونی غنی و مستند می‌کند.

تولید تقویت‌شده با بازیابی (RAG) معماری‌ای است که مدل زبانی بزرگ را با یک سامانه‌ی بازیابی اطلاعات ترکیب می‌کند. به‌جای آنکه مدل صرفاً بر دانش درونی و ثابت خود تکیه کند، نخست اسناد و قطعه‌های مرتبط با پرسش کاربر از یک پایگاه دانش بازیابی شده و سپس به‌عنوان زمینه (context) در اختیار مدل قرار می‌گیرد تا پاسخی دقیق و مستند تولید کند.

RAG چگونه کار می‌کند؟

  • ایندکس‌سازی: اسناد به قطعه‌ها تقسیم و به امبدینگ‌های برداری تبدیل و در پایگاه‌داده‌ی برداری ذخیره می‌شوند
  • بازیابی: پرسش کاربر به بردار تبدیل و مرتبط‌ترین قطعه‌ها از پایگاه برداری بازیابی می‌شوند
  • افزایش زمینه: قطعه‌های بازیابی‌شده به پرامپت افزوده می‌شوند
  • تولید: مدل زبانی با تکیه بر این زمینه، پاسخ نهایی را می‌سازد

چرا RAG مهم است؟

RAG دو چالش بزرگ مدل‌های زبانی را برطرف می‌کند: نخست، توهم (Hallucination) و تولید اطلاعات نادرست را کاهش می‌دهد، چون پاسخ بر منابع واقعی استوار است؛ دوم، امکان استفاده از دانش روزآمد و اختصاصی سازمان را بدون نیاز به بازآموزی پرهزینه‌ی مدل فراهم می‌کند.

کاربردها

  • دستیار پاسخ‌گو به پرسش بر پایه‌ی اسناد داخلی سازمان
  • پشتیبانی مشتری مبتنی بر پایگاه دانش
  • جست‌وجوی معنایی و خلاصه‌سازی مستندات
RAG به مدل زبانی حافظه‌ای روزآمد و قابل‌استناد می‌دهد؛ پاسخی که می‌توان منبعش را نشان داد، پاسخی است که می‌توان به آن اعتماد کرد.

GoldData LLM Cloud قابلیت ساخت سامانه‌های RAG با امبدینگ، پایگاه‌داده‌ی برداری و مدل‌های زبانی فارسی را با تضمین حریم خصوصی و امکان استقرار اختصاصی ارائه می‌دهد.

آماده‌اید داده را به طلا تبدیل کنید؟

با کارشناسان گلدیتا درباره‌ی نیاز سازمان خود گفت‌وگو کنید؛ از معماری داده تا استقرار هوش مصنوعی، کنار شما هستیم.