پایگاه دانش (Knowledge Base) که یک ویژگی بر پایه هوش مصنوعی است به عنوان بخشی از پلتفرم محصول AIaaS آروان‌کلاد برای نخستین بار ارایه شده است که به کاربران امکان ارتباط میان مدل‌های زبانی بزرگ و منابع داده‌ای اختصاصی‌شان را می‌دهد. پایگاه دانشی که آروان‌کلاد ارایه می‌دهد مزایای متنوعی را برای کاربران فراهم خواهد کرد؛ مانند سرویس مدیریت اسناد، انتخاب مدل Embedding، ذخیره‌سازی و مدیریت بُرداری، سرویس بازیابی و پایگاه داده بُرداری اختصاصی از جمله مزایایی هستند که در پایگاه دانش Knowledge Base آروان‌کلاد در اختیار کاربران قرار دارد. 

 

پایگاه دانش چیست؟

پایگاه دانش (Knowledge Base) یک سرویس مبتنی‌بر RAG (Retrieval-Augmented Generation) است که به عنوان بخشی از پلتفرم AIaaS ارایه می‌شود. پایگاه دانش به‌منظور ایجاد یک پل ارتباطی میان مدل‌های زبانی بزرگ (LLM) و منابع داده‌ای اختصاصی کاربران ایجاد می‌شود. مدل‌های زبانی استاندارد، روی داده‌های عمومی آموزش دیده‌اند و به اسناد داخلی، خصوصی یا بسیار جدید یک سازمان دسترسی ندارند. ویژگی پایگاه دانش این امکان را فراهم می‌آورد تا مدل‌های هوش مصنوعی بتوانند بر اساس محتوای مشخص و کنترل‌شده از سمت کاربر، پاسخ‌ دهند.

 

ویژگی‌های کلیدی پایگاه دانش

ویژگی‌های پایگاه دانش در این پلتفرم شامل موارد زیر است:

  1. سرویس مدیریت اسناد: امکان بارگذاری، مدیریت و حذف فایل‌هایی که به عنوان منبع دانش عمل می‌کنند.
  2. انتخاب مدل Embedding: انعطاف‌پذیری در انتخاب مدل مورد استفاده برای تبدیل متن به بُردار، که بر کیفیت جست‌وجوی معنایی تاثیرگذار است.
  3. ذخیره‌سازی و مدیریت بُرداری: مدیریت خودکار فرآیند تبدیل اسناد به بُردار و ذخیره‌سازی آن‌ها در یک پایگاه داده بهینه‌شده برای جست‌وجوی سریع.
  4. سرویس بازیابی (Retrieve): هسته اصلی RAG که مسوول یافتن اطلاعات مرتبط از میان اسناد کاربر در پاسخ به یک پرسش است.
  5.  پایگاه داده‌ی بُرداری اختصاصی  (Vector Store): به ازای هر پایگاه دانش، یک پایگاه داده اختصاصی برای کاربر در داشبوردش (سرویس Database آروان‌کلاد) ساخته می‌شود که علاوه‌بر فرآیند ساخت، نگهداری و حذف این پایگاه داده که به شکل خودکار است، دسترسی کامل به این دیتابیس نیز در اختیار کاربر خواهد بود.
  6. کاربران می‌توانند از مدل‌های مدیریت شده‌ی آروان‌کلاد (چه در بخش Embedding و چه LLM) استفاده کنند. این انعطاف‌پذیری موجب افزایش حاکمیت داده (هیچ کدام از داده‌های کاربران به خارج از ایران ارسال نشده و به‌طور کامل در زیرساخت GPU آروان‌کلاد پردازش و پاسخ داده می‌شود.)، کنترل امنیتی بیش‌تر، و افزایش دردسترس‌بودن/دسترس‌پذیری (High Availability) در محیط‌های سازمانی می‌شود.

 

فرآیند (RAG)

در روش RAG، پاسخ مدل زبانی تنها بر پایه‌ی داده‌های عمومی آن تولید نمی‌شود، بلکه با داده‌های اختصاصی کاربر تکمیل می‌شود. این فرآیند شامل مراحل زیر است:

  1. بارگذاری اسناد: کاربر فایل‌های خود (شامل اسناد متنی، PDF، Docx  و غیره) را در سیستم بارگذاری می‌کند. این فایل‌ها به عنوان منبع داده در نظر گرفته می‌شوند.
  2. تعبیه‌سازی (Embedding): محتوای اسناد به قطعات کوچک‌تر تقسیم شده (Chunking) و سپس با استفاده از یک «مدل تعبیه‌سازی یا Embedding Model» به بُردارهای عددی تبدیل می‌شوند. کاربران این امکان را دارند که مدل Embedding مورد نظر خود را بر اساس نیازهای پروژه (مانند دقت یا هزینه) انتخاب کنند. این بُردارها در یک پایگاه داده بُرداری (Vector Store) تخصصی ذخیره می‌شوند.
  3. بازیابی (Retrieval): هنگامی که کاربر سوال یا پرامپتی را ارسال می‌کند، سیستم ابتدا آن را به بُردار تبدیل کرده و با جست‌وجو در پایگاه داده بُرداری، مرتبط‌ترین قطعات اطلاعاتی را از اسناد بارگذاری‌شده بازیابی می‌کند.
  4. Augmentation / Context Building: بخش‌های بازیابی‌شده به‌عنوان context جمع‌بندی و مرتب می‌شوند و در کنار پرامپت اصلی آماده ارسال می‌شوند. در این مرحله ممکن است کارهایی مثل Chunking، فیلتر کردن و… رتبه‌بندی نتایج انجام شده تا بهترین محتوا برای مدل فراهم شود.
  5. تولید پاسخ  (Generation): اطلاعات بازیابی‌شده به عنوان زمینه (Context) به همراه پرامپت اصلی کاربر، به یک مدل زبانی بزرگ (LLM) ارسال می‌شود. مدل LLM سپس پاسخی را تولید می‌کند که به‌شکل مستقیم بر اساس اطلاعات ارایه‌شده از اسناد کاربر است.

 

چگونه Knowledge Base این پیچیدگی را ساده می‌کند؟

ویژگی Knowledge Base در AIaaS کل این زنجیره را به یک سرویس آماده تبدیل کرده است:

  • کاربران تنها کافی است فایل‌های خود را بارگذاری کنند؛ سامانه به‌شکل خودکار Embedding را با مدل انتخابی کاربر انجام می‌دهد.
  • داده‌ها در Vector store امن و مقیاس‌پذیر ذخیره می‌شوند.
  • هر پایگاه دانش (Knowledge Base) به‌شکل مجزا ایجاد می‌شود و کاربران مالکیت و کنترل کامل بر داده‌های خود دارند؛ از جمله مدیریت سطح دسترسی، حذف داده، انتخاب مدل Embedding و تعیین مدل‌های متصل به پایگاه دانش.
  • کاربران می‌توانند چند AI Endpoint (مانند GPT، Claude، Gemini، یا مدل‌های متن‌باز میزبانی‌شده) را به یک Knowledge Base متصل کنند.
  • پاسخ‌های مدل‌ها بر اساس داده‌های خاص هر سازمان شخصی‌سازی می‌شوند.

به‌این‌ترتیب، تیم‌های فنی و غیرفنی بدون نیاز به زیرساخت یا کدنویسی پیچیده، می‌توانند یک RAG کاملن عملیاتی داشته باشند.

 

کاربردهای پایگاه دانش

پایگاه دانش می‌تواند استفاده‌های گسترده‌ای در سازمان‌ها داشته باشد، از پرسش‌ و پاسخ اسناد داخلی گرفته تا دستیار فنی شدن برای توسعه‌دهندگان و آموزش و آنبوردینگ.

  1. سیستم‌های دانش داخلی (Internal Knowledge Systems): این مجموعه کاربردها بر توانمندسازی تیم‌های داخلی سازمان متمرکز است.
  • پرسش و پاسخ از اسناد سازمانی: کارکنان می‌توانند پرسش‌های خود را در مورد سیاست‌های داخلی، رویه‌های منابع انسانی (HR)، راهنماهای فنی یا مستندات مالی به‌طور مستقیم از سیستم بپرسند و پاسخ‌هایی بر پایه‌ی اسناد رسمی شرکت دریافت کنند.
  • دستیار فنی برای توسعه‌دهندگان: با بارگذاری مستندات فنی (Documentation)، راهنماهای API و پایگاه کدهای داخلی، تیم‌های مهندسی می‌توانند پرسش‌های فنی پیچیده را مطرح و راه‌حل‌ها یا نمونه کدهای مرتبط را به سرعت پیدا کنند.
  • آموزش و آنبوردینگ (Onboarding): می‌توان از این ویژگی برای ایجاد یک دستیار آموزشی برای کارکنان جدید استفاده کرد. این دستیار به پرسش‌های مرتبط با فرآیندهای ورود به سازمان، ابزارها و دانش مورد نیاز شغلی بر اساس راهنماهای آموزشی پاسخ می‌دهد. 
  1. سیستم‌های مواجهه با مشتری  (Customer-Facing Systems): این کاربردها به بهبود تجربه و پشتیبانی مشتریان نهایی کمک می‌کنند.
  • ربات‌های پشتیبانی مشتریان (Customer Support Bots): ایجاد چت‌بات‌هایی که به جای پاسخ‌های عمومی، بر اساس راهنمای محصولات، پایگاه دانش پشتیبانی (Helpdesk) و دستورالعمل‌های عیب‌یابی، پاسخ‌های دقیق و مرتبط به پرسش‌های مشتریان ارایه می‌دهند.
  • سیستم‌های پاسخ‌گویی هوشمند به پرسش‌های متداول (Intelligent FAQ): تبدیل بخش پرسش‌های متداول ایستا به یک رابط محاوره‌ای که می‌تواند پرسش‌های کاربران را با لحن‌های مختلف درک و پاسخ دقیق را از میان اسناد محصول استخراج کند.
  1. تحلیل و بازیابی اطلاعات (Information Analysis and Retrieval): این دسته از کاربردها بر پردازش و استخراج اطلاعات از حجم بالای اسناد تمرکز دارد.
  • تحلیل اسناد حقوقی و قراردادها: وکلا و تیم‌های حقوقی می‌توانند برای یافتن سریع بندهای خاص، تعهدات، یا ریسک‌های موجود در قراردادهای طولانی یا اسناد قانونی، از این سیستم استفاده کنند.
  • تحقیق و توسعه (R&D): محققان می‌توانند مقالات علمی، پتنت‌ها و نتایج آزمایش‌های داخلی را بارگذاری و از سیستم برای خلاصه‌سازی یافته‌ها، مقایسه روش‌ها یا استخراج داده‌های کلیدی استفاده کنند.
  • بررسی انطباق و مقررات (Compliance): سازمان‌ها می‌توانند اسناد مربوط به استانداردها (مانند ISO) را بارگذاری کنند تا بررسی کنند آیا رویه‌های داخلی با این الزامات مطابقت دارد یا خیر. 

پایگاه دانش آروان‌کلاد با ساده‌سازی فرآیند پیچیده‌ی RAG، مسیر استفاده امن و سریع از داده‌های سازمانی در مدل‌های هوش مصنوعی را فراهم کرده و گامی موثر در بومی‌سازی هوش مصنوعی سازمانی برداشته است.

برای استفاده و بهره‌مندی از سرویس پایگاه دانش می‌توانید به صفحه پایگاه دانش مراجعه کنید. 

ارسال پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *