پایگاه دانش (Knowledge Base) که یک ویژگی بر پایه هوش مصنوعی است به عنوان بخشی از پلتفرم محصول AIaaS آروانکلاد برای نخستین بار ارایه شده است که به کاربران امکان ارتباط میان مدلهای زبانی بزرگ و منابع دادهای اختصاصیشان را میدهد. پایگاه دانشی که آروانکلاد ارایه میدهد مزایای متنوعی را برای کاربران فراهم خواهد کرد؛ مانند سرویس مدیریت اسناد، انتخاب مدل Embedding، ذخیرهسازی و مدیریت بُرداری، سرویس بازیابی و پایگاه داده بُرداری اختصاصی از جمله مزایایی هستند که در پایگاه دانش Knowledge Base آروانکلاد در اختیار کاربران قرار دارد.
پایگاه دانش چیست؟
پایگاه دانش (Knowledge Base) یک سرویس مبتنیبر RAG (Retrieval-Augmented Generation) است که به عنوان بخشی از پلتفرم AIaaS ارایه میشود. پایگاه دانش بهمنظور ایجاد یک پل ارتباطی میان مدلهای زبانی بزرگ (LLM) و منابع دادهای اختصاصی کاربران ایجاد میشود. مدلهای زبانی استاندارد، روی دادههای عمومی آموزش دیدهاند و به اسناد داخلی، خصوصی یا بسیار جدید یک سازمان دسترسی ندارند. ویژگی پایگاه دانش این امکان را فراهم میآورد تا مدلهای هوش مصنوعی بتوانند بر اساس محتوای مشخص و کنترلشده از سمت کاربر، پاسخ دهند.
ویژگیهای کلیدی پایگاه دانش
ویژگیهای پایگاه دانش در این پلتفرم شامل موارد زیر است:
- سرویس مدیریت اسناد: امکان بارگذاری، مدیریت و حذف فایلهایی که به عنوان منبع دانش عمل میکنند.
- انتخاب مدل Embedding: انعطافپذیری در انتخاب مدل مورد استفاده برای تبدیل متن به بُردار، که بر کیفیت جستوجوی معنایی تاثیرگذار است.
- ذخیرهسازی و مدیریت بُرداری: مدیریت خودکار فرآیند تبدیل اسناد به بُردار و ذخیرهسازی آنها در یک پایگاه داده بهینهشده برای جستوجوی سریع.
- سرویس بازیابی (Retrieve): هسته اصلی RAG که مسوول یافتن اطلاعات مرتبط از میان اسناد کاربر در پاسخ به یک پرسش است.
- پایگاه دادهی بُرداری اختصاصی (Vector Store): به ازای هر پایگاه دانش، یک پایگاه داده اختصاصی برای کاربر در داشبوردش (سرویس Database آروانکلاد) ساخته میشود که علاوهبر فرآیند ساخت، نگهداری و حذف این پایگاه داده که به شکل خودکار است، دسترسی کامل به این دیتابیس نیز در اختیار کاربر خواهد بود.
- کاربران میتوانند از مدلهای مدیریت شدهی آروانکلاد (چه در بخش Embedding و چه LLM) استفاده کنند. این انعطافپذیری موجب افزایش حاکمیت داده (هیچ کدام از دادههای کاربران به خارج از ایران ارسال نشده و بهطور کامل در زیرساخت GPU آروانکلاد پردازش و پاسخ داده میشود.)، کنترل امنیتی بیشتر، و افزایش دردسترسبودن/دسترسپذیری (High Availability) در محیطهای سازمانی میشود.
فرآیند (RAG)
در روش RAG، پاسخ مدل زبانی تنها بر پایهی دادههای عمومی آن تولید نمیشود، بلکه با دادههای اختصاصی کاربر تکمیل میشود. این فرآیند شامل مراحل زیر است:
- بارگذاری اسناد: کاربر فایلهای خود (شامل اسناد متنی، PDF، Docx و غیره) را در سیستم بارگذاری میکند. این فایلها به عنوان منبع داده در نظر گرفته میشوند.
- تعبیهسازی (Embedding): محتوای اسناد به قطعات کوچکتر تقسیم شده (Chunking) و سپس با استفاده از یک «مدل تعبیهسازی یا Embedding Model» به بُردارهای عددی تبدیل میشوند. کاربران این امکان را دارند که مدل Embedding مورد نظر خود را بر اساس نیازهای پروژه (مانند دقت یا هزینه) انتخاب کنند. این بُردارها در یک پایگاه داده بُرداری (Vector Store) تخصصی ذخیره میشوند.
- بازیابی (Retrieval): هنگامی که کاربر سوال یا پرامپتی را ارسال میکند، سیستم ابتدا آن را به بُردار تبدیل کرده و با جستوجو در پایگاه داده بُرداری، مرتبطترین قطعات اطلاعاتی را از اسناد بارگذاریشده بازیابی میکند.
- Augmentation / Context Building: بخشهای بازیابیشده بهعنوان context جمعبندی و مرتب میشوند و در کنار پرامپت اصلی آماده ارسال میشوند. در این مرحله ممکن است کارهایی مثل Chunking، فیلتر کردن و… رتبهبندی نتایج انجام شده تا بهترین محتوا برای مدل فراهم شود.
- تولید پاسخ (Generation): اطلاعات بازیابیشده به عنوان زمینه (Context) به همراه پرامپت اصلی کاربر، به یک مدل زبانی بزرگ (LLM) ارسال میشود. مدل LLM سپس پاسخی را تولید میکند که بهشکل مستقیم بر اساس اطلاعات ارایهشده از اسناد کاربر است.
چگونه Knowledge Base این پیچیدگی را ساده میکند؟
ویژگی Knowledge Base در AIaaS کل این زنجیره را به یک سرویس آماده تبدیل کرده است:
- کاربران تنها کافی است فایلهای خود را بارگذاری کنند؛ سامانه بهشکل خودکار Embedding را با مدل انتخابی کاربر انجام میدهد.
- دادهها در Vector store امن و مقیاسپذیر ذخیره میشوند.
- هر پایگاه دانش (Knowledge Base) بهشکل مجزا ایجاد میشود و کاربران مالکیت و کنترل کامل بر دادههای خود دارند؛ از جمله مدیریت سطح دسترسی، حذف داده، انتخاب مدل Embedding و تعیین مدلهای متصل به پایگاه دانش.
- کاربران میتوانند چند AI Endpoint (مانند GPT، Claude، Gemini، یا مدلهای متنباز میزبانیشده) را به یک Knowledge Base متصل کنند.
- پاسخهای مدلها بر اساس دادههای خاص هر سازمان شخصیسازی میشوند.
بهاینترتیب، تیمهای فنی و غیرفنی بدون نیاز به زیرساخت یا کدنویسی پیچیده، میتوانند یک RAG کاملن عملیاتی داشته باشند.
کاربردهای پایگاه دانش
پایگاه دانش میتواند استفادههای گستردهای در سازمانها داشته باشد، از پرسش و پاسخ اسناد داخلی گرفته تا دستیار فنی شدن برای توسعهدهندگان و آموزش و آنبوردینگ.
- سیستمهای دانش داخلی (Internal Knowledge Systems): این مجموعه کاربردها بر توانمندسازی تیمهای داخلی سازمان متمرکز است.
- پرسش و پاسخ از اسناد سازمانی: کارکنان میتوانند پرسشهای خود را در مورد سیاستهای داخلی، رویههای منابع انسانی (HR)، راهنماهای فنی یا مستندات مالی بهطور مستقیم از سیستم بپرسند و پاسخهایی بر پایهی اسناد رسمی شرکت دریافت کنند.
- دستیار فنی برای توسعهدهندگان: با بارگذاری مستندات فنی (Documentation)، راهنماهای API و پایگاه کدهای داخلی، تیمهای مهندسی میتوانند پرسشهای فنی پیچیده را مطرح و راهحلها یا نمونه کدهای مرتبط را به سرعت پیدا کنند.
- آموزش و آنبوردینگ (Onboarding): میتوان از این ویژگی برای ایجاد یک دستیار آموزشی برای کارکنان جدید استفاده کرد. این دستیار به پرسشهای مرتبط با فرآیندهای ورود به سازمان، ابزارها و دانش مورد نیاز شغلی بر اساس راهنماهای آموزشی پاسخ میدهد.
- سیستمهای مواجهه با مشتری (Customer-Facing Systems): این کاربردها به بهبود تجربه و پشتیبانی مشتریان نهایی کمک میکنند.
- رباتهای پشتیبانی مشتریان (Customer Support Bots): ایجاد چتباتهایی که به جای پاسخهای عمومی، بر اساس راهنمای محصولات، پایگاه دانش پشتیبانی (Helpdesk) و دستورالعملهای عیبیابی، پاسخهای دقیق و مرتبط به پرسشهای مشتریان ارایه میدهند.
- سیستمهای پاسخگویی هوشمند به پرسشهای متداول (Intelligent FAQ): تبدیل بخش پرسشهای متداول ایستا به یک رابط محاورهای که میتواند پرسشهای کاربران را با لحنهای مختلف درک و پاسخ دقیق را از میان اسناد محصول استخراج کند.
- تحلیل و بازیابی اطلاعات (Information Analysis and Retrieval): این دسته از کاربردها بر پردازش و استخراج اطلاعات از حجم بالای اسناد تمرکز دارد.
- تحلیل اسناد حقوقی و قراردادها: وکلا و تیمهای حقوقی میتوانند برای یافتن سریع بندهای خاص، تعهدات، یا ریسکهای موجود در قراردادهای طولانی یا اسناد قانونی، از این سیستم استفاده کنند.
- تحقیق و توسعه (R&D): محققان میتوانند مقالات علمی، پتنتها و نتایج آزمایشهای داخلی را بارگذاری و از سیستم برای خلاصهسازی یافتهها، مقایسه روشها یا استخراج دادههای کلیدی استفاده کنند.
- بررسی انطباق و مقررات (Compliance): سازمانها میتوانند اسناد مربوط به استانداردها (مانند ISO) را بارگذاری کنند تا بررسی کنند آیا رویههای داخلی با این الزامات مطابقت دارد یا خیر.
پایگاه دانش آروانکلاد با سادهسازی فرآیند پیچیدهی RAG، مسیر استفاده امن و سریع از دادههای سازمانی در مدلهای هوش مصنوعی را فراهم کرده و گامی موثر در بومیسازی هوش مصنوعی سازمانی برداشته است.
برای استفاده و بهرهمندی از سرویس پایگاه دانش میتوانید به صفحه پایگاه دانش مراجعه کنید.



