استنتاج محلی — Qwen3 32B AWQ
هوش مصنوعی داخلی برای توسعهدهندگان، شرکتها و سازمانها
API سازگار با OpenAI، اجراشده روی GPU اختصاصی، مناسب چتبات، اتوماسیون، تحلیل اسناد و دستیارهای سازمانی
استنتاج GPU محلی
مدل Qwen3 32B AWQ روی vLLM و GPU اختصاصی — بدون وابستگی به OpenAI یا Claude.
API سازگار با OpenAI
Endpointهای /v1/models و /v1/chat/completions برای SDKهای رسمی.
هوش مصنوعی فارسیمحور
پاسخگویی پیشفرض به فارسی روان و حرفهای.
داشبورد مصرف
ردیابی توکن، اعتبار، Request ID و گزارش مصرف.
مارکتپلیس ایجنت
چتبات، اتوماسیون، پشتیبانی و ابزارهای آماده.
پایگاه دانش سازمانی
آپلود اسناد و پاسخگویی بر اساس منابع داخلی (RAG).
ویجت وبسایت
چتبات قابل نصب روی وبسایت با RTL فارسی.
ابزار توسعهدهنده
Playground، مستندات و نمونه کد Python/Node/cURL.
پیشنمایش مارکتپلیس
- چتبات پشتیبانی وبسایت
- دستیار پایگاه دانش
- ربات بله/تلگرام
- پرسش از اسناد
امنیت و استنتاج محلی
تمام پاسخهای AI از GPU داخلی ما سرو میشوند. IranCopilot مدل خارجی را شبیهسازی نمیکند.
- مدل فعال: Qwen3 32B AWQ (gpuserver-qwen3)
- Backend: vLLM روی IranCopilot
- جستجوی وب: اختیاری و جدا از استنتاج محلی
- کلیدهای API: ذخیره هششده (هرگز plain text)
سوالات متداول
آیا IranCopilot از OpenAI یا ChatGPT استفاده میکند؟
خیر. استنتاج روی GPU اختصاصی ما با vLLM انجام میشود. API سازگار با OpenAI است اما مدل واقعی Qwen3 32B AWQ بهصورت محلی سرو میشود.
جستجوی وب چیست؟
سرویس اختیاری و جدا از استنتاج محلی. فقط در صورت پیکربندی توسط ادمین فعال میشود.
چه مدلی فعال است؟
فقط مدل واقعی Qwen3 32B AWQ (gpuserver-qwen3) با context 4096.