استنتاج محلی — Qwen3 32B AWQ

هوش مصنوعی داخلی برای توسعه‌دهندگان، شرکت‌ها و سازمان‌ها

API سازگار با OpenAI، اجراشده روی GPU اختصاصی، مناسب چت‌بات، اتوماسیون، تحلیل اسناد و دستیارهای سازمانی

مدل Qwen3 32B AWQ روی vLLM و GPU اختصاصی — بدون وابستگی به OpenAI یا Claude.

Endpointهای /v1/models و /v1/chat/completions برای SDKهای رسمی.

پاسخ‌گویی پیش‌فرض به فارسی روان و حرفه‌ای.

ردیابی توکن، اعتبار، Request ID و گزارش مصرف.

چت‌بات، اتوماسیون، پشتیبانی و ابزارهای آماده.

آپلود اسناد و پاسخ‌گویی بر اساس منابع داخلی (RAG).

چت‌بات قابل نصب روی وب‌سایت با RTL فارسی.

Playground، مستندات و نمونه کد Python/Node/cURL.

پیش‌نمایش مارکت‌پلیس

از ۹۹۰٬۰۰۰ تومان برای توسعه‌دهندگان تا پلن سازمانی سفارشی.

تمام پاسخ‌های AI از GPU داخلی ما سرو می‌شوند. IranCopilot مدل خارجی را شبیه‌سازی نمی‌کند.

خیر. استنتاج روی GPU اختصاصی ما با vLLM انجام می‌شود. API سازگار با OpenAI است اما مدل واقعی Qwen3 32B AWQ به‌صورت محلی سرو می‌شود.

سرویس اختیاری و جدا از استنتاج محلی. فقط در صورت پیکربندی توسط ادمین فعال می‌شود.

فقط مدل واقعی Qwen3 32B AWQ (gpuserver-qwen3) با context 4096.