OpenAI روز سهشنبه مدل جدید هوش مصنوعی خود با نام o3-pro را معرفی کرد؛ مدلی که به گفته شرکت، پیشرفتهترین نسخه از سری مدلهای خود تا به امروز است.
مدل o3-pro نسخه ارتقاءیافتهای از مدل «استدلالمحور» o3 است که اوایل سال جاری میلادی عرضه شده بود. این دسته از مدلها بهجای پاسخدهی صرف، مسائل را بهصورت مرحلهبهمرحله حل میکنند و همین امر باعث افزایش دقت و قابلیت اطمینان آنها در حوزههایی نظیر ریاضیات، فیزیک، کدنویسی و علوم مهندسی میشود.
این مدل از امروز در اختیار کاربران ChatGPT Pro و Team قرار گرفته و جایگزین مدل قبلی یعنی o1-pro شده است. کاربران سازمانی (Enterprise) و آموزشی (Edu) نیز از هفته آینده به آن دسترسی خواهند داشت. همچنین o3-pro از هماکنون در API توسعهدهندگان OpenAI نیز فعال شده است.
OpenAI اعلام کرده قیمت استفاده از این مدل در API، ۲۰ دلار به ازای هر یک میلیون توکن ورودی و ۸۰ دلار برای هر یک میلیون توکن خروجی تعیین شده است. هر یک میلیون توکن ورودی تقریباً معادل ۷۵۰ هزار کلمه است.
بر اساس ارزیابیهای داخلی OpenAI، o3-pro در تمامی زمینههای آزمون شده، از جمله علم، آموزش، برنامهنویسی، کسبوکار و تولید محتوا عملکرد بهتری نسبت به o3 داشته است. همچنین از نظر شفافیت، جامعیت، تبعیت از دستورالعملها و دقت پاسخها، بازخورد بهتری از ارزیابها دریافت کرده است.
این مدل به مجموعهای از ابزارها نیز دسترسی دارد؛ از جمله جستوجو در وب، تحلیل فایلها، پردازش ورودیهای تصویری، کدنویسی با پایتون و امکان شخصیسازی پاسخها با استفاده از حافظه.
با این حال، OpenAI هشدار داده که پاسخگویی o3-pro نسبت به مدل قبلی کندتر است. همچنین در حال حاضر امکان گفتوگوی موقت با این مدل غیرفعال شده و برخلاف برخی دیگر از مدلها، o3-pro قادر به تولید تصویر نیست و از ویژگی Canvas (محیط کار هوش مصنوعی OpenAI) نیز پشتیبانی نمیکند.
در مقابل، طبق آزمونهای داخلی، o3-pro در برخی بنچمارکهای مهم عملکرد درخشانی داشته است. به عنوان مثال، در آزمون AIME 2024 (ارزیابی مهارتهای ریاضی)، این مدل از Gemini 2.5 Pro گوگل عملکرد بهتری داشته است. همچنین در آزمون GPQA Diamond، مربوط به دانش سطح دکترای علوم، عملکرد بهتری از مدل Claude 4 Opus شرکت Anthropic ارائه داده است.
نظر شما در مورد این مطلب چیه؟