OpenAI مدل پیشرفته o3-pro را با تمرکز بر استدلال و دقت علمی معرفی کرد

OpenAI روز سه‌شنبه مدل جدید هوش مصنوعی خود با نام o3-pro را معرفی کرد؛ مدلی که به گفته شرکت، پیشرفته‌ترین نسخه از سری مدل‌های خود تا به امروز است. مدل o3-pro نسخه ارتقاءیافته‌ای از مدل «استدلال‌محور» o3 است که اوایل سال جاری میلادی عرضه شده بود. این دسته از مدل‌ها…

حامد محمدی

دانش و فناوری

۲۱خرداد۱۴۰۴

2دقیقه

- اندازه متن +

OpenAI روز سه‌شنبه مدل جدید هوش مصنوعی خود با نام o3-pro را معرفی کرد؛ مدلی که به گفته شرکت، پیشرفته‌ترین نسخه از سری مدل‌های خود تا به امروز است.

مدل o3-pro نسخه ارتقاءیافته‌ای از مدل «استدلال‌محور» o3 است که اوایل سال جاری میلادی عرضه شده بود. این دسته از مدل‌ها به‌جای پاسخ‌دهی صرف، مسائل را به‌صورت مرحله‌به‌مرحله حل می‌کنند و همین امر باعث افزایش دقت و قابلیت اطمینان آن‌ها در حوزه‌هایی نظیر ریاضیات، فیزیک، کدنویسی و علوم مهندسی می‌شود.

این مدل از امروز در اختیار کاربران ChatGPT Pro و Team قرار گرفته و جایگزین مدل قبلی یعنی o1-pro شده است. کاربران سازمانی (Enterprise) و آموزشی (Edu) نیز از هفته آینده به آن دسترسی خواهند داشت. همچنین o3-pro از هم‌اکنون در API توسعه‌دهندگان OpenAI نیز فعال شده است.

OpenAI اعلام کرده قیمت استفاده از این مدل در API، ۲۰ دلار به ازای هر یک میلیون توکن ورودی و ۸۰ دلار برای هر یک میلیون توکن خروجی تعیین شده است. هر یک میلیون توکن ورودی تقریباً معادل ۷۵۰ هزار کلمه است.

بر اساس ارزیابی‌های داخلی OpenAI، o3-pro در تمامی زمینه‌های آزمون شده، از جمله علم، آموزش، برنامه‌نویسی، کسب‌وکار و تولید محتوا عملکرد بهتری نسبت به o3 داشته است. همچنین از نظر شفافیت، جامعیت، تبعیت از دستورالعمل‌ها و دقت پاسخ‌ها، بازخورد بهتری از ارزیاب‌ها دریافت کرده است.

این مدل به مجموعه‌ای از ابزارها نیز دسترسی دارد؛ از جمله جست‌وجو در وب، تحلیل فایل‌ها، پردازش ورودی‌های تصویری، کدنویسی با پایتون و امکان شخصی‌سازی پاسخ‌ها با استفاده از حافظه.

با این حال، OpenAI هشدار داده که پاسخ‌گویی o3-pro نسبت به مدل قبلی کندتر است. همچنین در حال حاضر امکان گفت‌وگوی موقت با این مدل غیرفعال شده و برخلاف برخی دیگر از مدل‌ها، o3-pro قادر به تولید تصویر نیست و از ویژگی Canvas (محیط کار هوش مصنوعی OpenAI) نیز پشتیبانی نمی‌کند.

در مقابل، طبق آزمون‌های داخلی، o3-pro در برخی بنچمارک‌های مهم عملکرد درخشانی داشته است. به عنوان مثال، در آزمون AIME 2024 (ارزیابی مهارت‌های ریاضی)، این مدل از Gemini 2.5 Pro گوگل عملکرد بهتری داشته است. همچنین در آزمون GPQA Diamond، مربوط به دانش سطح دکترای علوم، عملکرد بهتری از مدل Claude 4 Opus شرکت Anthropic ارائه داده است.