شرکت OpenAI چند دقیقه قبل از اعلام انتشار مدل هوش مصنوعی استدلالی o3 mini خبر داد. این مدل جدید، برای اشتراک پولی ChatGPT آزاد شده و کاربران دارای اشتراک پلاس و بالاتر به سادگی می توانند از آن بهره ببرند. هدف از معرفی این سیستم، ارائه پاسخ های دقیق و سریع در حوزه های تخصصی می باشد.
مشخصات و عملکرد مدل o3 mini
شرکت OpenAI روز جمعه، عضو جدید خانواده مدل های استدلالی خود را معرفی کرد. مدل o3 mini به گونه ای طراحی شده تا به مسائل پیچیده در برنامه نویسی، ریاضیات و علوم پاسخ دهد. در فاز آزمایشی که از ماه آذر آغاز شد، این مدل به عنوان یک سیستم کارآمد و اقتصادی در اختیار تمامی کاربران ChatGPT قرار گرفته است. کاربران با فعال کردن علامت Reason در ChatGPT می توانند از عملکرد این مدل بهره مند شوند.
عملکرد o3 mini پیش از ارائه پاسخ، به صورت جامع آن را بررسی می کند. در این فرآیند، اعتبار پاسخ ها سنجیده می شود تا خطاهای رایج کاهش یابد. اگرچه این بررسی ممکن است کمی زمان بگیرد، اما نتیجه نهایی موجب دقت بالاتر در ارائه پاسخ می گردد. به گفته نمایندگان OpenAI، این اقدام گامی مؤثر در جهت گسترش دسترسی به هوش مصنوعی می باشد.
نتایج آزمایش های مستقل نشان داده که پاسخ های o3 mini در بیش از 50 درصد موارد نسبت به مدل های معمولی بهتر عمل کرده اند. همچنین در مقایسه با o1 mini، اشتباهات عمده تا 39 درصد کمتر گزارش شده است. سرعت ارائه پاسخ نیز بهبود یافته و حدود 24 درصد سریع تر می باشد. این نکته نشان دهنده تعادل مناسب بین سرعت و دقت در عملکرد مدل است.
در نسخه ChatGPT، o3 mini به صورت پیش فرض در حالت استدلال متوسط فعال است. این حالت، تعادل خوبی بین سرعت و دقت ارائه می دهد. کاربران دارای اشتراک ChatGPT Plus و Team می توانند تا 150 درخواست در روز از این مدل استفاده کنند. در عوض، مشترکان ChatGPT Pro دسترسی نامحدود خواهند داشت. همچنین به زودی مشتریان ChatGPT Enterprise و Edu نیز از امکانات این مدل بهره مند خواهند شد.
قیمت گذاری o3 mini به گونه ای تعیین شده است که هر یک میلیون توکن ورودی با قیمت 1.1 دلار و هر یک میلیون توکن خروجی با قیمت 4.40 دلار محاسبه می شود. این هزینه 63 درصد کمتر از قیمت مدل o1 mini می باشد. کاهش هزینه ها باعث شده تا o3 mini شانس بیشتری برای رقابت با مدل استدلالی R1 از شرکت DeepSeek داشته باشد.
در مقایسه با مدل DeepSeek R1، o3 mini در بسیاری از حوزه ها عملکرد قابل قبول و هزینه مناسبی ارائه می دهد. در آزمون های تخصصی مانند فیزیک، زیست شناسی و شیمی در سطح دکتری، تفاوت های جزئی مشاهده شده است. برای مثال، در آزمون AIME 2024، حالت o3 mini high حدود 0.3 درصد عملکرد بهتری نسبت به o1 نشان داد.
با بررسی های انجام شده، می توان گفت مدل o3 mini علاوه بر ارائه عملکرد دقیق، از نظر اقتصادی نیز گزینه مناسبی برای کاربران است. افزایش سرعت در ارائه پاسخ و کاهش هزینه ها، این مدل را به ابزاری کارآمد در حل مسائل تخصصی تبدیل کرده است. کاربران می توانند از تحلیل دقیق پاسخ ها و اعتبار سنجی آن ها اطمینان حاصل کنند.
به طور کلی، معرفی o3 mini نشان دهنده تلاش OpenAI برای بهبود دسترسی همگانی به هوش مصنوعی پیشرفته می باشد. بررسی های انجام شده و آزمایش های مستقل نشان می دهند که این مدل توانسته است نیازهای کاربران در حوزه های STEM را به خوبی برطرف کند. علاوه بر آن، با گسترش امکانات و بهبود عملکرد، انتظار می رود کاربردهای بیشتری برای o3 mini در صنایع مختلف پیدا شود.
این رویکرد باعث می شود تا هوش مصنوعی بتواند در محیط های آموزشی و پژوهشی نیز به عنوان ابزاری کارآمد شناخته شود. افزایش دقت، کاهش هزینه و سرعت بالا، سه عامل اصلی موفقیت o3 mini به شمار می آیند. بررسی های مستقل و تحلیل های کارشناسان نشان می دهد که این مدل می تواند در رقابت با سایر سیستم ها، جایگاه قابل توجهی کسب کند.