اپل چند مدل هوش مصنوعی متن باز جدید عرضه کرده است که می توانند رقیبی برای مدل های کوچک گوگل و متا باشند. این مدل ها به صورت متن باز در دسترس محققان قرار گرفته اند.
ویژگی های مدل های جدید هوش مصنوعی اپل
اپل تحت پروژه ای به نام DCLM، چند مدل متن باز را معرفی کرده است. این خانواده شامل دو مدل اصلی است: یکی با 7 میلیارد پارامتر و دیگری با 1.4 میلیارد پارامتر. این مدل ها در بنچمارک ها عملکرد بسیار خوبی دارند. مدل بزرگتر به خصوص بهتر از مدل Mistral-7B عمل می کند و می تواند با مدل های پیشرو مانند Llama 3 از متا و Gemma از گوگل رقابت کند.
محققان اپل این مدل های جدید را با بهترین عملکرد متن باز معرفی کرده اند. این مدل ها به صورت متن باز در Hugging Face در دسترس هستند. در بنچمارک های MMLU، هر دو مدل امتیاز خوبی کسب کرده اند. مدل بزرگتر نسبت به مدل قبلی MAP-Neo، بهبود 6.6 درصدی در بنچمارک ها داشته است، در حالی که تا 40 درصد از محاسبات کمتری برای آموزش استفاده شده است. نسخه کوچک تر 1.4B نیز در تست های MMLU، Core و Extended عملکرد قابل توجهی داشته است.
مدل های متن باز OpenELM
اپل در اردیبهشت ماه نیز مدل های متن باز OpenELM را در چهار مدل مختلف معرفی کرده بود. این مدل ها شامل مدل های 270 میلیون پارامتری، 450 میلیون پارامتری، 1.1 میلیارد پارامتری و 3 میلیارد پارامتری بودند. این مدل ها در وظایف پردازش متن، مانند نوشتن ایمیل، عملکرد خوبی داشتند.
مدل های جدید هوش مصنوعی اپل بیشتر به عنوان پروژه های تحقیقاتی متن باز شناخته می شوند و احتمالاً در محصولات آینده اپل به کار گرفته نمی شوند.