DeepSeek R2 رقیب ارزان قیمت برای چت جی پی تی

توسط رها وصالی

شرکت چینی DeepSeek بار دیگر آماده است با معرفی مدل جدید خود یعنی DeepSeek R2 دنیا را شگفت زده کند. این مدل جدید که به زودی رونمایی می شود، می تواند هزینه های پردازش هوش مصنوعی را به شکل بی سابقه ای کاهش دهد.

براساس اطلاعات اولیه منتشر شده، هزینه استفاده از DeepSeek R2 در مقایسه با مدل قدرتمند GPT-4 نزدیک به 97 درصد کمتر است. این خبر برای بسیاری از کسب و کارها که به دنبال مدل های هوش مصنوعی ارزان و کارآمد هستند، می تواند به منزله یک تحول بزرگ باشد.

ویژگی های منحصر به فرد DeepSeek R2

مدل جدید DeepSeek R2 از معماری ترکیب خبرگان یا MoE بهره می برد که به طور قابل توجهی نسبت به نسخه های قبلی بهبود یافته است. این ساختار پیشرفته شامل لایه های متراکم و سیستم دروازه ای بهینه شده است تا بارهای محاسباتی پیچیده را با راندمان بالاتری مدیریت کند.

جالب اینجاست که تعداد پارامترهای DeepSeek R2 به عدد فوق العاده 1.2 تریلیون رسیده است. این رقم دو برابر بزرگ تر از مدل قبلی یعنی R1 است و می تواند قدرت پردازشی بی نظیری ارائه دهد. این پیشرفت نشان دهنده جاه طلبی DeepSeek برای ورود جدی تر به رقابت با غول هایی مانند OpenAI و گوگل است.

براساس اطلاعات فاش شده، DeepSeek R2 نه تنها از نظر پارامترها بلکه از لحاظ هزینه پردازش هم یک جهش بزرگ خواهد بود. هزینه پردازش هر توکن در این مدل حدود 97.4 درصد کمتر از GPT-4 محاسبه شده است. این کاهش هزینه می تواند بازار هوش مصنوعی را متحول کند و دسترسی به مدل های پیشرفته را برای طیف وسیع تری از کسب و کارها فراهم کند.

قدرت DeepSeek R2 به کمک تراشه های هوآوی

یکی از نکات مهم در توسعه DeepSeek R2 استفاده از تراشه های Ascend 910B شرکت هوآوی است. این تراشه ها که قدرت محاسباتی بسیار بالایی دارند، ستون فقرات پردازش های DeepSeek R2 را تشکیل می دهند.

برآوردها نشان می دهند که حدود 82 درصد ظرفیت یکی از بزرگترین خوشه های تراشه Ascend برای آموزش این مدل استفاده شده است. این خوشه قادر است قدرتی معادل 512 پتافلاپس با دقت FP16 ارائه دهد که در نوع خود بی نظیر است.

تصمیم DeepSeek برای استفاده از منابع داخلی چینی، اقدامی استراتژیک و بسیار هوشمندانه محسوب می شود. این اقدام باعث می شود که شرکت به زنجیره تامین بومی تکیه کند و از تحریم ها یا محدودیت های خارجی در امان باشد.

این مسئله نشان می دهد که چین در مسیر توسعه اکوسیستم هوش مصنوعی مستقل خود قدم های بلندی برداشته و دیگر برای پیشرفت در این زمینه نیازی به فناوری های غربی ندارد.

تاثیر احتمالی DeepSeek R2 بر آینده هوش مصنوعی

هرچند اطلاعات مربوط به DeepSeek R2 هنوز به طور رسمی تایید نشده، اما اگر این مدل با مشخصاتی که اعلام شده عرضه شود، می تواند معادلات بازار هوش مصنوعی را تغییر دهد.

با توجه به کاهش چشمگیر هزینه ها و قدرت بالای این مدل، بسیاری از شرکت ها و استارتاپ ها که تا پیش از این توان استفاده از مدل هایی مانند GPT-4 را نداشتند، اکنون می توانند به سادگی وارد بازی شوند.

این تحول می تواند باعث گسترش سریع تر استفاده از هوش مصنوعی در صنایع مختلف شود. از تجارت الکترونیک گرفته تا خدمات درمانی و آموزش، همه می توانند از مزایای مدل های مقرون به صرفه ای مثل DeepSeek R2 بهره مند شوند.

با ظهور چنین مدل هایی، رقابت بین بازیگران اصلی حوزه هوش مصنوعی شدت بیشتری خواهد گرفت. شرکت هایی مثل OpenAI، گوگل و آنتروپیک باید راهکارهای تازه ای برای حفظ برتری خود پیدا کنند.

تا عرضه رسمی DeepSeek R2 شاید زمان زیادی باقی نمانده باشد، اما همین حالا هم هیجان زیادی در بین کارشناسان و فعالان حوزه هوش مصنوعی ایجاد شده است. همه منتظرند ببینند آیا این مدل می تواند وعده های داده شده را محقق کند یا خیر.

همچنین ممکن است دوست داشته باشید

دیدگاهی بنویسید