نورنیوز - گروه اقتصادی: استارتاپ هوش مصنوعی xAI متعلق به ایلان ماسک، به تازگی از مدل جدید هوش مصنوعی خود با نام Grok 4 رونمایی کرد. این مدل که رقیب مستقیم ChatGPT و جمنای محسوب میشود، قابلیت تحلیل تصاویر و پاسخدهی دقیق به سوالات پیچیده را دارد. همزمان با معرفی این مدل، xAI شرکت هوش مصنوعی ایلان ماسک، طرح اشتراک پرهزینه و ویژه خود با عنوان SuperGrok Heavy را با قیمت ماهانه ۳۰۰ دلار ارائه کرده است.
گراک بالاتر از علم پزشکی
ایلان ماسک اعلام کرده است که Grok 4 توانسته در حوزه سوالات آکادمیک، بدون استثنا در تمامی موضوعات، عملکردی بهتر از سطح دکتری داشته باشد. علاوه بر این، xAI نسخه ارتقا یافته و چندوجهی این مدل را با نام Grok 4 Heavy عرضه کرده است که قدرت و امکانات بیشتری دارد.
براساس نتایج بنچمارکها، Grok 4 در آزمون «Humanity’s Last Exam» که شامل هزاران سوال در زمینه علوم انسانی، ریاضی و علوم طبیعی است، با کسب امتیاز ۲۵٫۴ درصد، عملکردی بهتر از مدلهای مطرحی مانند جمنای ۲٫۵ پرو (۲۱٫۶ درصد) و OpenAI o3 (۲۱ درصد) داشته است. نسخه Grok 4 Heavy با کمک ابزارهای کمکی توانست امتیاز چشمگیر ۴۴٫۴ درصد را در همین آزمون کسب کند، در حالی که جمنای با ابزارهای مشابه تنها ۲۶٫۹ درصد کسب کرده است.
در آزمون مستقل دیگری به نام ARC-AGI-2 که تمرکز آن بر تشخیص الگوهای بصری و حل پازل است، گراک توانست با امتیاز ۱۶٫۲ درصد، تقریبا دو برابر مدل دوم یعنی Claude Opus 4 ظاهر شود.
xAI با ارائه API گراک ۴، امکان استفاده توسعهدهندگان از این مدل را برای ساخت اپلیکیشنهای هوش مصنوعی فراهم کرده است. همچنین این شرکت در حال مذاکره با ارائهدهندگان بزرگ خدمات ابری برای انتشار Grok از طریق پلتفرمهای ابری است.
اشتراک SuperGrok Heavy علاوه بر دسترسی زودهنگام به نسخه Grok 4 Heavy، امکان تست قابلیتها و ویژگیهای جدید در آینده را نیز فراهم میکند. این اشتراک، گرانترین پلن در میان ارائهدهندگان مطرح مدلهای هوش مصنوعی به شمار میرود.
رونمایی از این نسخه جدید همزمان با دورهای پرچالش برای گروه شرکتهای تحت مدیریت ایلان ماسک بود؛ به طوری که لیندا یاکارینو، مدیرعامل ایکس، پس از دو سال از سمت خود کنارهگیری کرد و جایگزین او هنوز مشخص نشده است.
با وجود پیشرفتهای فنی چشمگیر، این تحولات ممکن است چالشهایی را در پذیرش Grok توسط کسبوکارها به وجود آورد، بهخصوص در مقایسه با رقبای قدرتمندی مانند ChatGPT، کلاد و جمنای. هنوز مشخص نیست که مشتریان سازمانی تا چه حد به این فناوری نوظهور اعتماد خواهند کرد.