یک هفته دیگر، یک مدل هوش مصنوعی دیگر حداقل در معیارها از GPT-4 پیشی گرفت. این بار، آنتروپیک است، شرکتی که توسط اعضای سابق OpenAI، دانیلا و داریو آمودی، که خواهر و برادر هستند، تشکیل شده است. این شرکت خانواده ای از مدل های Claude 3 را با مدل های Opus (بزرگترین و تواناترین)، Sonnet (متوسط) و هایکو (کوچکترین) عرضه کرده است. Anthropic می گوید که مدل Claude 3 Opus GPT-4 و Gemini 1.0 Ultra را در همه بنچمارک های محبوب شکست می دهد.
معیارهای کلود 3
Anthropic هر سه مدل را بر روی معیارهای محبوبی مانند MMLU، GPQA، GSM8K، MATH، HumanEval، HellaSwag و غیره آزمایش کرده است. در MMLU، Claude 3 Opus امتیاز 86.8٪ در حالی که GPT-4 دارای امتیاز گزارش شده 86.4٪ است. Gemini 1.0 Ultra 83.7٪ را در همان تکنیک تحریک 5 شلیک به دست آورد.
![معیارهای کلود 3 در مقابل gpt-4 در مقابل gemini ultra](https://colbe.ir/wp-content/uploads/2024/03/Anthropic-مدل-های-هوش-مصنوعی-کلود-3-را-معرفی-کرد.jpg)
در معیار HumanEval که توانایی کدنویسی را آزمایش می کند، بزرگترین مدل Opus امتیاز 84.9٪، بسیار بالاتر از امتیاز 67% GPT-4 و امتیاز 74.4% Gemini 1.0 Ultra. مدل Clade 3 Opus حتی GPT-4 را در تست HellaSwag اما با اختلاف کمی شکست داد. امتیاز 95.4% در حالی که GPT-4 95.3% و Gemini 1.0 Ultra به 87.8% رسید.
قابلیت های کلود 3
به طور کلی، بزرگترین مدل کلود 3 اپوس بسیار امیدوار کننده به نظر می رسد و ما قطعا آن را در برابر GPT-4، Gemini 1.5 Pro و Mistral Large آزمایش خواهیم کرد، پس با ما همراه باشید. جدای از آن، آنتروپیک میگوید که هر سه مدل دارای قابلیتهای زیادی در تحلیل و پیشبینی، ایجاد محتوای ظریف، تولید کد و تسلط به زبانهای بینالمللی مانند اسپانیایی، ژاپنی و فرانسوی.
![قابلیت opus vision](https://colbe.ir/wp-content/uploads/2024/03/1709600337_431_Anthropic-مدل-های-هوش-مصنوعی-کلود-3-را-معرفی-کرد.jpg)
مدلهای کلود 3 نیز دارای قابلیت دید هستند، با این حال، آنتروپیک آنها را به عنوان مدلهای چندوجهی بازاریابی نمیکند. Anthropic می گوید که قابلیت چشم انداز در Claude 3 می تواند به مشتریان سازمانی در پردازش نمودارها، نمودارها و نمودارهای فنی کمک کند. در معیارها، آن را بهتر از GPT-4V عمل می کند اما کمی از Gemini 1.0 Ultra عقب است.
200K طول زمینه
از نظر طول زمینه، آنتروپیک می گوید که هر سه مدل در ابتدا یک پنجره زمینه از 200 هزار توکن ارائه می دهند که باید بگویم که بسیار بزرگ است. علاوه بر این، این شرکت می گوید که مدل های خانواده کلود 3 می توانند بیش از 1 میلیون توکن را پردازش کنیدبا این حال، این قابلیت فقط برای مشتریان منتخب در دسترس خواهد بود.
![تست اپوس نیا](https://colbe.ir/wp-content/uploads/2024/03/1709600337_294_Anthropic-مدل-های-هوش-مصنوعی-کلود-3-را-معرفی-کرد.jpg)
در تست Needle In A Haystack (NIAH) با بیش از 200 هزار توکن، مدل Opus عملکرد فوقالعادهای با بیش از 99٪ بازیابی دقیقدرست مانند Gemini 1.5 Pro. Claude یکی از بهترین مدلهای هوش مصنوعی برای بازیابی متن طولانی بوده است و عملکرد با Claude 3 به طور قابل توجهی بهبود یافته است.
عملکرد و قیمت گذاری
در مورد عملکرد، Anthropic بیان می کند که مدل های Claude 3 بسیار سریع هستند و بزرگترین مدل Opus همان عملکرد Claude 2 و 2.1 را ارائه می دهد، اما با هوش بهتر. مدل Sonnet سایز متوسط تقریبا 2 برابر سریعتر از کلود 2 و 2.1. علاوه بر این، Anthropic اشاره می کند که مدل های Claude 3 به طور قابل توجهی کمتر از پاسخ دادن امتناع می کنند، که در مدل های قبلی یک مشکل بود.
می توانید با عضویت در Claude Pro شروع به استفاده از مدل پرچمدار Opus کنید 23.60 دلار قیمت دارد پس از کسر مالیات و غزل کلود 3 با اندازه متوسط قبلاً در نسخه رایگان claude.ai (بازدید) مستقر شده است. در نهایت، توسعه دهندگان می توانند بلافاصله به API های مدل های Opus و Sonnet دسترسی داشته باشند.
![قیمت گذاری API کلود 3](https://colbe.ir/wp-content/uploads/2024/03/1709600337_162_Anthropic-مدل-های-هوش-مصنوعی-کلود-3-را-معرفی-کرد.jpg)
در مورد قیمت گذاری API، Claude 3 Opus با یک پنجره زمینه 200K 15 دلار به ازای هر یک میلیون توکن (ورودی) هزینه دارد. 75 دلار به ازای هر یک میلیون توکن (خروجی). در مقایسه با GPT-4 Turbo (ورودی 10 دلار / خروجی 30 دلار با زمینه 128 هزار دلاری)، قیمت گذاری بسیار گران به نظر می رسد.
با این وجود، نظر شما در مورد خانواده جدید مدل های عرضه شده توسط آنتروپیک، به خصوص مدل Opus چیست؟ در بخش نظرات زیر به ما اطلاع دهید.
با کُلبه وبسایت و مجله فناوری و ابزارهای هوشمند ،بهترین تکنولوژی، بهترین آینده ، بروز بمانید