Anthropic مدل های هوش مصنوعی کلود 3 را معرفی کرد. GPT-4 و Gemini 1.0 Ultra را شکست می دهد

زمان مطالعه: 4 دقیقه

یک هفته دیگر، یک مدل هوش مصنوعی دیگر حداقل در معیارها از GPT-4 پیشی گرفت. این بار، آنتروپیک است، شرکتی که توسط اعضای سابق OpenAI، دانیلا و داریو آمودی، که خواهر و برادر هستند، تشکیل شده است. این شرکت خانواده ای از مدل های Claude 3 را با مدل های Opus (بزرگترین و تواناترین)، Sonnet (متوسط) و هایکو (کوچکترین) عرضه کرده است. Anthropic می گوید که مدل Claude 3 Opus GPT-4 و Gemini 1.0 Ultra را در همه بنچمارک های محبوب شکست می دهد.

معیارهای کلود 3

Anthropic هر سه مدل را بر روی معیارهای محبوبی مانند MMLU، GPQA، GSM8K، MATH، HumanEval، HellaSwag و غیره آزمایش کرده است. در MMLU، Claude 3 Opus امتیاز 86.8٪ در حالی که GPT-4 دارای امتیاز گزارش شده 86.4٪ است. Gemini 1.0 Ultra 83.7٪ را در همان تکنیک تحریک 5 شلیک به دست آورد.

در معیار HumanEval که توانایی کدنویسی را آزمایش می کند، بزرگترین مدل Opus امتیاز 84.9٪، بسیار بالاتر از امتیاز 67% GPT-4 و امتیاز 74.4% Gemini 1.0 Ultra. مدل Clade 3 Opus حتی GPT-4 را در تست HellaSwag اما با اختلاف کمی شکست داد. امتیاز 95.4% در حالی که GPT-4 95.3% و Gemini 1.0 Ultra به 87.8% رسید.

قابلیت های کلود 3

به طور کلی، بزرگترین مدل کلود 3 اپوس بسیار امیدوار کننده به نظر می رسد و ما قطعا آن را در برابر GPT-4، Gemini 1.5 Pro و Mistral Large آزمایش خواهیم کرد، پس با ما همراه باشید. جدای از آن، آنتروپیک می‌گوید که هر سه مدل دارای قابلیت‌های زیادی در تحلیل و پیش‌بینی، ایجاد محتوای ظریف، تولید کد و تسلط به زبان‌های بین‌المللی مانند اسپانیایی، ژاپنی و فرانسوی.

قابلیت opus vision — تقدیم به تصویر: Anthropic

مدل‌های کلود 3 نیز دارای قابلیت دید هستند، با این حال، آنتروپیک آنها را به عنوان مدل‌های چندوجهی بازاریابی نمی‌کند. Anthropic می گوید که قابلیت چشم انداز در Claude 3 می تواند به مشتریان سازمانی در پردازش نمودارها، نمودارها و نمودارهای فنی کمک کند. در معیارها، آن را بهتر از GPT-4V عمل می کند اما کمی از Gemini 1.0 Ultra عقب است.

200K طول زمینه

از نظر طول زمینه، آنتروپیک می گوید که هر سه مدل در ابتدا یک پنجره زمینه از 200 هزار توکن ارائه می دهند که باید بگویم که بسیار بزرگ است. علاوه بر این، این شرکت می گوید که مدل های خانواده کلود 3 می توانند بیش از 1 میلیون توکن را پردازش کنیدبا این حال، این قابلیت فقط برای مشتریان منتخب در دسترس خواهد بود.

تست اپوس نیا — تقدیم به تصویر: Anthropic

در تست Needle In A Haystack (NIAH) با بیش از 200 هزار توکن، مدل Opus عملکرد فوق‌العاده‌ای با بیش از 99٪ بازیابی دقیقدرست مانند Gemini 1.5 Pro. Claude یکی از بهترین مدل‌های هوش مصنوعی برای بازیابی متن طولانی بوده است و عملکرد با Claude 3 به طور قابل توجهی بهبود یافته است.

عملکرد و قیمت گذاری

در مورد عملکرد، Anthropic بیان می کند که مدل های Claude 3 بسیار سریع هستند و بزرگترین مدل Opus همان عملکرد Claude 2 و 2.1 را ارائه می دهد، اما با هوش بهتر. مدل Sonnet سایز متوسط تقریبا 2 برابر سریعتر از کلود 2 و 2.1. علاوه بر این، Anthropic اشاره می کند که مدل های Claude 3 به طور قابل توجهی کمتر از پاسخ دادن امتناع می کنند، که در مدل های قبلی یک مشکل بود.

می توانید با عضویت در Claude Pro شروع به استفاده از مدل پرچمدار Opus کنید 23.60 دلار قیمت دارد پس از کسر مالیات و غزل کلود 3 با اندازه متوسط قبلاً در نسخه رایگان claude.ai (بازدید) مستقر شده است. در نهایت، توسعه دهندگان می توانند بلافاصله به API های مدل های Opus و Sonnet دسترسی داشته باشند.

قیمت گذاری API کلود 3 — تقدیم به تصویر: Anthropic

در مورد قیمت گذاری API، Claude 3 Opus با یک پنجره زمینه 200K 15 دلار به ازای هر یک میلیون توکن (ورودی) هزینه دارد. 75 دلار به ازای هر یک میلیون توکن (خروجی). در مقایسه با GPT-4 Turbo (ورودی 10 دلار / خروجی 30 دلار با زمینه 128 هزار دلاری)، قیمت گذاری بسیار گران به نظر می رسد.

با این وجود، نظر شما در مورد خانواده جدید مدل های عرضه شده توسط آنتروپیک، به خصوص مدل Opus چیست؟ در بخش نظرات زیر به ما اطلاع دهید.

با کُلبه وبسایت و مجله فناوری و ابزارهای هوشمند ،بهترین تکنولوژی، بهترین آینده ، بروز بمانید

Happy

0 %

Sad

0 %

Excited

0 %

Sleepy

0 %

Angry

0 %

Surprise

0 %

شاید برای شما جالب باشد

خبر فوری

نقشه پیچ خورده Homelander در فصل 4 پسران چیست

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

همه مکان‌های کامیون باربری خیابان ششم در Zenless Zone Zero

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

The Boys Season 4 Episode 6: Webweaver کیست و قدرت های او چیست

Threads به 175 میلیون کاربر فعال ماهانه در سراسر جهان می رسد که هندی ها جزو فعال ترین کاربران هستند

15 بهترین بازی دزدان دریایی در ایکس باکس در سال 2024

موتورولا گوشی تاشو Razr 50 Ultra را با پشتیبانی گوگل جمینی در هند عرضه کرد

آیا Zenless Zone Zero Multiplayer است؟

معیارهای کلود 3

قابلیت های کلود 3

200K طول زمینه

عملکرد و قیمت گذاری

نقشه پیچ خورده Homelander در فصل 4 پسران چیست

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

همه مکان‌های کامیون باربری خیابان ششم در Zenless Zone Zero

خبر فوری

اکنون عضو شوید

ما را در سانه ها دنبال کنید

معیارهای کلود 3

قابلیت های کلود 3

200K طول زمینه

عملکرد و قیمت گذاری

Average Rating

دیدگاهتان را بنویسید لغو پاسخ

شاید برای شما جالب باشد