Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son zamanların en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Peki en iyi yapay zeka modeli hangisi?
Claude-3 vs ChatGPT-4: En iyi yapay zeka modeli
Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır lider olan GPT-4’ün geride kaldığını gösteriyor.
Liderlik Tablosu, “sohbet savaşları” sırasında jüriler tarafından değerlendirildi. Farklı konulardan çeşitli komutlar girerek sohbet botlarını test eden jüriler, karşılaştırma için Elo derecelendirme sistemini kullandı.
23342342342
Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla zirveye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.
Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha önceki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıca Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.
İşte en iyi yapay zeka modeli listesi:
Claude 3 Opus – 1253
GPT-4-1106-preview – 1251
GPT-4-0125-preview – 1248
Bard (Gemini Pro) – 1203
Claude 3 Sonnet – 1196
GPT-4-0314 – 1193
Claude 3 Haiku – 1181
GPT-4-0613 – 1174
Mistral-Large-2402 – 1153
Qwen1.5-72B-Chat – 1153
GPT-4 geçen yıl piyasaya sürüldüğünde oldukça yüksek bir standart belirlemişti. Ancak Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış gibi duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.