Matematikte sınıfta kaldılar: ‘Mutlaka hesap makinesi ile kontrol edin’

Yapay Zeka Modellerinin Performansı Karşılaştırıldı: Gemini Önde!

Teste dahil edilen ChatGPT-5 (OpenAI), Gemini 2.5 Flash (Google), Claude 4.5 Sonnet (Anthropic), DeepSeek V3.2 (DeepSeek AI) ve Grok-4 (xAI) modelleri, aynı sorularla karşı karşıya geldi. Doğruluk oranları yüzde 45 ile 63 arasında değişkenlik gösterdi.
Gemini, En Yüksek Başarıyı Elde Etti

En yüksek başarı yüzde 63 ile Gemini tarafından yakalandı. Ancak, yaklaşık her 10 sorudan 4’ünün yanlış cevaplandığı görüldü. Grok, yüzde 62,8 ile ikinci sırada yer aldı. DeepSeek yüzde 52 ile üçüncü, ChatGPT ise yüzde 49,4’lük doğruluk oranıyla dördüncü sırada yer aldı. Listenin sonunda ise yüzde 45,2 ile Claude bulunuyor.
Kategoriler Arasındaki Performans Farkı Gözlemlendi

Özellikle matematik ve dönüşüm konularında Gemini, yüzde 83’lük bir doğrulukla öne çıktı. Grok yüzde 76,9 ve DeepSeek ise yüzde 74,1 ile takip etti. Bu kategoride ortalama doğruluk oranı yüzde 72,1 olarak kaydedildi.
Fizik Alanında En Düşük Başarı Oranı

Fizik alanı, en düşük başarı oranının görüldüğü kategori oldu. 128 sorunun sorulduğu bu alanda ortalama doğruluk yüzde 35,8’de kaldı. Grok, yüzde 43,8 ile liderliği sürdürürken, Claude sadece yüzde 26,6 doğruluk oranına ulaşabildi.
DeepSeek’in Biyoloji ve Kimya Başarısı Düşük

DeepSeek, biyoloji ve kimya gibi alanlarda başarılı olamadı ve yalnızca yüzde 10,6’lık bir doğruluk oranı elde edebildi. Finans ve ekonomi alanlarında ise Grok ve Gemini, yüzde 76,7’lik en yüksek doğruluk oranlarına ulaştı.
‘Çapraz Kontrol Şart!’

Araştırmanın yazarı Dawid Siuda, yapay zeka modellerinin doğruluğunun hala sınırlı olduğunu belirterek, görev kritikse çapraz kontrol yapılması gerektiğini vurguladı.
Araştırmanın Ortaya Koyduğu Hatalar

Araştırma, yapay zekaların yaptığı hataları “özensiz matematik” (%68), “hatalı mantık” (%26), “talimatı yanlış anlama” (%5) ve “vazgeçme” olarak dört başlık altında topladı. Kullanıcıların sonuçları kontrol etmesi önem taşıyor.

kulis pkknin silah birakma goruntulerini once saray izleyecek cnORM3bV

Haber

Kulis: PKK’nın silah bırakma görüntülerini önce Saray izleyecek

metin korkmaz
3 Temmuz 2025
2 min read
0

Korkusuz yazarı Can Coşkun, Cumhurbaşkanı ve AKP Genel Başkanı Recep Tayyip Erdoğan’ın DEM Parti heyetiyle önümüzdeki hafta yapacağı görüşme öncesi dikkat çeken bir kulis bilgisi paylaştı.

eurofighter satisinda imamoglu detayi LzB9kX4F

Haber

Eurofighter satışında İmamoğlu detayı

metin korkmaz
27 Temmuz 2025
3 min read
0

Almanya, Türkiye’ye Eurofighter savaş uçaklarının satışı için onay verdi. Hükümet sözcüsü Stefan Kornelius, İBB Başkanı ve Cumhurbaşkanı Adayı Ekrem İmamoğlu’nun da cezaevinden satışın gerçekleşmesi için çağrıda bulunduğuna işaret etti.

Haber

Peru’da heyelan iki tekneyi yuttu: 12 ölü, 2 kayıp

metin korkmaz
2 Aralık 2025
1 min read
0

Peru’nun Iparia kentinde meydana gelen heyelanda Ucayali Nehri’ndeki iki tekne battı. Olayda ilk belirlemelere göre 12 kişi hayatını kaybederken, 20 kişi yaralandı ve 2 kişi kayboldu.

Haber

Filistinli gazeteci Salih şehit edilen meslektaşı Enes için dünyaya seslendi

metin korkmaz
13 Ağustos 2025
1 min read
0

Filistinli gazeteciler Enes El Şerif ve Muhammed Kurayka, El-Şifa Hastanesi’ndeki El Cezire kanalına ait muhabir çadırına düzenlenen İsrail hava saldırısında katledildi. Filistinli meslektaşları ve sevenleri tarafından “dürüstlüğün ve gerçeğin sesi” olarak nitelendirilen Enes El Şerif, defalarca işgalci israil tarafından hedef gösterilmiş ve suikaste uğramıştı. Filistinli gazeteci Salah Aljafrawi ise şehit edilen arkadaşı Enes’in cenazesinde dünyaya seslendi: “Şehit olana kadar dünya görmedi onu.”

Yapay Zeka Modellerinin Performansı Karşılaştırıldı: Gemini Önde!

Gemini, En Yüksek Başarıyı Elde Etti

Kategoriler Arasındaki Performans Farkı Gözlemlendi

Fizik Alanında En Düşük Başarı Oranı

DeepSeek’in Biyoloji ve Kimya Başarısı Düşük

‘Çapraz Kontrol Şart!’

Araştırmanın Ortaya Koyduğu Hatalar

Bir yanıt yazın Yanıtı iptal et

Related Posts

Kulis: PKK’nın silah bırakma görüntülerini önce Saray izleyecek

Eurofighter satışında İmamoğlu detayı

Peru’da heyelan iki tekneyi yuttu: 12 ölü, 2 kayıp

Filistinli gazeteci Salih şehit edilen meslektaşı Enes için dünyaya seslendi