Ankara24.com
close
up
Menu

Rusya nın Ankara Büyükelçiliği nden Montrö açıklaması

Uğurcan Çakır: Çok mutlu ve gururluyum! Futbol Haberleri

İstanbul’da Gazze için araç konvoyu düzenlenecek

Nihat Kahveci tarihi zaferden sonra kendinden geçti

Güdül Kaymakamı Akar dan kütüphane ziyareti Ankara Haberleri

Bodrum’da göçmen faciası Yerel Gündem Haberleri

Elon Musk a dava şoku: 200 milyon dolarlık haksız kazanç!

Gana da Dünya Kupası na 72 gün kala sürpriz ayrılık

Trump ın İran tehdidi Avrupa yı tedirgin etti: Türkiye hazırlık yaptı

Vedat Muriqi gözyaşlarına hakim olamadı

Galatasaray dan olay yaratan paylaşım: Kerem Aktürkoğlu detayı tepki topluyor

Cumhurbaşkanı Erdoğan: Dünya Kupası finallerine katılmaya hak kazanan Bizim Çocuklar ı gönülden tebrik ediyorum

İtalya ya Bosna Hersek şoku: Üst üste 3. kez katılamadılar! Futbol Haberleri

Doç. Dr. Altan ın hasarlı dokuların tamiri için düşük doz lazer tedavisi araştırması uluslararası dergide Konya Haberleri

Piyasalar Ortadoğu’da barış umuduyla toparlandı

1 (BİR) YILLIK İŞYERİ HEKİMLİĞİ VE İŞ GÜVENLİĞİ UZMANLIĞI HİZMETİ ALIMI İŞİ

Türk Kızılay’dan Oktay Kaynarca ile kan bağışı çağrısı

Fransız Senatosu, 15 yaşından küçüklere kısmen sosyal medya yasağı getiren tasarıyı kabul etti

Yardım için durdular, kendilerine küfür edilince alkollü sürücüyü ve arkadaşını darp ettiler Nevşehir Haberleri

İran ABD nin 16 adet MQ 9 Reaper İHA sını vurdu Sözcü Gazetesi

Matematikte sınıfta kaldılar: Mutlaka hesap makinesi ile kontrol edin Sözcü Gazetesi

Matematikte sınıfta kaldılar: Mutlaka hesap makinesi ile kontrol edin Sözcü Gazetesi

Ankara24.com, Sozcu kaynağından alınan verilere dayanarak bilgi yayımlıyor.

Teste katılan modeller, ChatGPT-5 (OpenAI), Gemini 2.5 Flash (Google), Claude 4.5 Sonnet (Anthropic), DeepSeek V3.2 (DeepSeek AI) ve Grok-4 (xAI) oldu. Her bir yapay zekaâya aynı sorular yöneltilirken, doğruluk oranlarının yüzde 45 ila 63 arasında değiştiği görüldü.

EN YÜKSEK BAŞARI GEMİNİ'DEN

En yüksek başarıyı yüzde 63 ile Gemini elde etti. Ancak bu, her 10 sorudan yaklaşık 4’ünün yanlış cevaplandığı anlamına geliyor. Grok modeli yüzde 62,8 ile Gemini’yi yakından takip etti. DeepSeek yüzde 52 ile üçüncü sıraya yerleşirken, ChatGPT yüzde 49,4’lük doğruluk oranıyla dördüncü oldu. Listenin sonunda ise yüzde 45,2 ile Claude yer aldı.

Araştırmanın dikkat çeken bulgularından biri de kategoriler arasındaki performans farkı oldu. Özellikle matematik ve dönüşümler başlığında Gemini yüzde 83 doğrulukla öne çıkarken, Grok yüzde 76,9 ve DeepSeek yüzde 74,1 ile takip etti. Bu kategorideki ortalama doğruluk oranı yüzde 72,1 oldu.

EN DÜŞÜK BAŞARI FİZİKTE

Öte yandan, fizik alanı en düşük başarı oranının görüldüğü kategori oldu. 128 sorunun yöneltildiği bu alanda ortalama doğruluk yalnızca yüzde 35,8 seviyesinde kaldı. Grok burada da liderliği yüzde 43,8 ile sürdürürken, Claude yalnızca yüzde 26,6 doğruluk oranına ulaşabildi.

Biyoloji ve kimya gibi alanlarda DeepSeek’in başarısı oldukça düşük kaldı. Model, bu alanlarda yalnızca yüzde 10,6’lık bir doğruluk oranı yakalayabildi. Finans ve ekonomi alanlarında ise Grok ve Gemini yüzde 76,7 ile en yüksek doğruluk oranlarına ulaştı.

'ÇAPRAZ KONTROL ŞART'

Araştırmanın yazarlarından Dawid Siuda, yapay zeka modellerinin doğruluğunun hâlâ önemli ölçüde sınırlı olduğunu vurgulayarak, “Eğer görev kritikse, hesap makineleri veya başka bir yapay zeka modeliyle çapraz kontrol yapılmalı” uyarısında bulundu.

Araştırma, yapay zekAların yaptığı hataları da dört başlıkta topladı: “özensiz matematik” (yüzde 68), “hatalı mantık” (yüzde 26), “talimatı yanlış anlama” (yüzde 5) ve “vazgeçme”. En yaygın hata türü, doğru formül kullanılsa bile hesaplamada yapılan basit hatalar oldu. Özellikle çok adımlı işlemlerde yapılan yuvarlama hatalarının sonuçları ciddi biçimde saptırdığı tespit edildi.

Tüm bu veriler, yapay zekAların gündelik hesaplamalarda yaygın olarak kullanılmasına rağmen, mutlak güvenilemeyeceğini ortaya koyuyor. Kullanıcıların sonuçları kontrol etmeyi ihmal etmemesi gerekiyor.

Durumu takip etmeye devam edin, Ankara24.com her zaman en yeni haberleri sunuyor.
seeGörüntülenme:92
embedKaynak:https://www.sozcu.com.tr
archiveBu haber kaynaktan arşivlenmiştir 30 Aralık 2025 18:33 kaynağından arşivlendi
0 Yorum
Giriş yapın, yorum yapmak için...
Yayına ilk cevap veren siz olun...
topEn çok okunanlar
Şu anda en çok tartışılan olaylar

Rusya nın Ankara Büyükelçiliği nden Montrö açıklaması

02 Nisan 2026 00:35see194

Uğurcan Çakır: Çok mutlu ve gururluyum! Futbol Haberleri

01 Nisan 2026 03:16see192

İstanbul’da Gazze için araç konvoyu düzenlenecek

01 Nisan 2026 20:31see189

Nihat Kahveci tarihi zaferden sonra kendinden geçti

01 Nisan 2026 01:21see187

Güdül Kaymakamı Akar dan kütüphane ziyareti Ankara Haberleri

01 Nisan 2026 17:24see179

Bodrum’da göçmen faciası Yerel Gündem Haberleri

02 Nisan 2026 04:04see175

Elon Musk a dava şoku: 200 milyon dolarlık haksız kazanç!

01 Nisan 2026 20:09see168

Gana da Dünya Kupası na 72 gün kala sürpriz ayrılık

01 Nisan 2026 00:25see168

Trump ın İran tehdidi Avrupa yı tedirgin etti: Türkiye hazırlık yaptı

02 Nisan 2026 18:39see161

Vedat Muriqi gözyaşlarına hakim olamadı

01 Nisan 2026 00:12see159

Galatasaray dan olay yaratan paylaşım: Kerem Aktürkoğlu detayı tepki topluyor

01 Nisan 2026 01:20see157

Cumhurbaşkanı Erdoğan: Dünya Kupası finallerine katılmaya hak kazanan Bizim Çocuklar ı gönülden tebrik ediyorum

01 Nisan 2026 00:12see155

İtalya ya Bosna Hersek şoku: Üst üste 3. kez katılamadılar! Futbol Haberleri

01 Nisan 2026 03:16see155

Doç. Dr. Altan ın hasarlı dokuların tamiri için düşük doz lazer tedavisi araştırması uluslararası dergide Konya Haberleri

02 Nisan 2026 12:28see152

Piyasalar Ortadoğu’da barış umuduyla toparlandı

02 Nisan 2026 00:58see150

1 (BİR) YILLIK İŞYERİ HEKİMLİĞİ VE İŞ GÜVENLİĞİ UZMANLIĞI HİZMETİ ALIMI İŞİ

02 Nisan 2026 00:14see150

Türk Kızılay’dan Oktay Kaynarca ile kan bağışı çağrısı

02 Nisan 2026 10:18see149

Fransız Senatosu, 15 yaşından küçüklere kısmen sosyal medya yasağı getiren tasarıyı kabul etti

01 Nisan 2026 01:15see149

Yardım için durdular, kendilerine küfür edilince alkollü sürücüyü ve arkadaşını darp ettiler Nevşehir Haberleri

01 Nisan 2026 03:14see148

İran ABD nin 16 adet MQ 9 Reaper İHA sını vurdu Sözcü Gazetesi

01 Nisan 2026 22:03see143
newsSon haberler
Günün en taze ve güncel olayları