Ankara24.com
close
up
Menu

Emine Erdoğan dan Depozito Yönetim Sistemi ne ilişkin paylaşım

Yunanistan da yangın ihmallerine gözaltı: Binlerce avro ceza kesildi Avrupa Haberleri

Doha daki dolaylı görüşmeler tamamlandı: İran ve ABD arasında iletişim kanalı kuruluyor Ortadoğu Haberleri

Müsavat Dervişoğlu da Kur’an ı Kerim’le alay edenlere destek verdi!

Şehit Burak Tortumlu nun adı Tunceli de yaşatılacak

33. İstanbul Caz Festivali başladı

Emekli maaşı zam farkları ne zaman yatacak? Tahsis No ya göre SSK ve Bağkur maaş ödeme takvimi

FETÖ elebaşının mezarına giden yok: Ya tasfiye ya yıkım

Hiçbir çocuk sevgisiz kalmasın! Emine Erdoğan dan koruyucu aile seferberliği çağrısı

Aromaterapi ürünleri artık sadece eczanelerde satılacak

Fenerbahçe den 3 Temmuz paylaşımı! Trabzonspor dan anında cevap: Yüzünüz gülmesin!

Faizsiz Evim sisteminde değişiklik

Misafir gittiği evi işgal ettiği öne sürülen Deniz Akkaya karakolluk oldu Eski manken Deniz Akkaya polis nezaretinde evden tahliye edildi Kocaeli Haberleri Habertürk Yerel Haberler

Hakim ve savcıların görevde yükselme kararları Resmi Gazete de

Ana Haber Bülteni 2 Temmuz 2026 (Trump Ankara ya Çıkarma Yapıyor! Bin Kişilik Dev Heyet Geliyor)

Küme düşmekten son anda kurtulan takım çıldırdı! 2 günde 207 milyon Euro harcadılar

Sosyal medyada kurallar değişti! Deepfake, ınfluencer ve gizli reklama sıkı denetim: Hem içerik durdurma hem para cezası

Karayolları Trafik Yönetmeliği nde Değişiklik Son dakika haberleri

İran dan Hürmüz Boğazı nda yetkili rota uyarısı: Yabancı gemi karaya oturdu Ortadoğu Haberleri

Sürücüler dikkat! Telefon tutucu, ses sistemi ve ekran kullanımına yeni kurallar

Matematikte sınıfta kaldılar: Mutlaka hesap makinesi ile kontrol edin Sözcü Gazetesi

Matematikte sınıfta kaldılar: Mutlaka hesap makinesi ile kontrol edin Sözcü Gazetesi

Ankara24.com, Sozcu kaynağından alınan verilere dayanarak bilgi yayımlıyor.

Teste katılan modeller, ChatGPT-5 (OpenAI), Gemini 2.5 Flash (Google), Claude 4.5 Sonnet (Anthropic), DeepSeek V3.2 (DeepSeek AI) ve Grok-4 (xAI) oldu. Her bir yapay zekaâya aynı sorular yöneltilirken, doğruluk oranlarının yüzde 45 ila 63 arasında değiştiği görüldü.

EN YÜKSEK BAŞARI GEMİNİ'DEN

En yüksek başarıyı yüzde 63 ile Gemini elde etti. Ancak bu, her 10 sorudan yaklaşık 4’ünün yanlış cevaplandığı anlamına geliyor. Grok modeli yüzde 62,8 ile Gemini’yi yakından takip etti. DeepSeek yüzde 52 ile üçüncü sıraya yerleşirken, ChatGPT yüzde 49,4’lük doğruluk oranıyla dördüncü oldu. Listenin sonunda ise yüzde 45,2 ile Claude yer aldı.

Araştırmanın dikkat çeken bulgularından biri de kategoriler arasındaki performans farkı oldu. Özellikle matematik ve dönüşümler başlığında Gemini yüzde 83 doğrulukla öne çıkarken, Grok yüzde 76,9 ve DeepSeek yüzde 74,1 ile takip etti. Bu kategorideki ortalama doğruluk oranı yüzde 72,1 oldu.

EN DÜŞÜK BAŞARI FİZİKTE

Öte yandan, fizik alanı en düşük başarı oranının görüldüğü kategori oldu. 128 sorunun yöneltildiği bu alanda ortalama doğruluk yalnızca yüzde 35,8 seviyesinde kaldı. Grok burada da liderliği yüzde 43,8 ile sürdürürken, Claude yalnızca yüzde 26,6 doğruluk oranına ulaşabildi.

Biyoloji ve kimya gibi alanlarda DeepSeek’in başarısı oldukça düşük kaldı. Model, bu alanlarda yalnızca yüzde 10,6’lık bir doğruluk oranı yakalayabildi. Finans ve ekonomi alanlarında ise Grok ve Gemini yüzde 76,7 ile en yüksek doğruluk oranlarına ulaştı.

'ÇAPRAZ KONTROL ŞART'

Araştırmanın yazarlarından Dawid Siuda, yapay zeka modellerinin doğruluğunun hâlâ önemli ölçüde sınırlı olduğunu vurgulayarak, “Eğer görev kritikse, hesap makineleri veya başka bir yapay zeka modeliyle çapraz kontrol yapılmalı” uyarısında bulundu.

Araştırma, yapay zekAların yaptığı hataları da dört başlıkta topladı: “özensiz matematik” (yüzde 68), “hatalı mantık” (yüzde 26), “talimatı yanlış anlama” (yüzde 5) ve “vazgeçme”. En yaygın hata türü, doğru formül kullanılsa bile hesaplamada yapılan basit hatalar oldu. Özellikle çok adımlı işlemlerde yapılan yuvarlama hatalarının sonuçları ciddi biçimde saptırdığı tespit edildi.

Tüm bu veriler, yapay zekAların gündelik hesaplamalarda yaygın olarak kullanılmasına rağmen, mutlak güvenilemeyeceğini ortaya koyuyor. Kullanıcıların sonuçları kontrol etmeyi ihmal etmemesi gerekiyor.

Durumu takip etmeye devam edin, Ankara24.com her zaman en yeni haberleri sunuyor.
seeGörüntülenme:103
embedKaynak:https://www.sozcu.com.tr
archiveBu haber kaynaktan arşivlenmiştir 30 Aralık 2025 18:33 kaynağından arşivlendi
0 Yorum
Giriş yapın, yorum yapmak için...
Yayına ilk cevap veren siz olun...
topEn çok okunanlar
Şu anda en çok tartışılan olaylar

Emine Erdoğan dan Depozito Yönetim Sistemi ne ilişkin paylaşım

02 Temmuz 2026 00:26see156

Yunanistan da yangın ihmallerine gözaltı: Binlerce avro ceza kesildi Avrupa Haberleri

02 Temmuz 2026 00:20see155

Doha daki dolaylı görüşmeler tamamlandı: İran ve ABD arasında iletişim kanalı kuruluyor Ortadoğu Haberleri

02 Temmuz 2026 00:51see149

Müsavat Dervişoğlu da Kur’an ı Kerim’le alay edenlere destek verdi!

01 Temmuz 2026 17:12see147

Şehit Burak Tortumlu nun adı Tunceli de yaşatılacak

03 Temmuz 2026 00:25see147

33. İstanbul Caz Festivali başladı

01 Temmuz 2026 14:21see146

Emekli maaşı zam farkları ne zaman yatacak? Tahsis No ya göre SSK ve Bağkur maaş ödeme takvimi

02 Temmuz 2026 00:59see144

FETÖ elebaşının mezarına giden yok: Ya tasfiye ya yıkım

02 Temmuz 2026 00:27see144

Hiçbir çocuk sevgisiz kalmasın! Emine Erdoğan dan koruyucu aile seferberliği çağrısı

01 Temmuz 2026 17:18see140

Aromaterapi ürünleri artık sadece eczanelerde satılacak

02 Temmuz 2026 02:54see139

Fenerbahçe den 3 Temmuz paylaşımı! Trabzonspor dan anında cevap: Yüzünüz gülmesin!

03 Temmuz 2026 00:27see139

Faizsiz Evim sisteminde değişiklik

02 Temmuz 2026 00:06see139

Misafir gittiği evi işgal ettiği öne sürülen Deniz Akkaya karakolluk oldu Eski manken Deniz Akkaya polis nezaretinde evden tahliye edildi Kocaeli Haberleri Habertürk Yerel Haberler

02 Temmuz 2026 00:53see139

Hakim ve savcıların görevde yükselme kararları Resmi Gazete de

02 Temmuz 2026 00:43see139

Ana Haber Bülteni 2 Temmuz 2026 (Trump Ankara ya Çıkarma Yapıyor! Bin Kişilik Dev Heyet Geliyor)

03 Temmuz 2026 01:41see138

Küme düşmekten son anda kurtulan takım çıldırdı! 2 günde 207 milyon Euro harcadılar

02 Temmuz 2026 00:40see138

Sosyal medyada kurallar değişti! Deepfake, ınfluencer ve gizli reklama sıkı denetim: Hem içerik durdurma hem para cezası

01 Temmuz 2026 17:19see137

Karayolları Trafik Yönetmeliği nde Değişiklik Son dakika haberleri

03 Temmuz 2026 01:23see136

İran dan Hürmüz Boğazı nda yetkili rota uyarısı: Yabancı gemi karaya oturdu Ortadoğu Haberleri

01 Temmuz 2026 19:29see135

Sürücüler dikkat! Telefon tutucu, ses sistemi ve ekran kullanımına yeni kurallar

03 Temmuz 2026 02:46see135
newsSon haberler
Günün en taze ve güncel olayları