Testler, OpenAIS derin araştırma işlevinde zayıf noktalar göstermektedir

Adanali · 17 Şub 2025

(Resim: TV / Shutterstock.com Ver)

Ai di Openai “Deep Research” in yeni işlevi birkaç dakika içinde araştırma vaat ediyor. Araç Chatgpt Pro'nun bir parçasıdır, ancak ilk testler ciddi kusurlar alır.

Openi'nin “derin araştırması”, bir insan uzmanının saatlere ihtiyaç duyacağı birkaç dakika içinde bir duyguya ve vaatlere neden olan yapay zeka (AI) için son araçtır.

Duyuru

CHATGPT Pro ve Nitelikli Bir Analist alabilen araştırma görevlisi olarak pazarlar olarak, internette bağımsız olarak arama yapar, kaynakları doldurur ve yapılandırılmış raporlar sağlar. Ayrıca, zor bir referans noktası olan insanlığın son sınavında (HLE) yüzde 26,6'ya ulaştı ve bu nedenle birçok modeli geçti.

Ancak derin araştırmalar yutturmaca yapmaz. Sofistike raporlar oluştursa da, aynı zamanda ciddi kusurları da vardır. Bunu deneyen gazetecilere göre, derin araştırma yöntemi önemli ayrıntıları ihmal edebilir, mevcut bilgilerle savaşabilir ve bazen gerçekleri icat edebilir.

Openi, aletinin sınırlarını gösterdiğinde altını çizer. Şirket ayrıca, “iç değerlendirmelerin gösterdiği gibi mevcut sohbet modellerinden önemli ölçüde daha düşük olmasına rağmen, bazen gerçeklerin halüsinasyon veya yanlış sonuçlar verebileceğini” belirtiyor.

Yapay zeka modelleri insanlarla aynı şekilde “bilmiyor” çünkü güvenilmez verilerin kendilerini ima edebilmesi şaşırtıcı değildir.

Bir “araştırma analisti” fikri de bir dizi soruyu gündeme getiriyor. Bir araba – ne kadar güçlü olursa olsun – gerçekten eğitimli bir uzmanın yerini alabilir mi? Bu çalışmanın bilginin işleyişi üzerinde ne gibi etkileri olurdu? Ve IA gerçekten daha iyi düşünmemize yardımcı olur mu yoksa düşünmeyi bırakmayı kolaylaştırır mı?

“Derin Araştırma” nedir ve kim için hedeflenir?

“Deep Research”, finansal, bilimsel, politik, hukuk ve mühendislik alanlarının yanı sıra akademisyenler, gazeteciler ve kurumsal stratejistlerin uzmanlarına yöneliktir ve OpenII'nin ChatGPT'de tanıttığı en son “ajan deneyimi” dir. Birkaç dakika içinde zor araştırma çalışmaları yapmayı vaat ediyor.

Şu anda, derin araştırmalar sadece Amerika Birleşik Devletleri'ndeki ChatGPT Pro kullanıcıları için ayda 200 $ karşılığında mevcuttur. Openi, önümüzdeki aylarda Plus, Team ve Enterprise kullanıcıları için işlevin tanıtılması gerektiğini belirtir ve gelecek için daha uygun bir sürüm.

Hızlı yanıtlar sunan standart bir sohbet botunun aksine, derin araştırmalar, yapılandırılmış bir ilişki oluşturmak için birden fazla stadyum içeren bir süreci takip eder:

Kullanıcı bir istekte bulunur. Bu, piyasa analizinden yasal bir düşüşün özetine kadar her türlü şey olabilir.
Yapay zeka görevi açıklığa kavuşturur. Araştırmanın kapsamını mükemmelleştirmek için aşağıdaki sorular sağlayabilir.
Ajan internette arama yapar. Haberler, araştırma ve çevrimiçi veritabanı makaleleri de dahil olmak üzere bağımsız olarak yüzlerce kaynağı arayın.
Sonuçlarını özetler. Yapay zeka en önemli noktaları çıkarır, bunları yapılandırılmış bir ilişkide organize eder ve kaynaklarını belirtir.
Nihai rapor teslim edildi. Beş -30 dakika içinde, kullanıcı sonuçların bir özetiyle çok sayfalık bir belge – muhtemelen bir doktora tezi – alır.

İlk bakışta, bilgi çalışanları için bir rüya aracı gibi görünüyor. Bununla birlikte, daha dikkatli inceleme, önemli kısıtlamalar vardır.

Birçok ilk testte, kusurlar keşfedildi:

Bağlam eksik. Yapay zeka özetleyebilir, ancak neyin önemli olduğunu tam olarak anlamaz.
Yeni gelişmeleri görmezden gelin. Önemli yargıları ve bilimsel güncellemeleri kaybetti.
Bir şeyler icat edin. Diğer yapay zeka modelleri gibi, yanlış bilgilerle güvenlik ile yapabilir.
Gerçekleri kurgudan ayırt edemez. Güvenilir ve güvenilmez kaynaklar arasında ayrım yapmaz.

Opennaai, enstrümanının insan analistleriyle rekabet edebileceğini söylüyor, ancak KI kaçınılmaz olarak iyi araştırmayı değerli kılan yargı, kontrol ve yetkinlikten yoksun.

IA'nın yerini alamaz

ChatGPT, interneti arayabilen ve az sayıda girdi ile raporlar oluşturabilen tek yapay zeka aracı değildir. Kucaklama Yüzü, neredeyse eşit derecede güçlü olan Openi'nin yayınlanmasından sadece 24 saat sonra açık kaynaklı bir versiyonu başlattı.

“İnsan düzeyi” araştırması için pazarlanan derin araştırma ve diğer yapay zeka araçlarının en büyük riski, IA'nın insan düşüncesinin yerini alabileceği yanılsamasıdır. Yapay zeka bilgileri özetleyebilir, ancak hipotezlerinizi sorgulayamaz, bilgideki boşluklar gösteremez, farklı bakış açılarını yaratıcı bir şekilde düşünür veya anlayamaz.

Ve yapay zeka tarafından oluşturulan özet, nitelikli bir insan araştırmacının derinliğine karşılık gelmez.

Her yapay zeka ajanı, ne kadar hızlı olursa olsun, hala sadece bir araçtır ve insan zekasının yerine geçmez. Bilgi operatörleri için, IA'nın taklit edemeyeceği becerilere yatırım yapmaktan daha önemlidir: eleştirel düşünme, gerçek muayene, derin yeterlilik ve yaratıcılık.

Araştırma araçlarını kullanmak istiyorsanız, sorumlu yapmanın yolları vardır. Yapay zekanın iyi bir şekilde düşünülmesi, hassasiyeti veya derinliği etkilemeden araştırmaları geliştirebilir. IA'yı verimliliği artırmak için kullanabilirsiniz, ör. B. Belgeleri özetlemek, ancak kararlar için insan kararını korumak.

Her zaman kaynakları kontrol edin, çünkü AI tarafından üretilen alıntılar yanıltıcı olabilir. Sonuçlara güvenmeyin, ancak eleştirel düşünmeyi kullanın ve bilgileri güvenilir kaynaklarla karşılaştırın. Sağlık, hukuk ve demokrasi gibi büyük önemle, AI'nın sonuçlarını uzmanların bilgisi ile entegre etmelisiniz.

Bize farklı bir şey yapmak isteyen büyük pazarlamaya rağmen, üretken yapay zekanın hala birçok kısıtlaması var. Bilgileri yaratıcı bir şekilde birleştiren, soruların hipotezlerini birleştiren ve eleştirel düşünebilecekler sorulmaya devam edecektir: IA henüz bunların yerini alamaz.

Raffaele F. Ciriello, Sydney Üniversitesi'nde şirket bilgisayar bilimi öğretmenidir.

Bu giriş ilk olarak Creative Commons lisansı ile görüşme tarafından yayınlandı. Okumak Orijinal makale. Tercüman: Bernd Müller

Testler, OpenAIS derin araştırma işlevinde zayıf noktalar göstermektedir

Adanali

Member