“Ben bir robot değilim.” Grafik: Vectoru Studio, Shutterstock
Chatgpt Turing testini yeni geçti. Ama ben insanlar olarak zaten zeki mi?
Şimdi resmi: Her şeyden önce, bir bot yapay zeka sohbeti Turing testini resmen geçti. San Diego Üniversitesi'nden dört büyük vokal model (LLM) Turing testine maruz kalan en az iki araştırmacı. GPT-4.5 OpenAAI tarafından-deney döneminin yüzde 70'i gibi bir kişi tarafından ayırt edilemez kabul edilmektedir.
Muhtemelen anlaşılması çok kolay göründüğü için, Turing testi mekanik zekanın bir göstergesi olarak popüler hale geldi. İnsanların yapay bir zekanın tepkilerini başka bir kişininkinden ayırt edip edemeyeceği doğrulanmıştır. Alan Turing, 1950'de testini sunduğunda, 50 yıl içinde bu taklit görevine hakim olabilecek bir “dijital bilgisayar” olacağını öngördü.
Aslında, 75 yıl sürdü, ancak öngörüsünüze en büyük saygı göstermeniz gerekiyor. Turing bu tür “makineler için istihbarat testi olduğu için istihbarat testi” önerdi Makineler düşünebilir mi? “” Makine “terimlerinin tanımlanmasıyla ilgili sorunlar nedeniyle ve her şeyden önce” düşünce “yeterince yanıtlanmadı ve bu nedenle eski.
“Düşünme” nedir
San Diego'daki testler, röportaj yaptıkları sekiz tur röportajı olan katılımcılardan oluşuyordu ve aynı zamanda iki tanıkla kısa mesaj değiştirdiler. Bir tanık bir kişi, diğeri ise llm idi. Yaklaşık 284 katılımcı görüşmeci veya tanık olarak atandı.
Katılımcılar, benzer bir geleneksel haber yüzeyinin deneme yüzeyi ile beş dakika boyunca ortak bir ekranda her iki tanıkla etkileşim kurmak zorunda kaldılar. Bu etkileşimden sonra, bir kişinin tanığı ve kimin sohbet botu olduğuna karar verdi.
Deneysel konfigürasyon, yüzde 70 eşik ve aynı zamanda zamansal gereksinimler tam olarak Turing gereksinimlerine karşılık gelir. Araştırmacılar dört büyük vokal modelini (dil modelleri, LLMS) test ettiler: Eliza, GPT-4O, Llam-3.1-405b ve GPT-4.5.
GTP-4.5 daha iyi taklit edilir
Katılımcılar GPT-4.5 ila yüzde 73 ve 3,1-405B yüzde 56 bıçak olarak değerlendirildi. Diğer iki model (Eliza ve GPT-4O) katılımcıları zamanın yüzde 23 ve 21'inde aldatabildi.
Ayrıca oku
Daha Fazla Göster
Daha az belirti
Ancak, bu testin geçerliliği konusunda anlaşmazlık vardır. Aslında, mekanik zekayı ölçmenin ne kadar etkili olduğunu merak eden tartışmalı bir hikayeye sahip.
Tartışmalı tartışmalı test
Turing testine karşı dört ana konu var. Konuşma aşağıdaki gibi özetler:
Bilim adamları, insan zekasına meşru bir referans olarak Turing testi fikrini de desteklemediklerini açıklıyorlar. Aksine, insan zekasının taklitinin bir göstergesidir.
Makinelerin zekası nasıl ölçülebilir?
Başka bir deyişle, GPT-4.5'in insanlar kadar zeki olmadığını söyleyebilirsiniz. Ancak, IA açık bir şekilde bazı insanları bir süre ikna etmeyi başarıyor.
Makinelerin zekasının gerçekten nasıl ölçülebileceği veya tablodan yanıt verilebileceği veya yanıt vermediği sorusu. Bilimsel sorular için özel olarak geliştirilmiş ve eğitilmiş yapay bir zeka olan rıza, aşağıdaki soruyu aşağıdakilere sormaktadır:
Chatgpt Turing testini yeni geçti. Ama ben insanlar olarak zaten zeki mi?
Şimdi resmi: Her şeyden önce, bir bot yapay zeka sohbeti Turing testini resmen geçti. San Diego Üniversitesi'nden dört büyük vokal model (LLM) Turing testine maruz kalan en az iki araştırmacı. GPT-4.5 OpenAAI tarafından-deney döneminin yüzde 70'i gibi bir kişi tarafından ayırt edilemez kabul edilmektedir.
Muhtemelen anlaşılması çok kolay göründüğü için, Turing testi mekanik zekanın bir göstergesi olarak popüler hale geldi. İnsanların yapay bir zekanın tepkilerini başka bir kişininkinden ayırt edip edemeyeceği doğrulanmıştır. Alan Turing, 1950'de testini sunduğunda, 50 yıl içinde bu taklit görevine hakim olabilecek bir “dijital bilgisayar” olacağını öngördü.
Aslında, 75 yıl sürdü, ancak öngörüsünüze en büyük saygı göstermeniz gerekiyor. Turing bu tür “makineler için istihbarat testi olduğu için istihbarat testi” önerdi Makineler düşünebilir mi? “” Makine “terimlerinin tanımlanmasıyla ilgili sorunlar nedeniyle ve her şeyden önce” düşünce “yeterince yanıtlanmadı ve bu nedenle eski.
“Düşünme” nedir
San Diego'daki testler, röportaj yaptıkları sekiz tur röportajı olan katılımcılardan oluşuyordu ve aynı zamanda iki tanıkla kısa mesaj değiştirdiler. Bir tanık bir kişi, diğeri ise llm idi. Yaklaşık 284 katılımcı görüşmeci veya tanık olarak atandı.
Katılımcılar, benzer bir geleneksel haber yüzeyinin deneme yüzeyi ile beş dakika boyunca ortak bir ekranda her iki tanıkla etkileşim kurmak zorunda kaldılar. Bu etkileşimden sonra, bir kişinin tanığı ve kimin sohbet botu olduğuna karar verdi.
Deneysel konfigürasyon, yüzde 70 eşik ve aynı zamanda zamansal gereksinimler tam olarak Turing gereksinimlerine karşılık gelir. Araştırmacılar dört büyük vokal modelini (dil modelleri, LLMS) test ettiler: Eliza, GPT-4O, Llam-3.1-405b ve GPT-4.5.
GTP-4.5 daha iyi taklit edilir
Katılımcılar GPT-4.5 ila yüzde 73 ve 3,1-405B yüzde 56 bıçak olarak değerlendirildi. Diğer iki model (Eliza ve GPT-4O) katılımcıları zamanın yüzde 23 ve 21'inde aldatabildi.
Ayrıca oku
Daha Fazla Göster
Daha az belirti
Ancak, bu testin geçerliliği konusunda anlaşmazlık vardır. Aslında, mekanik zekayı ölçmenin ne kadar etkili olduğunu merak eden tartışmalı bir hikayeye sahip.
Tartışmalı tartışmalı test
Turing testine karşı dört ana konu var. Konuşma aşağıdaki gibi özetler:
- Davranış ve düşünün: Bazı araştırmacılar, “testi geçme” yeteneğinin zeka değil bir davranış meselesi olduğunu iddia ediyorlar. Bu nedenle, bir araba olabileceğini söylemek çelişkili olmaz, ancak düşünemez.
- Beyinler makine değildir: Turing, beynin bir makine olduğunu ve tamamen mekanik terimlerle açıklanabileceğini söylüyor. Birçok akademisyen bu ifadeyi karıştırır ve bu tabandaki testin geçerliliğini sorgular.
- İç Süreçler: Bilgisayarlar insan olmadığından, süreçleri bir sonuç elde etmek için bir kişininkiyle karşılaştırılamaz. Dolayısıyla doğrudan bir karşılaştırma çalışamaz.
- Test Testi: Bazı araştırmacılar, davranışların zekayı belirlemesi için testlerin yeterli olmadığına inanıyorlar.
Bilim adamları, insan zekasına meşru bir referans olarak Turing testi fikrini de desteklemediklerini açıklıyorlar. Aksine, insan zekasının taklitinin bir göstergesidir.
Makinelerin zekası nasıl ölçülebilir?
Başka bir deyişle, GPT-4.5'in insanlar kadar zeki olmadığını söyleyebilirsiniz. Ancak, IA açık bir şekilde bazı insanları bir süre ikna etmeyi başarıyor.
Makinelerin zekasının gerçekten nasıl ölçülebileceği veya tablodan yanıt verilebileceği veya yanıt vermediği sorusu. Bilimsel sorular için özel olarak geliştirilmiş ve eğitilmiş yapay bir zeka olan rıza, aşağıdaki soruyu aşağıdakilere sormaktadır:
Yapay sistemlerde zekanın ölçümü ve tanımı, geliştirilmede dinamik bir alandır. Matematiksel biçimselleştirmeden algoritmalara ve tahmine dayanan Bayes yöntemlerine kadar çeşitli yaklaşımlar, zekanın değerlendirilmesi için farklı bakış açıları sunar.
Bu sektördeki ilerleme sırasında, anlayışımızın ve yapay zeka alanındaki becerilerimizin daha da geliştirilmesi için daha geniş ve genel olarak kabul edilen standartların geliştirilmesi daha önemli hale gelecektir.