“İşte, keman çalan genç buydu. ”
Özel ve teknik terimleri de katarsak bu sayıçok daha fazla artar. Aslında iyi eğitim görmüş bir kimse, günlük konuşması sırasında 10-15 bin kadar sözcükten yararlanır; ancak bildiği 100.000 dolayındaki sözcüklerden hertıangi birisiyle, konuşmasını her an zenginleştirebilir. Oysa bu sayıda sözcük için yukarıda değinilen “tanıma” yönteminden yararlanmak, dev bir bilgisayar kapasitesi gerektirir.
İşi daha da zorlaştıran, değişik kimselerin aynı sözcükleri farklı şekillerde telaffuz etmeleridir. Bunun en iyi bilinen örneği, ‘My Fair Lady’ müzikalindeki çiçekçi kız Eliza Doo- little’dir. Oysa bugün, bu amaçla kullanılan bilgisayarlar, genellikle bir tek kişinin konuşmasından anlayabiliyorlar. Öyle ki, bilgisayarla konuşan ‘efendisi’ soğuk algınlığı olsa, bilgisayar onun konuşmasını anlayamıyor. Ayrıca bilgisayarlar bugünkü gelişme düzeylerinde, kâğıt hışırtısı, adım sesi, dışarıdan duyulan trafik gürültüsü gibi seslerden de etkileniyorlar (Bilgisayarların sözcük hâzineleri genişledikçe, gürültüleri ses sanma eğilimleri de artıyor).
Bu belirtilenler, akustik ile ilgili güçlüklerdir. Tek tek ses- hecelerin ve sözcüklerin anlaşılmasının zorlukları yanında, sürekli bir konuşmayı anlamanın güçlüğüüzerinde de durulmalıdır: Her şeyden önce şunu belirtelim: Ses-heceler, bir konuşmanın akışı içinde az-çok farklıözellikler gösterirler. Örneğin biz insanlar “taş”, “dört”, “at”, “üstün”, “tartaklama sözcüklerindeki “t” sesini rahatça algılayabildiğimiz halde, bilgisayar bu sözcüklerdeki “t” sesini farklı kabul edi- /or. İşte bu yüzden, insan konuşmasını gerçekten algılayacak bir bilgisayar sistemi, hem Konuşulan dili bilmek; hem de bütünden anlam çıkarmak özelliklerine aynı anda sahip olmak zorundadır.
Bu konu ile ilgili olarak, 1963 yılında insanları bile zor duruma düşüren bir deney yapıldı: Kişilere önce karşılarındaki konuşmacıların ağızlarından kısa konuşmalar dinletildi. Dinleyenler, bu konuşmalann tümünü kolayca anladılar. Sonra konuşmalar banda alındı ve banttaki sözcüklerden rastlantıyla seçilen bazıları, sırasız olarak aynı dinleyicilere dinletildi. Bu kez dinleyiciler, konuşmaların % 20-30’unu anlayamadılar. Bu durum bize, bütünden anlam çıkarmanın önemini göstermektedir.
Son on yıldır “yapay zekâ” alanında ve bilgisayarlar üzerinde önemli araştırmalar yürüten ve Stanford Üniversitesi’– nde profesör olarak görev yapan Terry VVinograd, dildeki lengüistik zorlukların bir sıralamasını geliştirmiş ve her basamak için ayrı ayrıörnekler vermiş bulunuyor. Aşağıda belirtilen bu basamaklara sizler de kendi örneklerinizi getirebilirsiniz:
Birinci basamak: Bu basamakla ilgili zorluk, deyim yerinde ise “en basit” zorluktur. Sözcüklerin birden çok anlam taşıması ile ilgili olan bu zorluğa şu örneği verebiliriz: “İşte kemanıçalan genç buydu” cümlesi, karakolda söylenirse başka; bir konser salonunun kulisinde söylenirse başka anlam taşır.
İkinci basamak: Cümle kuruluşunda farklı seçenekler izlenmesi ve sözcükleri değişik anlam yüklenmelerinden do-
“Sürahiyi bardağa çarpıp kırdı. ”
ğan bu anlama zorluğu için şu örnek verilebilir: “Benzinin patlayıcı olduğunu en sonunda gördü.”Şimdi bu cümlede kişi acaba benzinin patlayıcı olduğunu bizzat “yaşadı mı”, yoksa “anladı mı”?
Üçüncü basamak: Bu basamakla ilgili anlama zorluğu daha da gizlidir: Aynı cümleyi değişik tonlama ile söylemek, anlamı değiştirir, farklı yapar. “Can babasıyla birlikte İstanbul’a gitti” cümlesi ile Can babasıyla birlikte İstanbul’a gitti” cümlesindeki -koyu yazılan- iki farklı vurgu, iki değişik anlamlı cümle yaratır.
Dördüncü basamak: Bu basamakla ilgili zorluk, cümlelerin anlamlarının, konuşmanın bütününe göre kesinlik kazanmasından doğar. “Ahmet, Erzurum’lu ile evleniyor” dediğimizde, söz konusu bayanın herhangi bir Erzurumlu mu, yoksa belli bir kimse mi olduğu; daha önce söylenen ve daha sonra söylenecek cümlelerden çıkar.
Beşinci basamak: Eski edebiyatbilimcilerinin “Zaaf-ı telif” dedikleri bu anlam bulanıklığı, sık sık görülen bir karışıklıktır. “Sürahiyi bardağa çarpıp kırdı” cümlesinde, kırılan sürahi mi, yoksa bardak mıdır?
Profesör Winograd’in açıklamalarına göre, böyle değişik anlamlara gelen cümleler, günlük yaşamda insanlara hemen hemen hiç güçlük çıkarmazlar. Çünkü biz insanlar, anlamı bir bütün olarak algılayabiliriz. Oysa bu alanda bugüne kadar geliştirilen bilgisayar sistemlerinin hiçbirisi henüz bu niteliğe kavuşamamışlardır.
Bütün bu güçlüklere karşın, bu alandaki araştırmalar sabırla sürdürülüyor ve adım adım da olsa ilerlemeler kaydediliyor. ABD’de Kurzweil Yapay Zekâ Araştırmaları Merkezi’– nin kurucusu Raymond Kurzweil, kısa bir süre önce sınırlı olanaklı da olsa konuşmaları anlayabilen bir yazı makinesi geliştirmiş bulunuyor. Geçtiğimiz baharda bu konu ile ilgilenenlerin bulunduğu bir toplantıda ilk kez sergilenen ve şimdi piyasaya verilmiş olan bu aleti, Boston’da çalışan radyoloji uzmanı bir hekim, bakınız nasıl kulanıyor: Boston’lu uzman hekim, önce aletin üst kapasite sının olan 1.000 sözcükten oluşan bir tıbbi sözlük geliştirmiş bulunuyor. Şimdi ise bir yandan çektiği röntgen filmlerini gözle incelerken saptadığı bulguları ve koyduğu tanıları yüksek sesle ve tane tane makineye söylüyor; makine ise o anda raporu yazıyor. Kurzweil, şu sırada sözcük hâzinesi 15.000 adet olan yeni bir tipin üzerinde çalışmaktadır. Ancak bu yeni tip de yine belli bir kişinin sözlerine uyacak ve her sözcükten sonra kısa bir duruşu gerektirecektir.
Konuşmaları anlayabilecek bir bilgisayar geliştirme çabaları, ünlü IBM şirketinin araştırma merkezinde de sürdürülüyor. Tabii, belirtmeye gerek yok ki burada çalışan uzmanlar da aynı sorunlarla karşılaşıyorlar: Örneğin “Bir yata ihtiyacım var” cümlesi, sistemde “yat” sözcüğü bulunmadığından “Bir ata ihtiyacım var” biçimine dönüşüyor. Bu eksiklik ve aksaklıkları sabırla gidermeye çalışan, IBM araştırma merkezi görevlilerinden Frederick Jellinek, makinesine verdiği “Tangora” sözcüğünün ne anlama geldiği sorulunca gülümseyerek, “Bu, Guiness Rekorlar Kitabında belirtilen ve dünyanın en hızlı daktilografının adıdır” diyor.
Popular Science’den derleyerek çeviren.’Melih ÖLÇER