BİLGİSAYARLAR KONUŞUYOR 1985 den buyana
Telefondaki ses, sonra derece saygılı, nazik, yardımsever; ancak biraz mekanik, sanki teypten geliyor gibiydi:
— Hotel Alsterblick, iyi günler.
— İyi günler, ben Bay Briegel. Yarın için banyolu bir oda istiyorum. ,
— Emredersiniz, bir dakika lütfen.
Kısa bir aradan sonra yine aynı ses:
— Bay Briegel, yarın için rezervasyonunuz yapılmıştır. Konuşma devam etmektedir. Bay Briegel meraklı bir müşteridir. Odada telefon olup olmadığını, balkondan denizin mi, yoksa caddenin mi göründüğünü, sabah kahvaltısının kaçta olduğunu veya otelin oto parkı kapasitesi ile çevrede gezilip görülebilecek yerler hakkında bilgiler istemektedir. Telefondaki ses hep aynı tonda; yardıma hazır, sakin, saygılı; fakat daima mekanik kalmıştır. Mucize değil, telefondaki ses bir bilgisayardan gelmektedir. Ham-RPE; yanı “Hamburg’u Sohbet Arkadaşı adı venlen du aKiııı maKina ı-ıamDurg üniversitesi’nde, başkanlığını enformasyon bilim dalı öğretim üyelerinden Prof. Dr. VValther von Hanh’ın yaptığı “Enformasyon-Bilim ve Yapay Zekâ Araştırma Grubu” ta-
BİLİM m TEKttİK, TEMMUZ 1985
IHI:
Bugün film kameraları son pozu çektiğinizi, elektronik fırınlar yeni bir yemek tarifini veya havaalanlarına ve istasyonlara yerleştirilen otomatlar, beklediğiniz uçak veya trenin kaçta geleceğini, varmak istediğiniz yere kalkan ilk uçakta yer olup olmadığını ve fiyatım söyleyebilmektedir. Bilgisayarlar, artık konuşma sentezi yapabilmekte ve konuşulanları anlayabildiği gibi, konuşanlar arasında ses farklılığını ayırt edip, belli seslere göre işlem yapmakta veya yanıt vermektedir.
BİLGİSAYARLAR
KONUŞUYOR
rafından geliştirilmiştir. Bu konuşan makinanın kelime haznesi, her ne kadar otel işletmeciliği veya trafik durumu ile ilgili sözcüklerden oluşmuşsa da şimdiden, 25.000 DM.lık Teknik Komünikasyon Araştırma Ödülü’nü kazanmıştır.
Federal Alman Araştırma.ve Teknoloji Bakanlığı’nın dikkatini çeken bu makina, ayrıca bu tür projeler için 37 Milyon DM.lık para desteği de sağlamıştır. Artık bütün uğraşlar, rioğai biçimde konuşabilir ve” kuliamimasrkdaf birsim
arkadaşları tarafından üç yıldır geliştirilmeye çalışılan HAM— ANS, konuşulanları anlamakta ve kendisi de bizzat konuşmakta, insanlarla karşılıklı diyaloga girebilmekte, akıllı ve bazen
de bilgiççe yanıtlarıyla insanları etkilemekte, hayal dünyasına sürüklemektedir.
Kurgu bilim türü gösteriler, artık çoktan gerçek olmuştur. Makinaların insanlarla beşeri ilişkileri, artık sadece filmlerde veya romanlarda rastlanan olay olmaktan çıkmış, bilgisayarlar doğal konuşmaları anlar ve konuşur hale gelmişlerdir. Konuşulanı anlama ve sentetik sesler ile konuşma konuları özellikle sön yıllarda büyük gelişmeler göstermiştir. Konuşan çok sayıda makina ile kuşatıldığımız günümüzde yandaki karede görülen diyagram ve açıklaması espri olmaktan çıkmıştır.
Örneğin; bir mini cep kamerası, kullananı olumsuz durumlarda uyarmaktadır. Işık yetersiz ise “lütfen flaş kullanın”, telemetre ayarı tam değilse “uzaklığı ayarlayın” gibi sesler çıkartarak filmin en iyi biçimde çekilmesini sağlamaktadır. Film bittiğinde, fotoğraf makinasından yükselen ses “kamerada film bitti, lütfen yenisini takınız” olmaktadır. Yine Japonlar tarafından üretilen bir dikiş makinası; iplik takılı değilken, masurada yeterli iplik kalmamışsa, dikiş iğnesi kumaşa dik girmiyorsa veya makinanın yağlanması gerekiyorsa, bütün bunları sözlü olarak belirtmektedir.
Son yıllarda makinaların sohbeti, akla gelmedik alanlara yayılmaya başladı. Yoldaki sigara otomatına parayı attığınızda teşekkür etmekte, tam sigaranızı alıp gitmeye hazırlandığınızda, otomattan yükselen ses “lütfen çöpünüzü ve sigara izmaritinizi sokağa atmayınız” diyerek sizi uyarmaktadır. Çocuklar için geliştirilen yeni saatler, zamanı geldiğinde müşfik bir anne sesiyle uyku saatinin geldiğini hatırlatmakta, “haydi yatağa” demektedir. Öğrenciler için geliştirilen bir saat ise, haylaz öğrencilere ev ödevlerini yapmasını hatırlatmaktadır. Sadece bu son tip saatlerde, piyasaya sürüldüğünden itibaren 3 ay içinde 130.000 adet satılmıştır,
Kullanma talimatları da Japonya’da tarihe karışmaktadır. Bunun yerine aletin kendisi, satın alana sözlü olarak “önce A kolunu soldan sağa alınız, daha sonra B düğmesine basınız” biçiminde yol göstermektedir. Yemek kitapları da yakında
tarihe karışabilir; Oshabüri-Electrosan firmasınca .geliştirilen fırın 23 yemek tarifini belleğine almış olup, istendiğinde en t-.ı, ~nnhtım k-ıHsr anlatmaktadır Piyasada satılmakta oian
|E ——-rp—————
ı ıa
ıic ıt r
ır IJ k
—inrinHon ton alfı avrla 7S.000 kez sarkılı telgraf çekilmiştir.
« ‘ •■¿w«. o/ııi aoj-m sisteminin a akile-
»W “i” % , ‘jjtlii!!t‘i3Sldir
lerinin kontrolünü yapmak üzere yem araçlar geliştirmiştir. Firmaca üretilen lokomotif, tank, polis panzer motorlarının bakımı yapılırken araç, teknisyenin kulağına kulaklık aracılığı ile arızanın nerede olduğunu, bakım ve onarımı için ne yapılması gerektiğini söylemektedir. Frankfurt büyük garında tüm trenlerin kalkış ve varış planlarıyla yüklü olan bilgisayar “KARLCHEN” (küçük Kral) telefon! ile ¡arandığında gerekli bilgileri vermektedir. “Küçük Kral”ın kardeşlerine, toptan ve perakende satış depolarında, süper marketlerde, seyahat acentalannda, sigorta şirketlerinde veya bankalarda rastlamak mümkündür. Hatta Amerika Birleşik Devletleri’nde banka hesapları müşterilere, telefonda, konuşan bilgisayar aracılığı ile bildirilmektedir. İnsanların gözü ile takip etmesi olanaksız olan yer ve durumlarda sözlü uyarı sistemi kolayca yerleşmektedir. Örneğin ¡et pilotu ve oto sürücüleri dikkatlerini değişik yerlere harcarken, bazı önemli bilgileri göz yerine kulak aracılığı ile algılayabilirler, dikkatlerinin trafik üzerinde yoğunlaşması sağlanabilir.
Federal Almanya’da Trafik Araştırma Merkezi ve Otomobil Teknik Araştırma Demeği’nin Tübingen Üniversitesi Psikoloji Enstitüsü ile ortaklaşa yürüttükleri bir araştırma so-‘ nucuna göre: “Otomobilde konuşan göstergeler ve uyarı alet-
er verilmesi, yennae oır geuşmeuır. buruculerın göstergeleri takıp etmek için sari edecekleri dikkâti, akıp giden
!ûpjpa vpr
r
makina yardımıyla, narıtaya oaKmauan mfaıuı cuiicuıiıi
Konuşma sentezi daha çok optik göstergelerin yeteri kadar fark edilmediği veya okunamadığı yerler ile ancak telefon veya diğer iletişim araçlarıyla ulaşılabilen; yani görüntü söz konusu olmayan genel bilgi’ merkezlerinde önem kazanmaktadır.
Münih’te üretim yapan bir makina firması, kendi ürün-
ya yabancı bir kentte aranan adres kolayca öuiunacııir. eir firma tarafından geliştirilen EVA modeli otomobil bilgisayarı, bu inanılmaz görevi sürücü ile diyalog kurarak yerine getirmektedir. Daha önce bir şehir planındaki tüm bilgiler; caddeler, sokaklar, tek yönlü yollar, çıkmaz sokaklar, önemli binaların adresleri, nerelerde trafik lambaları bulunduğu ve
BİLİM ve TEKNİK
KONUŞMANIN |
| ANLAŞILMASI PRENSİBİ
j Şemaya bakıldığında, konuşmanın anlaşılması prensibi çok basit gibi görülse de, teknik açı- dan karmaşık bir olaydır. Büyük bellek kapasiteli hesap maklnalarının geliştirilmesine kadar | beklenilmiş, ancak süper makinalar ile denemelere başlanılmıştır. Daha sonraki gelişmeler dl- j yagramda görülmektedir. İlk aşama akustik dalgaların tipik özelliklerinin analizidir. Günümüz j Polis Teşkilatlarında sık kullanılan bir yöntem i yardımıyla ses analizi ve karşılaştırılması yapıl- | maktadır. Aynen parmak izinde olduğu gibi, in- i san sesinde de blrbiriyle karıştırılmayacak derecede farklı sonograflk spektrogramlar mevcut- i tur. Gelen sesi daha önce belleğine verilmiş spek- 1 trogram verileri ile karşılaştıran makina, ses sa- ; hibi İle hesap numarası sahibi arasındaki ilişkiyi
hangi yollara hangi saatlerde giriş yasağı bulunduğu, park yerleri gibi ayrıntılar bilgisayarın belleğine işlenmektedir. Sürücü daha sonra nerede bulunduğunu ve nereye gitmek istedi- ğinf bilgisayara işlemekte ve bilgisayarın yol göstermesini beklemektedir. “-ilk lambadan sola dönünüz” gibi. Federal Almanya yol haritası, otoyollar beşli Compact-Disc’e işlenmiş olup, ayrıca satın alınması gerekmektedir. Konuşan yardımcınızın otonuzda kaplayacağı hacim,sadece oto radyosunun- ki kadardır. Konuşma sentezi çözümlendikten sonra, görüyorsunuz teknik hemen hemen her şeyi başarmakta, çözümlenmeyen sorun bırakmamaktadır. Konuşulanın anlaşılması kurar. Veri bankasını oluşturmak için daha önce bilgisayara müşteriler tarafından beş-altı kez belli cümleler konuşulmakta, bilgisayar kişinin j sonograflk spektrosunu çekmekte, spektrogram sonuçlarını belleğine almaktadır. Veri bankasına, bilgisayarın kelime haznesi de diyebilirsiniz. Bilgisayar, eğer konuşanın ses özelliği İle belleğinde mevcut sesler arasında aynı özelliğe rast- j lamışsa, tanıma işlemi tamamlanmıştır. Konuşma sentezi teknik açıdan çok kolaydır. Entegre devreler ile konuşma parametreleri sayısal formda belleğe alınmış olup, sayısal teknik yardımıyla tekrar geriye verilebilir. Yapay konuşma, insan seslerinin tüm özelliklerinin taklit edilmesi pren- \ sibinden gidilerek başarılmaktadır. Bu yolla istenilen tüm seslerin çıkartılması mümkündür. Yani bilgisayarın konuşmaya yönelik kelime haznesi sınırlı değildir. Daha sonra konuşmada vur- S gulama, ritim ve melodik sesler üzerinde durul- | maktadır. Eğer veriler yeterli ise bir sayısal ko- I nuşma birleştiricisi insanın konuşma sanatının | elektronik modelini sergileyebilmektedir. j
konusunda olay biraz daha değişiktir. Makinaların konuşulan her kelimeyi anlayabilmesi için çok büyük bellek kapasitesine ihtiyaç vardır. Bunun tek nedeni; konuşma bir mantık sırasına dayanmamaktadır. Bilgisayar ise belli bir mantık dizisine programlanmıştır. Örneğin; aşağıdaki pasajı birlikte inceleyelim: “Kardeşim Mustafa lokantaya gitti. Garson ona nefis bir biftek getirdi. Bizimki ona bol bahşiş verdi.” Yukarıda üç cümle incelendiğinde, Mustafa önündeki yemeği yedimi, yoksa yemedi mi anlayamıyoruz. Ancak onun yemeği yediğini ve beğendiğini tahmin ediyoruz. Çünkü bir lokantada işlerin nasıl yürüdüğünü, olayların nasıl geliştiğini bilmek
teyiz. Kısacası bir lokantada garson, müşteriye bir yemek getiriyorsa, o yemek genellikle o müşteri tarafından yenilmektedir. Diğer tüm olasılıklar beklentiye uygun değildir.
Anlamak sadece duymak işlemine dayanmamakta, aynı zamanda duyulanların bellek yapısına ve içeriğine uygun bir durumda olması gerekmektedir. Yukarıdaki örnekte özellikle son cümlede ‘bizimki’ ve ‘o’ kelimelerinin anlamlarının anlaşılması için “bir lokantaya giden müşteriye, orada çalışan garson iyi servis yaparsa, müşteri çıkarken o garsona bahşiş verir” mantığının önceden makina belleğine işlenmesi gerekir. Diğer bir ömek: Domuz bifteği denildiğinde domuzdan elde edilen bifteğin akla gelmesi normaldir. Köylü biftek dediğimizde ise, özel biçimde hazırlanmış ve pişirilmiş bifteği anlarız, imambayıldı dediğimizde ise, imamın başına gelenleri değil, patlıcandan yapılan zeytinyağlı yemek gelir aklımıza. İnsan bu söylenenleri anlayabilir, çünkü bunlar akla yakın sözlerdir. Bilgisayarın bunları anlaması kendi mantığı çerçevesinde çok güçtür.
Bütün bunlara rağmen, bilgisayarlara sadece konuşma değil, duyma ve anlama melekesi de kazandırılabilmiştir. Anlamada yararlanılan kelime haznesi şu anda sınırlıdır, ama, olsun varsın, başlangıç olarak bu da iyidir.
İlk ömek, sektörün dev kuruluşu sayılan bir Amerikan bilgisayar şirketinin T.J.VVATSON Geliştirme Merkezi’nde geliştirilen prototiptir. Bu sistemde İngilizce olarak söylenen sözcükler makina tarafından algılanmakta ve kısa süre sonra ekrana yansımaktadır. Şimdiye kadar geliştirilen bilgisayarlar 500-1000 kelimeyi anlarken Dr. Frederick JELINNEK’- in başkanlığını yaptığı grup tarafından geliştirilen yeni makina, günlük konuşmada kullanılan 5000’in üzerindeki sözcüğü belleğinde taşımaktadır.
BİLGİSAYARLARA HEP GÜÇ İŞLERDE BAŞVURULMAKTADIR
Bilgisayardan medet uman insanın ki iki eli de doludur ve mutlaka üçüncü bir kola ihtiyacı vardır. Özellikle sözlü çalışan bilgisayarlar önemli görevleri yerine getirmektedirler. Örneğin:
- Posta servisinde mektup ve paketleri adreslerine göre ayırabilir, ‘
- Söylenen telefon numarasını arar ve sizin konuşmanızı sağlar,
- Mikroşiruji kliniklerinde operasyon mikroskobuna komuta ederek, istenilen pozisyona getirip, ayarlar ve istendiğinde lazer ışınlarının açılıp, kapanmasını sağlar,
- Endüstride otomatik veri toplama işlerini yapıp, kalite kontrol alanında çalışabilir.
Duyan bilgisayarlarıngelecekte kullanımı, sakatların dünyasına da yönlendirmek üzere bir dizi araştırma yürütülmektedir. Sakatlar için geliştirilen özel otolarda koltukların ayarlanması, dış ve iç aynaların doğru konuma getirilmesi, farların yanıp sönmesi veya sileceklerin çalışma hızı, radyonun
açılıp kapanması veya kanal değiştirmesi gibi işlemler, artık sözlü emir üzerine bilgisayarlara yerine getirilmektedir. Bir Japon firması, tarafından geliştirilen bu tür prototip, Ekim 1981 ‘den bu yana kullanılmaktadır. Tokyo Üniversitesi’nde yatalak hastalar için geliştirilen bir araç, hastanın yatış pozisyonunu değiştirmekte, yatağı dikleştirip yatay duruma getirebilmekte veya bir hastabakıcı robot yardımıyla yiyecek- içecek servisi yapabilmektedir. Bu şekilde yatalak ve sakatların ikinci kişilerin yardımı olmaksızın bazı işlerini yapmaları mümkün olabilmektedir.
Komutla yatağın hareket etmesi, telefonun söylenen numarayı araması, ocağın istenen yemeği pişirmesi, otomobilin yol tarif etmesi veya depoda benzin biterken sözlü uyarısı teknik açıdan küçük adımlar olarak nitelendirilebilir. Ancak tam konuşma yetenekli bilgisayarın ortaya çıkması içir biraz daha zamana ihtiyaç vardır. En büyük engel fiyattır. Bu tip anlayışlı-becerikli bilgisayarların pahalı olması normaldir. Ama bugün için de çok pahalıdır. A.B.D’de yaklaşık 100 kelime anlayan bir makinanın fiyatı 3.000 Dolar, belleğinde 800 kelime olanlar ise 10.000 Dolardır. Federal Almanya’da üretilen 128 kelime anlayan SR 600 tipinin fiyatı 10.000 DM.’dır.
KONUŞAN BİLGİSAYARLARIN GELECEĞİ Anlayıp konuşan bilgisayarlara olan ilgi gün geçtikçe art- ■nakcadir. A.B.D’nde 1985 yılı satışlarından beklenen ciro, yaklaşık 300 Milyon Dolardır. Satış gelirlerinin yanı sıra bakım, onarım ve yedek parça gelirlerini de hesaplarsanız, AvrupalIlar bu işte de yaya kalmışlardır.
Bir Ingiliz şirketler topluluğu, Amerikan ve Japon firmalarının elindeki bilgileri ele geçirmeye çalışmaktadır. Avrupa’da 12 üniversiteye 70 milyon Dolarlık araştırma yardımı yapmakta ve 1990’daki bu alandan gelirini 400 milyon Dolar olarak hesaplamaktadır.
Federal Alman Araştırma Bakanlığı 1988’e kadar uygulanacak 32 proje için toplam I Milyar Dolar ayırmış olup, Enformasyon Tekniği konularına öncelik vermiştir. Ayrıca I0C Milyon Dolarlık rezerve kaynak yeni projeler için eldi bekletilmektedir.
HOBBY den çev: Y.Doç. Dr. Aydın ÖZTAf
BİLİM