DOĞAL DİLDEN, DİLİN OTOMATİK İŞLENMESİNE
«Dilbilim mühendisliği», «dil sanayii», «dilbilimsel bilişim» veya «bilişimsel dilbilim» terimleri, insanların ayrıcalıklı iletişim yolu olan dilin bilgisayarla işlenmesine imkân veren araçlar ve teknikler bütününü ifade eder. Dili, yapay diller olan programlama dillerinden ayırt etmek için, doğal dil’den söz edilir. Doğal dilin ifade biçimlerinin çokluğu (ulusal diller, şiveler, vurgular vb) ve bunun kolaylaştırdığı yaratıcılık (yeni kelimelerin yaratılması, kelime oyunları, küçük anlam farkları, yazışma dili vb.), dili çok daha karmaşık bir olgu haline getirir.
Dili, yazılı (yazı dili) ve sözlü (konuşma dili) olmak üzere iki biçimde kullanırız. Yazılı biçim, el yazısı basılı metin veya bilgisayar disketlerinde saklanan elektronik metin biçiminde olabilir. Bunun otomatik olarak işlenmesi, basit bir kelimeden, ansiklopedilere kadar uzanan çok çeşitli boylardaki metin öğeleri üzerinde gerçekleştirilir. Öğeler (sözlü, elle yazılmış, basılı), elektronik işaretler biçiminde kodlanmalıdır; bu durumda bunların önceden