|
Sizin Web sayfanız hala konuşmuyor mu?
Nortel yöneticisi Dr. Manish Sharma, konuşma teknolojilerinin mevcut yeteneklerini ve gerçek dünyadaki uygulamalara nasıl aktarıldıklarını aşağıdaki söyleşide bizimle paylaşıyor.
KONUŞMA teknolojilerinde meydana gelen gelişmeler, yazıyı sese ve sesi yazıya dönüştürme işlemlerini olası kılıyor ve telefon ya da bilgisayarla yeni bilgi erişim yöntemleri sağlıyor. Herhangi bir Web sayfasından ya da bilgisayar veri tabanından alınan bir bilgi, ses uygulamalarına aktarılabiliyor, kullanıcılara daha geniş bir araç seçeneği ile, her yerde, her zaman sanal erişim olanağı sunuyor. 13 yıldır konuşma teknolojileri araştırmaları üzerinde çalışmakta olan Sharma, kariyerine Rutgers Üniversitesi'nde doktorasını yaparken, askeri uygulamalar için konuşma doğrulama teknolojileri araştırmaları yaparak başladı. Sharma, şu anda Nortel'de mevcut teknolojileri, özel müşteri ihtiyaçlarına uyarlayan, konuşma uygulama tasarımcılarından ve geliştirme uzmanlarından oluşan bir ekibin liderliğini yürütüyor. Konuşma teknolojileri sektörünün New York'ta gerçekleştirilen en büyük konferansı SpeechTEK 2004 etkinliğinde Sharma, konuşma teknolojisi konusunda dünyanın önde gelen 10 liderinden biri olarak nitelendirildi. Nortel'in Kurumsal Telefon Rehberi uygulaması da bu konferans sırasında “En İyi Paket Konuşma Uygulaması” ödülünü kazandı. Kurumsal Telefon Rehberi, çalışanların veri tabanlarını metin şeklinde alıyor ve şirketi arayan kişilere konuşma tanıma teknolojisi yoluyla sunuyor. 25 yıldan beri konuşma teknolojilerinde sektör lideri olan Nortel, 2004'ün başlarında, kurumsal konuşma teknolojileri uygulamalarındaki başarılarından dolayı Frost & Sullivan tarafından verilen “2004 Konuşma Çözümleri Rekabetçi Strateji Ödülü”nü kazandı. Frost & Sullivan şirketinin tüm dünyada gerçekleştirdiği pazar araştırmasına göre Nortel, 15 dilde ve 16'dan fazla ülkede 200'den fazla konuşma uygulaması tasarladı ve kullanıma sundu. Geçtiğimiz yılda konuşma teknolojisi sektörüne yaptığınız katkılardan dolayı, SpeechTEK'te dünyanın önde gelen 10 liderinden biri seçildiniz. Bu katkıları nasıl tanımlarsınız? Ben bu ödülün, hem benim kişisel başarımın, hem de sektörde Nortel'in liderliğinin bir yansıması olduğunu düşünüyorum. SpeechTEK ödülleri meslektaşlarımın da verdiği oylarla kazanılıyor ve beni bu sahada Nortel'in yüzü olarak görüyorlar. Nortel sektörde konuşma teknolojileri konusunda saygın bir şirket, kurumsal pazarda da iyi bir yere sahip. Günümüzde konuşma teknolojisinin en çok kullanıldığı alanlar hangileri? Konuşma tanıma ve yazının konuşmaya dönüşümü teknolojileri şu anda birçok alanda kullanılıyor. Bunların arasında finans hizmetleri, hava yolları, telekomünikasyon, kamu hizmeti sektörü, eğlence ve devlet uygulamaları sayılabilir. Bu teknolojiler insan müdahalesi olmaksızın sürekli tekrarlanan görevleri yerine getirmek için kullanılıyor. Nortel'deki konuşma teknolojileri ekibi, değişik sektörler için özellikle çağrı merkezlerinin günlük işlemlerin önemli bir bölümünü oluşturduğu ortamlarda, belirli bir müşteri gereksinimine özgün konuşma uygulamalarını tasarlıyor ve kullanıma sunuyor. Çağrı merkezleri gibi günümüzde çok yaygın olan ortamlarda, herhangi bir sektörde çağrıların doğru bölüme yönlendirilmesi, ya da bir müşterinin isminin ve adresinin alınması gibi rutin, tekrarlanan görevler için ses uygulamaları kullanılabiliyor. Bu uygulamalar müşteri memnuniyetini artırıyor. Çünkü basit işlemler kolayca gerçekleştiriliyor ve sorular hızlı bir şekilde cevaplanıyor ya da arayan kişi, istek üzerine doğru temsilciye yönlendirilebiliyor. Bizim çalıştığımız büyük bir kamu hizmeti şirketi fatura ödemeleri ve hizmetlerin başlatılması veya durdurulması için konuşma servislerini kullanmaya karar verdi. Şu ana kadar otomasyonla bunu başarmak zordu. Çünkü sokak isimleri müşteri tarafından telefon düğmeleri ile girilemiyordu, adres içeren tüm çağrıların temsilcilerce alınması gerekliydi. Konuşma teknolojileri bu rutin hizmeti yürütebilir. Böylece operatör ve temsilciler zamanlarını müşterilerin daha karmaşık sorunlarını çözmek için harcayabilirler. Artık Web sayfalarında ya da bilgisayar veri tabanlarındaki yazılar kolayca konuşmaya dönüştürülebildiği için, bilgiye telefon ya da bilgisayar ile erişme olasılıkları çok daha arttı. Konuşma uygulamalarının şirketler tarafından bu kadar kabul görmesini neye bağlıyorsunuz? Bana göre bunun iki önemli nedeni var: çözümlerin yeterliliği ve endüstri standartlarının oluşturulması. Konuşma çözümleri geçtiğimiz birkaç yılda oldukça gelişti. Ses tanıma sistemlerinin hata oranı artık çok düşük, kullanıcıları bıktırmadan birçok dil ve şive ile insan sesini anlayabiliyorlar. Doğal dil yönlendirme teknolojisi, kullanıcıya arama nedenleri ile ilgili açık uçlu sorular sorulmasına olanak tanıyor ve uygulama, doğal dil anlayışı kullanarak çağrıyı doğru varış yerine yönlendiriyor. İlk olarak, konuşma bilim ve teknolojisi ile birlikte, ses-kullanıcı ara yüzü de büyük ölçüde gelişti. Bu uygulamalar doğal konuşma girdilerini anlamanın yanında, sistemin ikazları ve konuşma çıktıları da son derece doğal. İnsan-makine arayüzünün tamamı son derece rafine hale geldi. Konuşma uygulamaları tasarımının bilim ve sanatındaki bu olgunluk yeni konuşma uygulamalarının başarısını büyük ölçüde artırdı ve iş dünyasının liderlerinin bu teknolojileri günlük hayata geçirmesini kolaylaştırdı. İkinci olarak, World Wide Web Konsorsiyumu'nun(W3C) da onayladığı konuşma uygulaması gelişimi için artık endüstri standartları var. Örneğin, HTML yıllardır bir Web standardı olmaya devam ediyor. Herkes okuması kolay bir grafik arayüz üzerinden görsel olarak yazı sunmak için bunu kullanıyor. Şimdi de, yazıyı konuşmaya dönüştürmek için ve ses tanıma uygulamaları için VXML (Voice eXtensible Markup Language), CCXML (Call Control eXtensible Markup Language) ve SIP (Session Initiation Protocol – Oturum Başlangıç Protokolü) endüstri standartları sektörün tamamına yararlı oluyor. Endüstri standartları olması, konuşma çözümleri sektörünün saygınlığını artırdı. Çünkü herkes aynı standardı temel alarak uygulama tasarlıyor ve şirketler de yatırımlarının korunduğunu düşünüyor. Uygulamalar birden fazla tedarikçiden satın alınabiliyor. Kimlik doğrulamak için kişinin parmak izi, sesi ya da gözleri gibi biyolojik özelliklerini kullanma bilimi olan biyometrik sayesinde yeni güvenlik sistemleri geliştiriliyor. Konuşma teknolojileri biyometrikte herhangi bir rol oynayacak mı? Uzun dönemli vizyonda sesimiz parmak izimiz gibi olacak, ama ses doğrulama tekniği tam olarak oluşmadı. Ses doğrulama sistemlerindeki hata oranları % 1 ila % 2 arasında. Bu, birçok ticari uygulama için kabul edilebilir bir oran, ancak başka uygulamalar kesinlikle %100 doğruluk oranı gerektiriyor, bu da zamanla gelecek. Biyometrik teknolojilerin ticari değeri yüksek. Çünkü güvenlik, ses ya da parmak izi gibi değişmeyen bir şeye bağlı, kredi kartı ya da şifre gibi çalınabilecek bir şeye değil. Ses, taklit edilmesi zor bir özellik olduğundan ses doğrulaması şifreden daha güvenli olacak. Biyometrikte ses doğrulamasının uygulama alanı daha geniş. Parmak izi ya da göz gibi, sesle doğrulamada kişinin doğrudan orada olması gerekmiyor. Bir devlet kuruluşunda ya da şirkette ses kaydınız varsa, telefonla otomatik olarak kimlik doğrulamanızı yaptırabilirsiniz. Önümüzdeki dört yılda konuşma teknolojisinden neler bekleyebiliriz? Hangi konuşma teknolojisinin en yaygın olacağını tahmin etmek zor. Ama bence önümüzdeki iki ile dört yıl arasında ses ‘self-servis' uygulamaları için ses tanıma en baskın arayüz olacak. Aynı zamanda, bireysel haberleşme hizmetleri için kullanılan SIP gibi IP temelli teknolojilere de ses tanıma teknolojisinin gireceğini tahmin ediyoruz. SIP'in en popüler yeteneklerinden biri de tüm mesajlarınızı – ses, e-posta ve faks – tek bir posta kutusuna yönlendiriyor olması. Bu posta kutusuna bilgisayar ya da PDA-Avuç içi bilgisayardan erişilebiliyor. SIP'e ses tanıma, metinden konuşmaya ve konuşmadan metne çevirme kapasitelerini de eklediğiniz zaman, nerede olursanız olun, bilgisayar erişimi olmadan, telefonla tüm mesajlarınıza erişebileceksiniz. Örneğin, bir e-posta mesajı size telefonda okunabilecek, siz de sözel olarak bir yanıtı telefona okuyup, cevap yazdırabileceksiniz. Genelde, konuşma teknolojilerinin gerçek dünyadaki uygulamaları benim düşündüğümden çok daha hızlı ilerledi. On yıl önce ses tanıma ve metinden konuşmaya çevirim uygulamalarının yaygın kullanımının en azından 20 yıl süreceğini düşünebilirdik. Ancak, şimdiden gittikçe daha çok kabul görmeye başladılar bile. Çok hızlı bir şekilde geliştiler ve özellikle müşteri hizmetleri ve SIP gibi çoklu ortam uygulamaları için geliştirilen yenilikler başka uygulamalar için de geçerli olacak. Bunlar Nortel'in araştırma ve geliştirme çalışmalarını odakladığı alanlar ve hangi ölçekte olursa olsun, tüm şirketler için verimlilik, maliyet indirimi ve müşteri memnuniyeti konularında heyecan verici rekabetçi avantajlar sağlamaları kaçınılmaz. |