Veri Biliminde Türkçe’nin Kullanımı: Bir başlık incelemesi


H. Kemal Ilter
2019


Medium.com birçok alanda olduğu gibi veri bilimi alanında da ilgi gören bir platform. Bu platformdaki yazıları takip etmeye çalışıyor olabilirsiniz ama kullanılan dil ile ilgili yetersizlikler nedeniyle bunu başaramayabilirsiniz. Örneği, 28 Mayıs 2018’de yayınlanmış ve 853 okuyucunun beğenisini kazanmış bir yazının başlığına[1] ilişkin olarak sunacağım. Yazının tamamını okumak, Türkçe kavrayış düzeyinizi çok düşürmezseniz, acı verici bir deneyim olacak ve tavsiye ettiğimi söyleyemem.

Yazı, “DERİNE DAHA DERİNE: Evrişimli Sinir Ağları” ana başlığına ve “Bilgisayarlı görü neden gerekli?” alt başlığına sahip. Genellikle okuma yaparken başlığa dikkat ediyorum ve bu yazıdaki başlık tercihinin anlatılan konuyla ilgili olduğunu varsayıyorum. Yazının başlığında kaç tane problem bulabilirim ki?

Ana başlığın semantik olarak yanlış olması, yazının devamında buna benzer sorunlar olduğunu tahmin etmeme yol açtı. Maalesef bu tahminimde yanılmadığımı görüyorum. Yazının -yalnızca- başlığıyla ilgili sorunları aşağıda maddeler halinde bulabilirsiniz.

(a) Semantik yapı. Ana başlığın bir bölümü tamamiyle büyük harflerle yazılmış kelimelerden, diğer bölümü baş harfleri büyük kelimelerden oluşuyor. Bu, ya dikkatsiz bir yazarın yazısını okuyorsunuz anlamına geliyor ya da -daha fenası- bunu umursamayan bir yazarın. Her ikisi de, eğer şahsi bazı notlar yazmıyorsanız, kabul edilebilir değil.
(b) Basit hata. Ana başlığın ilk bölümü, doğal olarak, ‘Derine, Daha Derine’ olmalı, ilk iki kelime arasında virgül kullanmak gerekir. “Nerede ne kullanacağımı sana mı soracağım?” sorusunun, üzerinde düşünülmesi ve ayrıca tartışılması gereken bir konu olduğunu sanıyorum.
(c) Kavramsal sorun. Ana başlığın ikinci bölümü “Evrişimli Sinir Ağları” ve bu “evrişim” nedir çok merak ediyorum. Yazarın, “evrişim” kelimesini İngilizce “convolutional” kelimesi yerine kullandığı anlaşılıyor. “Convolutional,” Latince “convolvō”den gelen ve “con” (birlikte) ile “volvō”den (sarılmak) türemiş İngilizce bir kelime. Oxford’a göre[2] iki anlamı var; (1) karmaşık ve takip edilmesi zor bir şey, (2) sarım veya büküm. Fakat yazının konusu düşünüldüğünde, “convolutional” neural network olarak, matematikte özel bir doğrusal (İng. linear) işlemi tanımlayan bu kelimenin, sinir ağı katmanlarından en az biriyle yapılan matris çarpımları için kullanıldığını düşünebiliriz. Teknik olarak, çapraz korelasyonu[3][4][5][6] ifade ediyor.

Peki, yazar neden bu kelimeyi kullanmayı tercih ediyor? Nazik olmak adına “uyduruyor” demek istemem. Nitekim öyle bile olsa, “uyduran” kendisi değil gibi geliyor bana. Internet’de gördüğüm kadarıyla başkaları da bu şekilde -hatalı olarak- kullanmış.

“Evrişim” kelimesi nereden geliyor? Evrim’i, Evrimleşmek’i, Evrilmek’i biliyorum, nedir bu Evrişim? TDK’nun web sitesine[7] baktığınızda bu kelimeye değil ama Evrişik kelimesine rastlayacaksınız. İlk defa duyduğum bir kelime ve sözlükteki anlamı ‘Evirme yoluyla elde edilen (önerme)’ olarak belirtilmiş. Anlıyorum ki, ‘evirerek’ bir çok kelime üretilmiş, detayına girerseniz siniriniz bozulabilir, uyarmadı demeyin! Kısaca sözlüklerde “Evrişim” diye bir şey yok ve yazar, yukarıda bahsettiğim gibi, İngilizce’den türetilmiş(?) bu kelimeyi, tahminime göre çeşitli kaynaklardan elde ettiği şekliyle kullanmayı tercih etmiş.

Özet olarak şunu söyleyebilirim ki, yabancı dilden direkt olarak yapılan çeviriler yerine konunun anlamını ifade eden kelimelerin kullanılması ve bu imkansız görünüyorsa yeni bir kelimenin önerilmesi daha mantıklı geliyor bana. Yazar, “Evrişim” kelimesi yerine zaten bilinen ve sıklıkla kullanılan katmanlı, katlanmış, sarmaşık, sarılmış, bükülmüş, bükümlü, vb. kelimelerden birini tercih edebilirdi diye düşünüyorum. Yazının tümünü okursanız, başlıkta dikkatimi çeken çeşitlilikten daha fazlasını -maalesef- görebileceksiniz.



References