Türkçe Metinler İçin Pos Etiket Bilgisi İle Cümle Sonu Belirlenmesinde Derin Öğrenme Yöntemlerinin Başarısı

doi:10.5281/zenodo.8233545

Published July 25, 2023 | Version v1

Journal article Open

Türkçe Metinler İçin Pos Etiket Bilgisi İle Cümle Sonu Belirlenmesinde Derin Öğrenme Yöntemlerinin Başarısı

1. Mersin Üniversitesi, Erdemli Meslek Yüksekokulu, Bilgisayar Teknolojileri Bölümü, Mersin, Türkiye
2. Çukurova Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Adana, Türkiye

Günümüzdeki teknolojik gelişmelerin bir sonucu olarak dijital dünyada yazılı ve sözlü metinler hızla artmıştır. Bununla birlikte Doğal Dil İşleme (DDİ) uygulamaları günümüzde büyük önem kazanmıştır. DDİ uygulamalarında çözülmesi gereken ilk ve en önemli konu metindeki cümle sonlarının doğru bir şekilde belirlenmesidir. Çoğunlukla cümle sonunda bulunan nokta, ünlem, soru işareti gibi noktalama işaretleri sadece cümle sonunu belirlemede kullanılmazlar. Bu yüzden noktalama işaretlerinin kullanım amacının belirginleştirilmesi de bir problem olarak karşımıza çıkmaktadır. Daha önce yapılan çalışmalarda POS (Part-Of-Speech) etiket bilgilerinin cümle sonuna etkileri incelenmiş ve klasik sınıflandırıcılar ile başarılı sonuçlar elde edilmiştir. Bu çalışmada ise kural tabanlı oluşturulmuş olan 9 adet niteliğe farklı sayılarda POS etiket bilgileri eklenmiş ve Uzun Kısa Süreli Bellek (Long Short Term Memory- LSTM) ve Çift Yönlü Uzun Kısa Süreli Bellek (Bidirectional Long Short Term Memory- BiLSTM) olarak isimlendirilen derin öğrenme yöntemleri ile deneyler gerçekleştirilmiştir. Deneylerde Türkçe Ulusal Derlemi (TUD) ve SETimes isimli paralel derlem kullanılmıştır. TUD 1990-2009 dönemini kapsayan, çok fazla alan ve türden oluşmuş 50 milyon kelimelik bir derlemdir. SETimes ise 9’u güneydoğu Avrupa’ya biri ise İngilizceye ait olmak üzere toplam 10 dilden oluşan bir paralel derlemdir. Belirtilen derlemlerden gelişigüzel seçilen cümle sonu olan ve olmayan 30000 örnekli dengeli alt veri setleri oluşturulmuş ve deneylerde kullanılmıştır. Yapılan deneyler ile Geri Beslemeli Sinir Ağı (Back Propagation Neural Network), RBF (Radial Basis Function) Ağı, Naive Bayes sınıflayıcısı, Karar Ağacı ve Destek Vektör Makinesi (Support Vector Machine) gibi klasik sınıflandırıcılar ile LSTM ve BiLSTM gibi derin öğrenme yöntemleri kıyaslanmıştır. Bunun sonucunda derin öğrenme yöntemlerinin başarısının belirgin bir şekilde klasik sınıflandırıcılardan iyi olduğu gözlenmiştir.

Files

8_382_87-99_8233545.pdf

Files (751.4 kB)

Name	Size	Download all
8_382_87-99_8233545.pdf md5:adcf4e87161502067490e4d7ed5028a7	751.4 kB	Preview Download

	All versions	This version
Views	27	27
Downloads	26	26
Data volume	20.3 MB	20.3 MB

Türkçe Metinler İçin Pos Etiket Bilgisi İle Cümle Sonu Belirlenmesinde Derin Öğrenme Yöntemlerinin Başarısı

Creators

Description

Files

8_382_87-99_8233545.pdf

Files (751.4 kB)