Gizli Dirichlet ayırımı kullanılarak COVID-19 salgını döneminde yayınlanan internet haberlerinin konu modellemesi

Yükleniyor...
Küçük Resim

Tarih

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Doğuş Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tez çalışmasının amacı Koronavirüs Pandemisi sürecinde yayınlanan internet haber metinlerinin üzerinde Gizli Dirichlet Ayırımı (Latent Dirichlet Allocation, LDA, GDA) yapılarak konu modelleme işlemlerinin gerçekleştirilmesi ve sonuçların araştırılmasıdır. Bu amaçla; internet üzerinde yayın yapan 9 farklı haber kaynağında yayınlanan; 10 farklı kategorideki haber metinleri üzerinde araştırmalar yapılmış ve sonuçlar yorumlanmıştır. Ayrıca tez çalışmasında; her bir haberin içeriğinde bulunan tüm kelimelerin köklerinin elde edilmesi aşamasında Türkçe dilini destekleyen bir Doğal Dil İşleme metodu olan Zemberek'ten faydalanılmıştır. Haberlerin bulunduğu her bir kategori için duygusal durum sonucunu ortaya koyan VADER'den yararlanılarak, aylık olarak haberlerin duygusal durumu ortaya çıkarılmıştır. Bu çalışma yapılırken kullanılan veri kümeleri tamamen sıfırdan oluşturulmuş ve ilgili haber mecralarından bu haberler yeni geliştirilen kod yapılarıyla ve botlar vasıtasıyla elde edilmiştir. Çalışmada her bir kategori içerisinde en fazla yer alan konu başlıkları belirlenmiş ve dönemsel olarak bu başlıkların hangi günlük konular ile ilgili olduğu tespit edilmeye çalışılmıştır.

The aim of this thesis study is to perform the topic modeling processes and investigate the results by making Latent Dirichlet Allocation (LDA) on the internet news published during the Coronavirus Pandemic period. For these purposes, related researches were carried out on the news published in 9 different news sources and in 10 different categories on the internet, and the results were interpreted. In addition, in the thesis study; Zemberek, a Natural Language Processing method that supports the Turkish language, was used in the process of obtaining the roots of all the words in the content of each news. The emotional state of the news was revealed on a monthly basis by using VADER, which reveals the emotional state result for each category of news. The datasets used in this study were created completely new and these news from the relevant news channels were obtained by means of bots with newly developed code structures. In the study, the most common topics in each category were determined and it was tried to determine which daily topics these topics were related to periodically.

Açıklama

Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Koleksiyon

Onay

İnceleme

Ekleyen

Referans Veren