Dengesiz veri kümelerinde duygu analizi
| dc.contributor.advisor | Güran, Aysun | |
| dc.contributor.author | Oğul, Hamdi Atacan | |
| dc.date.accessioned | 2024-12-15T15:48:31Z | |
| dc.date.available | 2024-12-15T15:48:31Z | |
| dc.date.issued | 2021 | |
| dc.department | Doğuş Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı | en_US |
| dc.description | Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı | en_US |
| dc.description.abstract | Bu tez c?alıs?masında son yıllarda popu?lerlik go?steren ve analizinin yapılmasının mu?s?teri geri bildirimlerini anlamak ac?ısından c?ok o?nemli olan duygu analizi konusunda, gerc?ek hayat verileri ile c?alıs?ırken kars?ılas?ılan dengesiz veri setlerinin ortaya c?ıkardıg?ı problemlere deg?inilmis? olup, bu konuda gu?venilir ve tutarlı sonuc? alabilmek ic?in literatu?rde en c?ok o?nerilen c?o?zu?m yo?ntemleri olan, o?rneklem arttırma ve o?rneklem azaltma temeline dayalı olan yo?ntemler incelenmis?tir. Bu yo?ntemlerin veri ku?melerinin dengeli hale getirilme performansları, sonuc?lara olan olumlu ve olumsuz etkileri yapılan c?alıs?malar ve deneylerle ortaya konulmus?tur. C?alıs?ma kapsamında gu?ndelik yas?amdan derlenen sosyal medya verilerinden olus?an, hem Tu?rkc?e hem I?ngilizce metin verilerinden olus?an 3 farklı duygu analizi veri ku?mesi u?zerinde c?alıs?malar yapılmıs?tır. Veri ku?meleri u?zerinde kelime tabanlı N-gram yapıları kullanılarak, o?rneklem arttırma ic?in ROS ve SMOTE, o?rneklem azaltma ic?in RUS ve NM1 algoritmaları uygulanmıs?tır. Ardından lojistik regresyon sınıflandırıcısı ve destek vekto?rleri makineleri u?stu?ndeki etkileri go?zlemlenerek analiz edilmis?tir. Sonuc? olarak lojistik regresyon ic?in o?rneklem arttırma yo?ntemlerinin go?zlemleri kars?ılas?tırılıp, RUS ve SMOTE yo?ntemleri ic?in tu?m N-gram deney deg?erleri ic?in bas?arım sag?landıg?ı go?zlemlenmis?tir. Benzer bir bas?arım deg?eri ise destek vekto?rleri makineleri ic?in ise sadece belli veri ku?meleri o?zelinde ortaya c?ıkmıs?tır. O?rnek azaltma yo?ntemlerinde ise kullanılan RUS ve NM1 algoritmaları ic?in, tu?m kullanılan N-gram deg?eri ic?in hem lojistik regresyon hem de destek vekto?rleri makineleri ic?in bas?arım deg?erinin du?s?tu?g?u? sonucu ortaya c?ıkmıs? ve sonuc?lar ayrıntı ile ac?ıklanmıs?tır. | en_US |
| dc.description.abstract | In this thesis, in the subject of sentiment analysis, which has become popular in recent years and its analysis is very important for understanding customer feedback, the problems caused by unbalanced data sets when working with real life data are discussed. In order to get reliable and consistent results on this issue, the methods that are the most recommended solution methods in the literature, based on sample increase and sample reduction were examined. Balancing performances of data sets of these methods and their positive and negative effects on the results have been demonstrated by controlled experiments. Within the scope of the study, 3 different sentiment analysis data sets consisting of social media data compiled from daily life and both Turkish and English text data were studied. Using word-based N-gram structures on the data sets, ROS and SMOTE algorithms for oversampling and RUS and NM1 algorithms for undersampling were applied. Then, the logistic regression classifier and support vectors machine algorithms were analyzed by observing in their effects. As a result, by comparing the observations of the sampling methods for logistic regression, it was observed that increasing the performance was achieved for all N-gram test values for the RUS and SMOTE methods. A similar performance occurred only for certain data sets for support vector machines. For the RUS and NM1 algorithms used in undersampling methods, it was found that the performance value for both logistic regression and support vector machines for all used N-grams decreased and the results were explained in detail. | en_US |
| dc.identifier.endpage | 92 | en_US |
| dc.identifier.startpage | 1 | en_US |
| dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=v7BkNnnepTnbhn8rNR77LWfgP5cgybHZsHP7U8rkokyFGWmQtFPup2jfz8Mgf9I1 | |
| dc.identifier.uri | https://hdl.handle.net/11376/4844 | |
| dc.identifier.yoktezid | 689103 | en_US |
| dc.language.iso | tr | en_US |
| dc.publisher | Doğuş Üniversitesi | en_US |
| dc.relation.publicationcategory | Tez | en_US |
| dc.rights | info:eu-repo/semantics/openAccess | en_US |
| dc.snmz | KA_20241215 | |
| dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | en_US |
| dc.subject | Computer Engineering and Computer Science and Control | en_US |
| dc.title | Dengesiz veri kümelerinde duygu analizi | en_US |
| dc.title.alternative | Sentiment analysis in imbalanced datasets | en_US |
| dc.type | Master Thesis | en_US |












