Нейронная сеть Doc2vec в задаче автоматического определения тональности текстов социально-сетевого дискурса (на материале русского языка)

  • Наталія Євгеніївна Маслова Інститут прикладної і математичної лінгвістики ФДБОУ ВПО «Московський державний лінгвістичний університет»

Abstract

Статья освещает подходы к решению задачи автоматического определения тональности русскоязычных текстов, входящих в состав полилогов социально-сетевого дискурса экологической направленности. В рамках подхода к машинному
обучению с учителем создан программный продукт с помощью модуля нейронных сетей Doc2vec. Программа отвечает
требованиям, диктуемым особенностями коротких неформальных текстов.

Autor/innen-Biografie

Наталія Євгеніївна Маслова, Інститут прикладної і математичної лінгвістики ФДБОУ ВПО «Московський державний лінгвістичний університет»

аспірант кафедри прикладної та експериментальної лінгвістики

Literaturhinweise

1. Бахтин М.М. Эстетика словесного творчества / М.М. Бахтин. – М. : Искусство, 1979. – 423 с.
2. Вольф Е.М. Функциональная семантика оценки / Е.М. Вольф. – М. : Едиториал УРСС, 2002 – 280 с.
3. Потапова Р.К. Социально-сетевой дискурс как объект междисциплинарного исследования / Р.К. Потапова // Материалы
2-й международной конференции «Дискурс как социально-сетевая деятельность». – М. : МГЛУ, 2014 – С. 20–32
4. Потапова Р.К. Депривация как базовый механизм вербального и паравербального поведения человека (на материале социально-сетевой коммуникации) / Р.К. Потапова // Речевая коммуникация в информационном пространстве. – М. : ЛЕНАНД,
2017, – С. 17–36.
5. Усталов Д.А. Извлечение терминов из русскоязычных текстов при помощи графовых моделей (рус.) / Д.А. Усталов //
УРФУ, Екатеринбург, Россия: конференция. – 2012.
6. Czerny M. Modern Methods for Sentiment Analysis / M. Czerny [Электронный ресурс].– Режим доступа :
https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis#disqus_thread.
7. Liang H., Fothergill R., Baldwin T. RoseMerry: A Baseline Message-level Sentiment Classification System // Proceedings of
the 9th International Workshop on Semantic Evaluation (SemEval 2015), pp. 551–555 [Электронный ресурс].– Режим доступа :
http://alt.qcri.org/semeval2015/cdrom/pdf/SemEval092.pdf.
8. Mikolov T. Le Q. Distributed Representations of Sentences and Documents // Proceedings of the 31-st International Conference
on Machine Learning, Beijing, China, 2014. JMLR: W&CP volume 32. Copyright 2014 by the author(s).
9. Rehurek R., Sojka P. Software Framework for Topic Modelling with Large Corpora // Proceedings of the LREC 2010 Workshop
on New Challenges for NLP Frameworks, ELRA, 2010, pp. 45–50 [Электронный ресурс].– Режим доступа : https://github.com/
RaRe-Technologies/gensim#citing-gensim.
10. Tang D., Wei F., Yang N., Zhou M., Liu T., Qin B. Learning Sentiment-Specific Word Embedding for Twitter Sentiment
Classification // Proceeding of the 52th Annual Meeting of the Association for Computational Linguistics, ACL, 2014, –
pp. 1155–1166. [Электронный ресурс].– Режим доступа : http://anthology.aclweb.org/P/P14/P14-1146.pdf.
11. Word Embeddings for Fun and Profit: Document classification with Gensim [Электронный ресурс].– Режим доступа :
https://github.com/RaRe-Technologies/movie-plots-by-genre/blob/5a2d9157f9bf1bf908794051597b7851333dcfca/ipynb_with_
output/Document%20classification%20with%20word%20embeddings%20tutorial%20-%20with%20output.ipynb#L1403.
Veröffentlicht
2019-07-18