Краткое
русскоязычное описание интересного исследования литературных текстов и пара заметно его дополняющих содержательных комментов из социальных сетей.
"В работе авторы взяли эмоциональный словарь и прогнали его по 2000 художественных текстов. Получили столько же кривых, оказалось, что эти кривые классно описываются небольшим числом гармоник. Что говорит нам о следующем: 1) художественные тексты сравнительно легко поддаются автоматическому количественному анализу на уровне развития эмоций в повествовании. 2) гармоник этих надо мало, а большая часть текстов и вовсе попадает под небольшое число классов. И это не просто рассуждения признанных писателей, это эмпирический количественный факт. 3) косвенно через эмоциональные кривые оценивается и сюжет, а значит, его тоже можно перевести в количественные характеристики. А если добавить еще пару трюков - bag-of-words, контектные словари, можно и вовсе тексты досконально разобрать на кирпичики. 4) описанный метод прекрасно должен сработать и в обратном порядке, благо данные удалось продублировать не только при помощи сингулярного разложения, но и при помощи обучения без учителя. Это означает, что скормив такую кривую обратно нейросетке, можно в перспективе получить обратно книжку, удовлетворяющую канонам художественной литературы. Поскольку рэп и тексты в стиле Летова нейросети уже и так успешно пишут, подобное дополнение станет неплохим подспорьем в "завоевании" прозы и длинных форматов."
"Перевод у вас, ребята, не точен. Прямо с заглавия. Исследовались не сюжеты (plots), а эмоциональные "арки" (arc), которые к сюжетосложению относятся косвенно: «The emotional arc of a story does not give us direct information about the plot or the intended meaning of the story, but rather exists as part of the whole narrative»."

