В статье рассмотрены вопросы разработки специализированного программного обеспечения для сбора, обработки и хранения данных социодинамических процессов (изменение эмоциональной окраски комментариев пользователей к опубликованным новостям в сетевых массмедиа, и электоральных кампаний выборов Президента США в 2012 и 2016 годах). Показано, что для его создания можно использовать конвейерный принцип с реализацией микросервисной архитектуры, а для хранения данных, с учетом их специфики и происхождения, предпочтительнее применение графовых баз данных. На основе собранных данных были получены временные ряды наблюдаемых процессов. Их R/S анализ показал, что они обладают антиперсистентностью. Исследование зависимости математического ожидания, дисперсии и эксцесса амплитуд отклонений уровней ряда от размеров интервала времени расчета амплитуд ("скользящего окна") показало, что для математического ожидания наблюдается корневая зависимость дробной степени; для дисперсии - степенной закон с дробным показателем больше 1,5; а поведение эксцесса показывает наличие так называемых «тяжелых хвостов», его величина существенно больше чем у нормального распределения. Полученные результаты указывают на то, что временные ряды рассматриваемых процессов обладают нестационарностью, нелокальностью, как по времени (имеют память), так и состоянию (проявляют самоорганизацию).
The article discusses the development of specialized software for collecting, processing and storing data from sociodynamic processes (changing the emotional color of user comments on published news in online media, and electoral campaigns of the US presidential elections in 2012 and 2016). It has been shown that for its creation it is possible to use the pipeline principle with the implementation of a microservice architecture, and for storing data, taking into account their specifics and origin, the use of graph databases is preferable. Based on the collected data, time series of observed processes were obtained. Their R/S analysis showed that they had antipersistance. A study of the dependence of the mathematical expectation, variance and excess of the amplitudes of deviations of series levels from the dimensions of the amplitude calculation time interval ("sliding window") showed that for the mathematical expectation there is a root dependence of fractional degree; for dispersion - the power law with a fractional indicator greater than 1.5; and the behavior of the excess shows the presence of the so-called "heavy tails," its magnitude is significantly greater than that of the normal distribution. The obtained results indicate that the time series of the processes under consideration have unsteady, non-locality, both in time (have memory) and state (show self-organization).