Границы понимания синтетических респондентов: новый контур производства знаний, методологические риски и стандарты проверки данных
(Стр. 179-186)
Подробнее об авторах
Незговорова Мария Игоревна
кандидат социологических наук; директор по инновациям, член совета; фонд Future Research – «Исследования Будущего»
Online Market Intelligence (OMI)
г. Москва, Российская Федерация
Online Market Intelligence (OMI)
г. Москва, Российская Федерация
Аннотация:
Синтетические респонденты постепенно переходят из статуса экспериментальной техники в регулярный инструмент социальных и маркетинговых исследований. В статье анализируется этот переход и фиксируются методологические риски, границы применимости и стандарты проверки данных в новых исследовательских контурах. Показано, что синтетика способна ускорять разведочные этапы, расширять вариативность качественного анализа, а также поддерживать статистически контролируемое восстановление и усиление количественных массивов, но одновременно усиливает эпистемические ограничения, связанные с зависимостью выводов от источников данных, вариативности профилей, формулировки исследовательского вопроса и процедур валидации. Предложена типология шести разновидностей синтетических респондентов и описана логика переходов между ними: от разговорных персон к моделированию групповой динамики, восстановлению анкет, мультимодальной интерпретации стимулов и построению «цифровых двойников». Сделан вывод, что прикладные практики индустрии (Ipsos; Livepanel) и решения разработчиков (Yabble; Synthetic Users; Lakmoos), а также академические эксперименты (включая Стэнфордские исследования генеративных агентов) формируют общий язык валидизации и ограничений. Отдельно показано, что в российском контуре синтетика институционализируется в UX и продуктовых исследованиях как ускоритель разведки и подготовки гипотез, тогда как в количественной инфраструктуре OMI/Livepanel фокус смещается к «дополненным синтетическим респондентам» и машинному дозаполнению анкет, обеспечивающему масштабируемую работу с крупными опросными массивами и статистически контролируемую достройку сложных целевых аудиторий с высокой точностью и воспроизводимостью измерений.
Образец цитирования:
ОБРАЗЕЦ ЦИТИРОВАНИЯ: Незговорова М.И. Границы понимания синтетических респондентов: новый контур производства знаний, методологические риски и стандарты проверки данных // Социально-политические науки. 2026. Т. 16. № 1. С. 179-186. DOI: 10.33693/2223-0092-2026-16-1-179-186. EDN: LRYLSI
Список литературы:
Argyle L.P., Busby E.C., Fulda N. et al. Out of one, many: Using language models to simulate human samples. Political Analysis. 2023. Vol. 31. No. 3. Pp. 337–351. DOI: 10.1017/pan.2023.2.
Bisbee J., Clinton J.D., Dorff C. et al. Synthetic replacements for human survey data? The perils of large language models. Political Analysis. 2024. Vol. 32. Pp. 401–416. DOI: 10.1017/pan.2024.5.
Deville J.-C., Särndal C.-E. Calibration estimators in survey sampling. Journal of the American Statistical Association. 1992. Vol. 87. No. 418. Pp. 376–382. DOI: 10.1080/01621459.1992.10475217.
Jansen B.J., Jung S.-g., Salminen J. Employing large language models in survey research. Natural Language Processing Journal. 2023. Vol. 4. Art. 100020. DOI: 10.1016/j.nlp.2023.100020.
Lewis P., Perez E., Piktus A. et al. Retrieval-augmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems. 2020. Vol. 33. arXiv: 2005.11401.
Little R.J.A., Rubin D.B. Statistical analysis with missing data. 2nd ed. Hoboken: Wiley, 2002. 408 p. ISBN: 978-0-471-18386-0.
Park J.S., O’Brien J.C., Cai C.J. et al. Generative agents: Interactive simulacra of human behavior. Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology (UIST ‘23). 2023. DOI: 10.1145/3586183.3606763.
Rubin D.B. Multiple imputation for nonresponse in surveys. New York: Wiley, 1987. 284 p. ISBN: 978-0-471-08705-2.
Valenzuela S., Winter S., Rivera S. Using large language models for survey research in communication: Opportunities and challenges. Communication and Change. 2025. Vol. 1. Art. 14. DOI: 10.1007/s44382-025-00014-z.
Bisbee J., Clinton J.D., Dorff C. et al. Synthetic replacements for human survey data? The perils of large language models. Political Analysis. 2024. Vol. 32. Pp. 401–416. DOI: 10.1017/pan.2024.5.
Deville J.-C., Särndal C.-E. Calibration estimators in survey sampling. Journal of the American Statistical Association. 1992. Vol. 87. No. 418. Pp. 376–382. DOI: 10.1080/01621459.1992.10475217.
Jansen B.J., Jung S.-g., Salminen J. Employing large language models in survey research. Natural Language Processing Journal. 2023. Vol. 4. Art. 100020. DOI: 10.1016/j.nlp.2023.100020.
Lewis P., Perez E., Piktus A. et al. Retrieval-augmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems. 2020. Vol. 33. arXiv: 2005.11401.
Little R.J.A., Rubin D.B. Statistical analysis with missing data. 2nd ed. Hoboken: Wiley, 2002. 408 p. ISBN: 978-0-471-18386-0.
Park J.S., O’Brien J.C., Cai C.J. et al. Generative agents: Interactive simulacra of human behavior. Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology (UIST ‘23). 2023. DOI: 10.1145/3586183.3606763.
Rubin D.B. Multiple imputation for nonresponse in surveys. New York: Wiley, 1987. 284 p. ISBN: 978-0-471-08705-2.
Valenzuela S., Winter S., Rivera S. Using large language models for survey research in communication: Opportunities and challenges. Communication and Change. 2025. Vol. 1. Art. 14. DOI: 10.1007/s44382-025-00014-z.
Ключевые слова:
синтетические респонденты, маркетинговые исследования, социальные науки, большие языковые модели, машинное обучение, моделирование поведения, валидизация, цифровые двойники, UX-исследования.