Формирование синтетических данных в моделях машинного обучения на основе кратномасштабного анализа двоичных марковских моделей
(Стр. 47-55)

Подробнее об авторах
Пушкин Павел Юрьевич кандидат технических наук, доцент; директор, Институт перспективных технологий и индустриального программирования
МИРЭА – Российский технологический университет
г. Москва, Российская Федерация Конышев Михаил Юрьевич доктор технических наук, доцент; профессор, кафедра КБ-1 «Защита информации», Институт кибербезопасности и цифровых технологий; МИРЭА – Российский технологический университет; г. Москва, Российская Федерация Перевезенцев Дмитрий Сергеевич старший преподаватель, базовая кафедра БК-252, Институт искусственного интеллекта; МИРЭА – Российский технологический университет; г. Москва, Российская Федерация. Грачев Александр Сергеевич старший преподаватель, кафедра КБ-1, Институт кибербезопасности и цифровых технологий; МИРЭА – Российский технологический университет; г. Москва, Российская Федерация

Нажимая на кнопку купить вы соглашаетесь с условиями договора оферты

Аннотация:
Представлен метод формирования синтетических данных для обучения систем в условиях двоичных марковских источников данных, основанный на полученных в результате кратномасштабного анализа оценках элементов матриц переходных вероятностей двоичных цепей Маркова, отличающийся от известных учетом диапазонов значений элементов матриц в наблюдаемых объектах. Предложен алгоритм формирования синтетических данных, реализующий вычисление элементов матриц переходных вероятностей в пределах оценок, полученных на реальных данных. Результаты вычислительного эксперимента, организованного для проверки качества машинного обучения с использованием разработанных способа и алгоритма, подтвердили возможность повышения качества систем искусственного инетеллекта.
Образец цитирования:
ОБРАЗЕЦ ЦИТИРОВАНИЯ: Пушкин П.Ю., Конышев М.Ю., Перевезенцев Д.С., Грачев А.С. Формирование синтетических данных в моделях машинного обучения на основе кратномасштабного анализа двоичных марковских моделей // Computational Nanotechnology. 2025. Т. 12. № 5. С. 47-55. DOI: 10.33693/2313-223X-2025-12-5-47-55. EDN: EGDNUN
Список литературы:
Беляева О.В., Перминов А.И., Козлов И.С. Использование синтетических данных для тонкой настройки моделей сегментации документов // Труды Института системного программирования РАН. 2020. Т. 32. № 4. С. 189–202.
Мосалов О.П. Использование генеративно-состязательных сетей в задаче предсказания существования ребер в онтологическом графе // Информационно-технологический вестник. 2020. № 4 (26). С. 96–103.
Лаптев В.В., Данилов В.В. Исследование вариационного автоэнкодера для синтеза новых медицинских данных // Сборник избранных статей научной сессии ТУСУР. 2020. № 1-2. С. 68–70.
Anderson T.W. The statistical analysis of time series. New York, 1971. 704 p.
Конышев М.Ю., Иванов В.А., Тараканов О.В. и др. Двоичные цепи Маркова и их приложения. М.: МИРЭА, 2023. 181 с.
Конышев М.Ю., Баранов В.А., Близнюк В.И. и др. Методы анализа и синтеза двоичных случайных последовательностей. Орёл: Академия Федеральной службы охраны Российской Федерации, 2020. 120 с.
Агамиров Л.В., Агамиров В.Л., Вестяк В.А. Вычисления обратных функций распределений: алгоритмы и программы // Программные продукты и системы. 2024. № 2. С. 137–145.
Ли Ц., Джадж Д., Зельнер А. Оценивание параметров Марковских моделей по агрегированным временным рядам. М.: Статистика, 1977. 221 с.
Глускин В.А., Дементьев А.Н., Гондаренко Е.А. и др. Оценивание параметров источников ошибок в дискретных каналах связи с группированием ошибок // Динамика сложных систем XXI век. 2023. Т. 17. № 4. С. 56–69.
Федер Е. Фракталы / пер. с англ. М.: Мир, 1991. 254 с.
Близнюк В.И., Конышев М.Ю., Иванов В.А., Харченко С.В. Метод направленного перебора рядов распределений в задачах моделирования марковских двоичных последовательностей // Промышленные АСУ и контроллеры. 2015. № 5. С. 40–45.
Баранов В.А., Конышев М.Ю., Привалов А.А., Шестаков А.В. Верификация криптографических алгоритмов на основе использования метода симуляции двоичных случайных последовательностей с заданными статистическими свойствами // Наукоемкие технологии в космических исследованиях Земли. 2019. Т. 11. № 6.
Иванов В.А., Конышев М.Ю., Маркин А.В. Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных // Техника средств связи. 2022. № 1 (157). С. 61–68.
Иванов В.А., Конышев М.Ю., Иванов И.В. Применение акселерации трафика в сетях многоканальной радиосвязи // Технологии информационного общества: сб. трудов XVII Междунар. отраслевой науч.-техн. конф. (Москва, 2–3 марта 2023 г.). М.: Медиа паблишер, 2023. С. 26–28.
Ключевые слова:
машинное обучение, синтетические данные, двоичная марковская цепь, кратномасштабный анализ, оценка параметров, вычислительный эксперимент.