Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей

Лыков Артем Валерьевич

doi:doi:10.26118/2782-4586.2026.94.41.052

Главная / Журналы / JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT / Номер 5 / Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей

Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей

Журнал: JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT № 5 , 2026

Рубрики: НАУЧНЫЕ СТАТЬИ

Лыков Артем Валерьевич ¹

Информация об авторах и публикации

Авторы:

1. Кубанский государственный технологический университет
студент

Тип:

Статья

DOI:

https://doi.org/10.26118/2782-4586.2026.94.41.052

Страницы:

с 211 по 221

Статус:

Опубликован

Получено:

22.05.2026

Одобрено:

30.05.2026

Опубликовано:

30.05.2026

Язык материала:

русский

Ключевые слова:

большие языковые модели, LLM, корпоративная аналитика, RAG, retrieval-augmented generation, fine-tuning, экономическая эффективность, TCO, совокупная стоимость владения, имитационное моделирование, динамика знаний, интенсивность запросов, информационные системы, архитектура ИИ, корпоративные информационные системы

Аннотация и ключевые слова

Аннотация:
Исследована формализованная модель оценки экономической эффективности решений корпоративной аналитики на базе больших языковых моделей, реализованных в архитектурах RAG (Retrieval-Augmented Generation, генерация, дополненная поиском) и Fine-tuning (дообучение модели). Рассмотрена структура затрат, возникающих при эксплуатации указанных архитектур в корпоративных информационных системах, включая стоимость инференса, обновления знаний и периодического переобучения моделей. Разработан имитационный стенд, учитывающий интенсивность пользовательских запросов и динамику обновления базы знаний. На основе моделирования TCO (Total Cost of Ownership, совокупная стоимость владения) проведено сравнение экономических характеристик рассматриваемых архитектур при различных сценариях нагрузки. Полученные результаты позволили определить границы рационального применения каждой архитектуры. Показано, что при низкой интенсивности запросов более экономически эффективным является использование RAG-подхода, тогда как при высокой нагрузке и большом количестве обращений преимущество получает архитектура Fine-tuning за счёт эффекта масштабирования затрат.

Ключевые слова:
большие языковые модели, LLM, корпоративная аналитика, RAG, retrieval-augmented generation, fine-tuning, экономическая эффективность, TCO, совокупная стоимость владения, имитационное моделирование, динамика знаний, интенсивность запросов, информационные системы, архитектура ИИ, корпоративные информационные системы

Текст

Текст (PDF): Читать Скачать

Список литературы

1. Шмат А. В. Применение больших языковых моделей и технологий Retrieval-Augmented Generation для корпоративных ассистентов // Вестник цифровых технологий. — 2024. — № 3. — С. 45–58.

2. Иванов Д. С., Петрова Е. Н. Экономическая оценка внедрения интеллектуальных информационных систем в корпоративной среде // Экономика и управление. — 2023. — № 12. — С. 67–75. DOI: https://doi.org/10.36871/ek.up.p.r.2023.12.13.010

3. Кузнецов М. А. Имитационное моделирование информационных систем предприятия. — М.: Инфра-М, 2022. — 256 с.

4. Сидоров А. П., Белова Н. И. Цифровая трансформация корпоративной аналитики на основе технологий искусственного интеллекта // Управленческие науки. — 2024. — Т. 14, № 2. — С. 89–101.

5. Григорьев В. Л. Экономика информационных технологий. — СПб.: Питер, 2021. — 304 с.

6. Архитектура Retrieval-Augmented Generation: обзор и применение [Электронный ресурс] // Habr. — 2025. — Режим доступа: https://habr.com/ru/articles/931396 (дата обращения: 27.02.2026).

7. RAG vs Fine-tuning: что выбрать бизнесу и разработчикам в 2025 году [Электронный ресурс] // ServerFlow. — 2025. — Режим доступа: https://serverflow.ru/blog/stati/rag-vs-fine-tuning-chto-vybrat-dlya-biznesa-i-razrabotchikov-v-2025-godu (дата обращения: 27.02.2026).

8. RAG или Fine-tuning — как выбрать метод для LLM-задач [Электронный ресурс] // Napoleon IT. — 2025. — Режим доступа: https://napoleonit.ru/blog/rag-ili-fine-tuning-kak-vybrat-pravilnyy-metod-dlya-nastroyki-llm (дата обращения: 27.02.2026).

9. Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint. — 2023. — Режим доступа: https://arxiv.org/abs/2312.10997 (дата обращения: 28.02.2026).

10. Karakurt E., Akbulut A. Retrieval-Augmented Generation (RAG) and Large Language Models (LLMs) for Enterprise Knowledge Management and Document Automation: A Systematic Literature Review // Applied Sciences. — 2026. — Vol. 16, No. 1. — Article 368. DOI: https://doi.org/10.3390/app16010368

11. Shen M., Gupta U., Zhang Y. et al. Towards Understanding Systems Trade-offs in Retrieval-Augmented Generation Model Inference // arXiv preprint. — 2024. — Режим доступа: https://arxiv.org/abs/2412.11854 (дата обращения: 28.02.2026).

12. Devine P. ALoFTRAG: Automatic Local Fine Tuning for Retrieval Augmented Generation // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2501.11929 (дата обращения: 28.02.2026).

13. Bergemann D., Bonatti A., Smolin A. The Economics of Large Language Models: Token Allocation, Fine-Tuning, and Optimal Pricing // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2502.07736 (дата обращения: 28.02.2026).

14. Ren R., Li Q., Zhang T. Adaptive Two-stage Retrieval Augmented Fine-Tuning Method // Expert Systems with Applications. — 2025. — Vol. 244.

15. Robust Fine-Tuning for Retrieval Augmented Generation // Proceedings of the ACM Conference on Information and Knowledge Management. — 2025.

16. RAG vs. Fine-Tuning: Comparative Analysis [Электронный ресурс] // Monte Carlo Data. — 2025. — Режим доступа: https://www.montecarlodata.com/blog-rag-vs-fine-tuning (дата обращения: 01.03.2026).

17. Should You Fine-Tune Your Large Language Models or Let RAG Do the Heavy Lifting [Электронный ресурс] // Centific. — 2025. — Режим доступа: https://www.centific.com/blog/should-you-fine-tune-your-large-language-models-or-let-rag-do-the-heavy-lifting (дата обращения: 01.03.2026).

18. Fine-Tuning vs RAG Trade-offs in Large Language Models for Domain-Specific Tasks // Journal of Medical Internet Research. — 2026.

19. Лыков А.В. Economic Evaluation of RAG and Fine-Tuning Architectures [Электронный ресурс]. — Режим доступа: https:// https:// https://github.com/MrMixaDj32/rag-ft-economic-evaluation (дата обращения: 02.03.2026).

Отправить рукопись Скачать PDF
Текст JATS XML

Цитировать

Цитирований:

Подтверждение

Регистрация