JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT

2782-4586 2949-1851

124096

10.26118/2782-4586.2026.94.41.052

Научные статьи

SCIENTIFIC ARTICLES

Научные статьи

Assessment of the economic efficiency of RAG and Fine‑tuning solutions for corporate analytics based on Large Language Models

Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей

Лыков

Артем Валерьевич

Lykov

Artem Valer'evich

Кубанский государственный технологический университет Kuban State University of Technology

30 05 2026

5 211 221 22 05 2026

https://jomeam.ru/en/nauka/article/124096/view

Исследована формализованная модель оценки экономической эффективности решений корпоративной аналитики на базе больших языковых моделей, реализованных в архитектурах RAG (Retrieval-Augmented Generation, генерация, дополненная поиском) и Fine-tuning (дообучение модели). Рассмотрена структура затрат, возникающих при эксплуатации указанных архитектур в корпоративных информационных системах, включая стоимость инференса, обновления знаний и периодического переобучения моделей. Разработан имитационный стенд, учитывающий интенсивность пользовательских запросов и динамику обновления базы знаний. На основе моделирования TCO (Total Cost of Ownership, совокупная стоимость владения) проведено сравнение экономических характеристик рассматриваемых архитектур при различных сценариях нагрузки. Полученные результаты позволили определить границы рационального применения каждой архитектуры. Показано, что при низкой интенсивности запросов более экономически эффективным является использование RAG-подхода, тогда как при высокой нагрузке и большом количестве обращений преимущество получает архитектура Fine-tuning за счёт эффекта масштабирования затрат.

A formalized model for evaluating the economic efficiency of corporate analytics solutions based on large language models is presented. The study considers systems implemented using RAG (Retrieval-Augmented Generation) and Fine-tuning architectures. The cost structure associated with the deployment of these approaches in corporate information systems is analyzed, including inference costs, knowledge updates, and periodic model retraining. A simulation framework was developed to account for request intensity and the dynamics of knowledge base updates. Based on TCO (Total Cost of Ownership) modeling, the economic characteristics of the considered architectures were compared under different workload scenarios. The results allowed the identification of rational application boundaries for each architecture. It is shown that the RAG approach is more economically efficient under low request intensity, whereas Fine-tuning becomes advantageous at higher workloads due to the scaling effect of operational costs.

большие языковые модели LLM корпоративная аналитика RAG retrieval-augmented generation fine-tuning экономическая эффективность TCO совокупная стоимость владения имитационное моделирование динамика знаний интенсивность запросов информационные системы архитектура ИИ корпоративные информационные системы

large language models LLM corporate analytics RAG retrieval-augmented generation fine-tuning economic efficiency TCO total cost of ownership simulation modeling knowledge dynamics request intensity information systems AI architecture corporate information systems.

Шмат А. В. Применение больших языковых моделей и технологий Retrieval-Augmented Generation для корпоративных ассистентов // Вестник цифровых технологий. — 2024. — № 3. — С. 45–58.

Shmat A. V. Primenenie bol'shih yazykovyh modeley i tehnologiy Retrieval-Augmented Generation dlya korporativnyh assistentov // Vestnik cifrovyh tehnologiy. — 2024. — № 3. — S. 45–58.

Иванов Д. С., Петрова Е. Н. Экономическая оценка внедрения интеллектуальных информационных систем в корпоративной среде // Экономика и управление. — 2023. — № 12. — С. 67–75.

Ivanov D. S., Petrova E. N. Ekonomicheskaya ocenka vnedreniya intellektual'nyh informacionnyh sistem v korporativnoy srede // Ekonomika i upravlenie. — 2023. — № 12. — S. 67–75.

Кузнецов М. А. Имитационное моделирование информационных систем предприятия. — М.: Инфра-М, 2022. — 256 с.

Kuznecov M. A. Imitacionnoe modelirovanie informacionnyh sistem predpriyatiya. — M.: Infra-M, 2022. — 256 s.

Сидоров А. П., Белова Н. И. Цифровая трансформация корпоративной аналитики на основе технологий искусственного интеллекта // Управленческие науки. — 2024. — Т. 14, № 2. — С. 89–101.

Sidorov A. P., Belova N. I. Cifrovaya transformaciya korporativnoy analitiki na osnove tehnologiy iskusstvennogo intellekta // Upravlencheskie nauki. — 2024. — T. 14, № 2. — S. 89–101.

Григорьев В. Л. Экономика информационных технологий. — СПб.: Питер, 2021. — 304 с.

Grigor'ev V. L. Ekonomika informacionnyh tehnologiy. — SPb.: Piter, 2021. — 304 s.

Архитектура Retrieval-Augmented Generation: обзор и применение [Электронный ресурс] // Habr. — 2025. — Режим доступа: https://habr.com/ru/articles/931396 (дата обращения: 27.02.2026).

Arhitektura Retrieval-Augmented Generation: obzor i primenenie [Elektronnyy resurs] // Habr. — 2025. — Rezhim dostupa: https://habr.com/ru/articles/931396 (data obrascheniya: 27.02.2026).

RAG vs Fine-tuning: что выбрать бизнесу и разработчикам в 2025 году [Электронный ресурс] // ServerFlow. — 2025. — Режим доступа: https://serverflow.ru/blog/stati/rag-vs-fine-tuning-chto-vybrat-dlya-biznesa-i-razrabotchikov-v-2025-godu (дата обращения: 27.02.2026).

RAG vs Fine-tuning: chto vybrat' biznesu i razrabotchikam v 2025 godu [Elektronnyy resurs] // ServerFlow. — 2025. — Rezhim dostupa: https://serverflow.ru/blog/stati/rag-vs-fine-tuning-chto-vybrat-dlya-biznesa-i-razrabotchikov-v-2025-godu (data obrascheniya: 27.02.2026).

RAG или Fine-tuning — как выбрать метод для LLM-задач [Электронный ресурс] // Napoleon IT. — 2025. — Режим доступа: https://napoleonit.ru/blog/rag-ili-fine-tuning-kak-vybrat-pravilnyy-metod-dlya-nastroyki-llm (дата обращения: 27.02.2026).

RAG ili Fine-tuning — kak vybrat' metod dlya LLM-zadach [Elektronnyy resurs] // Napoleon IT. — 2025. — Rezhim dostupa: https://napoleonit.ru/blog/rag-ili-fine-tuning-kak-vybrat-pravilnyy-metod-dlya-nastroyki-llm (data obrascheniya: 27.02.2026).

Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint. — 2023. — Режим доступа: https://arxiv.org/abs/2312.10997 (дата обращения: 28.02.2026).

Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint. — 2023. — Rezhim dostupa: https://arxiv.org/abs/2312.10997 (data obrascheniya: 28.02.2026).

10.

Karakurt E., Akbulut A. Retrieval-Augmented Generation (RAG) and Large Language Models (LLMs) for Enterprise Knowledge Management and Document Automation: A Systematic Literature Review // Applied Sciences. — 2026. — Vol. 16, No. 1. — Article 368.

11.

Shen M., Gupta U., Zhang Y. et al. Towards Understanding Systems Trade-offs in Retrieval-Augmented Generation Model Inference // arXiv preprint. — 2024. — Режим доступа: https://arxiv.org/abs/2412.11854 (дата обращения: 28.02.2026).

Shen M., Gupta U., Zhang Y. et al. Towards Understanding Systems Trade-offs in Retrieval-Augmented Generation Model Inference // arXiv preprint. — 2024. — Rezhim dostupa: https://arxiv.org/abs/2412.11854 (data obrascheniya: 28.02.2026).

12.

Devine P. ALoFTRAG: Automatic Local Fine Tuning for Retrieval Augmented Generation // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2501.11929 (дата обращения: 28.02.2026).

Devine P. ALoFTRAG: Automatic Local Fine Tuning for Retrieval Augmented Generation // arXiv preprint. — 2025. — Rezhim dostupa: https://arxiv.org/abs/2501.11929 (data obrascheniya: 28.02.2026).

13.

Bergemann D., Bonatti A., Smolin A. The Economics of Large Language Models: Token Allocation, Fine-Tuning, and Optimal Pricing // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2502.07736 (дата обращения: 28.02.2026).

Bergemann D., Bonatti A., Smolin A. The Economics of Large Language Models: Token Allocation, Fine-Tuning, and Optimal Pricing // arXiv preprint. — 2025. — Rezhim dostupa: https://arxiv.org/abs/2502.07736 (data obrascheniya: 28.02.2026).

14.

Ren R., Li Q., Zhang T. Adaptive Two-stage Retrieval Augmented Fine-Tuning Method // Expert Systems with Applications. — 2025. — Vol. 244.

15.

Robust Fine-Tuning for Retrieval Augmented Generation // Proceedings of the ACM Conference on Information and Knowledge Management. — 2025.

16.

RAG vs. Fine-Tuning: Comparative Analysis [Электронный ресурс] // Monte Carlo Data. — 2025. — Режим доступа: https://www.montecarlodata.com/blog-rag-vs-fine-tuning (дата обращения: 01.03.2026).

RAG vs. Fine-Tuning: Comparative Analysis [Elektronnyy resurs] // Monte Carlo Data. — 2025. — Rezhim dostupa: https://www.montecarlodata.com/blog-rag-vs-fine-tuning (data obrascheniya: 01.03.2026).

17.

Should You Fine-Tune Your Large Language Models or Let RAG Do the Heavy Lifting [Электронный ресурс] // Centific. — 2025. — Режим доступа: https://www.centific.com/blog/should-you-fine-tune-your-large-language-models-or-let-rag-do-the-heavy-lifting (дата обращения: 01.03.2026).

Should You Fine-Tune Your Large Language Models or Let RAG Do the Heavy Lifting [Elektronnyy resurs] // Centific. — 2025. — Rezhim dostupa: https://www.centific.com/blog/should-you-fine-tune-your-large-language-models-or-let-rag-do-the-heavy-lifting (data obrascheniya: 01.03.2026).

18.

Fine-Tuning vs RAG Trade-offs in Large Language Models for Domain-Specific Tasks // Journal of Medical Internet Research. — 2026.

19.

Лыков А.В. Economic Evaluation of RAG and Fine-Tuning Architectures [Электронный ресурс]. — Режим доступа: https:// https:// https://github.com/MrMixaDj32/rag-ft-economic-evaluation (дата обращения: 02.03.2026).

Lykov A.V. Economic Evaluation of RAG and Fine-Tuning Architectures [Elektronnyy resurs]. — Rezhim dostupa: https:// https:// https://github.com/MrMixaDj32/rag-ft-economic-evaluation (data obrascheniya: 02.03.2026).