<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>JOURNAL OF MONETARY ECONOMICS AND MANAGEMENT</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">2782-4586</issn>
   <issn publication-format="online">2949-1851</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">124096</article-id>
   <article-id pub-id-type="doi">10.26118/2782-4586.2026.94.41.052</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Научные статьи</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>SCIENTIFIC ARTICLES</subject>
    </subj-group>
    <subj-group>
     <subject>Научные статьи</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Assessment of the economic efficiency of RAG and Fine‑tuning solutions for corporate analytics based on Large Language Models</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Оценка экономической эффективности решений на основе RAG и Fine‑tuning для корпоративной аналитики на базе больших языковых моделей</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лыков</surname>
       <given-names>Артем Валерьевич</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lykov</surname>
       <given-names>Artem Valer'evich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Кубанский государственный технологический университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Kuban State University of Technology</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2026-05-30T19:23:36+03:00">
    <day>30</day>
    <month>05</month>
    <year>2026</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2026-05-30T19:23:36+03:00">
    <day>30</day>
    <month>05</month>
    <year>2026</year>
   </pub-date>
   <issue>5</issue>
   <fpage>211</fpage>
   <lpage>221</lpage>
   <history>
    <date date-type="received" iso-8601-date="2026-05-22T00:00:00+03:00">
     <day>22</day>
     <month>05</month>
     <year>2026</year>
    </date>
   </history>
   <self-uri xlink:href="https://jomeam.ru/en/nauka/article/124096/view">https://jomeam.ru/en/nauka/article/124096/view</self-uri>
   <abstract xml:lang="ru">
    <p>Исследована формализованная модель оценки экономической эффективности решений корпоративной аналитики на базе больших языковых моделей, реализованных в архитектурах RAG (Retrieval-Augmented Generation, генерация, дополненная поиском) и Fine-tuning (дообучение модели). Рассмотрена структура затрат, возникающих при эксплуатации указанных архитектур в корпоративных информационных системах, включая стоимость инференса, обновления знаний и периодического переобучения моделей. Разработан имитационный стенд, учитывающий интенсивность пользовательских запросов и динамику обновления базы знаний. На основе моделирования TCO (Total Cost of Ownership, совокупная стоимость владения) проведено сравнение экономических характеристик рассматриваемых архитектур при различных сценариях нагрузки. Полученные результаты позволили определить границы рационального применения каждой архитектуры. Показано, что при низкой интенсивности запросов более экономически эффективным является использование RAG-подхода, тогда как при высокой нагрузке и большом количестве обращений преимущество получает архитектура Fine-tuning за счёт эффекта масштабирования затрат.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>A formalized model for evaluating the economic efficiency of corporate analytics solutions based on large language models is presented. The study considers systems implemented using RAG (Retrieval-Augmented Generation) and Fine-tuning architectures. The cost structure associated with the deployment of these approaches in corporate information systems is analyzed, including inference costs, knowledge updates, and periodic model retraining. A simulation framework was developed to account for request intensity and the dynamics of knowledge base updates. Based on TCO (Total Cost of Ownership) modeling, the economic characteristics of the considered architectures were compared under different workload scenarios. The results allowed the identification of rational application boundaries for each architecture. It is shown that the RAG approach is more economically efficient under low request intensity, whereas Fine-tuning becomes advantageous at higher workloads due to the scaling effect of operational costs.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>большие языковые модели</kwd>
    <kwd>LLM</kwd>
    <kwd>корпоративная аналитика</kwd>
    <kwd>RAG</kwd>
    <kwd>retrieval-augmented generation</kwd>
    <kwd>fine-tuning</kwd>
    <kwd>экономическая эффективность</kwd>
    <kwd>TCO</kwd>
    <kwd>совокупная стоимость владения</kwd>
    <kwd>имитационное моделирование</kwd>
    <kwd>динамика знаний</kwd>
    <kwd>интенсивность запросов</kwd>
    <kwd>информационные системы</kwd>
    <kwd>архитектура ИИ</kwd>
    <kwd>корпоративные информационные системы</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>large language models</kwd>
    <kwd>LLM</kwd>
    <kwd>corporate analytics</kwd>
    <kwd>RAG</kwd>
    <kwd>retrieval-augmented generation</kwd>
    <kwd>fine-tuning</kwd>
    <kwd>economic efficiency</kwd>
    <kwd>TCO</kwd>
    <kwd>total cost of ownership</kwd>
    <kwd>simulation modeling</kwd>
    <kwd>knowledge dynamics</kwd>
    <kwd>request intensity</kwd>
    <kwd>information systems</kwd>
    <kwd>AI architecture</kwd>
    <kwd>corporate information systems.</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Шмат А. В. Применение больших языковых моделей и технологий Retrieval-Augmented Generation для корпоративных ассистентов // Вестник цифровых технологий. — 2024. — № 3. — С. 45–58.</mixed-citation>
     <mixed-citation xml:lang="en">Shmat A. V. Primenenie bol'shih yazykovyh modeley i tehnologiy Retrieval-Augmented Generation dlya korporativnyh assistentov // Vestnik cifrovyh tehnologiy. — 2024. — № 3. — S. 45–58.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Иванов Д. С., Петрова Е. Н. Экономическая оценка внедрения интеллектуальных информационных систем в корпоративной среде // Экономика и управление. — 2023. — № 12. — С. 67–75.</mixed-citation>
     <mixed-citation xml:lang="en">Ivanov D. S., Petrova E. N. Ekonomicheskaya ocenka vnedreniya intellektual'nyh informacionnyh sistem v korporativnoy srede // Ekonomika i upravlenie. — 2023. — № 12. — S. 67–75.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Кузнецов М. А. Имитационное моделирование информационных систем предприятия. — М.: Инфра-М, 2022. — 256 с.</mixed-citation>
     <mixed-citation xml:lang="en">Kuznecov M. A. Imitacionnoe modelirovanie informacionnyh sistem predpriyatiya. — M.: Infra-M, 2022. — 256 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Сидоров А. П., Белова Н. И. Цифровая трансформация корпоративной аналитики на основе технологий искусственного интеллекта // Управленческие науки. — 2024. — Т. 14, № 2. — С. 89–101.</mixed-citation>
     <mixed-citation xml:lang="en">Sidorov A. P., Belova N. I. Cifrovaya transformaciya korporativnoy analitiki na osnove tehnologiy iskusstvennogo intellekta // Upravlencheskie nauki. — 2024. — T. 14, № 2. — S. 89–101.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Григорьев В. Л. Экономика информационных технологий. — СПб.: Питер, 2021. — 304 с.</mixed-citation>
     <mixed-citation xml:lang="en">Grigor'ev V. L. Ekonomika informacionnyh tehnologiy. — SPb.: Piter, 2021. — 304 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Архитектура Retrieval-Augmented Generation: обзор и применение [Электронный ресурс] // Habr. — 2025. — Режим доступа: https://habr.com/ru/articles/931396 (дата обращения: 27.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Arhitektura Retrieval-Augmented Generation: obzor i primenenie [Elektronnyy resurs] // Habr. — 2025. — Rezhim dostupa: https://habr.com/ru/articles/931396 (data obrascheniya: 27.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">RAG vs Fine-tuning: что выбрать бизнесу и разработчикам в 2025 году [Электронный ресурс] // ServerFlow. — 2025. — Режим доступа: https://serverflow.ru/blog/stati/rag-vs-fine-tuning-chto-vybrat-dlya-biznesa-i-razrabotchikov-v-2025-godu (дата обращения: 27.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">RAG vs Fine-tuning: chto vybrat' biznesu i razrabotchikam v 2025 godu [Elektronnyy resurs] // ServerFlow. — 2025. — Rezhim dostupa: https://serverflow.ru/blog/stati/rag-vs-fine-tuning-chto-vybrat-dlya-biznesa-i-razrabotchikov-v-2025-godu (data obrascheniya: 27.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">RAG или Fine-tuning — как выбрать метод для LLM-задач [Электронный ресурс] // Napoleon IT. — 2025. — Режим доступа: https://napoleonit.ru/blog/rag-ili-fine-tuning-kak-vybrat-pravilnyy-metod-dlya-nastroyki-llm (дата обращения: 27.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">RAG ili Fine-tuning — kak vybrat' metod dlya LLM-zadach [Elektronnyy resurs] // Napoleon IT. — 2025. — Rezhim dostupa: https://napoleonit.ru/blog/rag-ili-fine-tuning-kak-vybrat-pravilnyy-metod-dlya-nastroyki-llm (data obrascheniya: 27.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint. — 2023. — Режим доступа: https://arxiv.org/abs/2312.10997 (дата обращения: 28.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint. — 2023. — Rezhim dostupa: https://arxiv.org/abs/2312.10997 (data obrascheniya: 28.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Karakurt E., Akbulut A. Retrieval-Augmented Generation (RAG) and Large Language Models (LLMs) for Enterprise Knowledge Management and Document Automation: A Systematic Literature Review // Applied Sciences. — 2026. — Vol. 16, No. 1. — Article 368.</mixed-citation>
     <mixed-citation xml:lang="en">Karakurt E., Akbulut A. Retrieval-Augmented Generation (RAG) and Large Language Models (LLMs) for Enterprise Knowledge Management and Document Automation: A Systematic Literature Review // Applied Sciences. — 2026. — Vol. 16, No. 1. — Article 368.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Shen M., Gupta U., Zhang Y. et al. Towards Understanding Systems Trade-offs in Retrieval-Augmented Generation Model Inference // arXiv preprint. — 2024. — Режим доступа: https://arxiv.org/abs/2412.11854 (дата обращения: 28.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Shen M., Gupta U., Zhang Y. et al. Towards Understanding Systems Trade-offs in Retrieval-Augmented Generation Model Inference // arXiv preprint. — 2024. — Rezhim dostupa: https://arxiv.org/abs/2412.11854 (data obrascheniya: 28.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B12">
    <label>12.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Devine P. ALoFTRAG: Automatic Local Fine Tuning for Retrieval Augmented Generation // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2501.11929 (дата обращения: 28.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Devine P. ALoFTRAG: Automatic Local Fine Tuning for Retrieval Augmented Generation // arXiv preprint. — 2025. — Rezhim dostupa: https://arxiv.org/abs/2501.11929 (data obrascheniya: 28.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B13">
    <label>13.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Bergemann D., Bonatti A., Smolin A. The Economics of Large Language Models: Token Allocation, Fine-Tuning, and Optimal Pricing // arXiv preprint. — 2025. — Режим доступа: https://arxiv.org/abs/2502.07736 (дата обращения: 28.02.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Bergemann D., Bonatti A., Smolin A. The Economics of Large Language Models: Token Allocation, Fine-Tuning, and Optimal Pricing // arXiv preprint. — 2025. — Rezhim dostupa: https://arxiv.org/abs/2502.07736 (data obrascheniya: 28.02.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B14">
    <label>14.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Ren R., Li Q., Zhang T. Adaptive Two-stage Retrieval Augmented Fine-Tuning Method // Expert Systems with Applications. — 2025. — Vol. 244.</mixed-citation>
     <mixed-citation xml:lang="en">Ren R., Li Q., Zhang T. Adaptive Two-stage Retrieval Augmented Fine-Tuning Method // Expert Systems with Applications. — 2025. — Vol. 244.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B15">
    <label>15.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Robust Fine-Tuning for Retrieval Augmented Generation // Proceedings of the ACM Conference on Information and Knowledge Management. — 2025.</mixed-citation>
     <mixed-citation xml:lang="en">Robust Fine-Tuning for Retrieval Augmented Generation // Proceedings of the ACM Conference on Information and Knowledge Management. — 2025.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B16">
    <label>16.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">RAG vs. Fine-Tuning: Comparative Analysis [Электронный ресурс] // Monte Carlo Data. — 2025. — Режим доступа: https://www.montecarlodata.com/blog-rag-vs-fine-tuning (дата обращения: 01.03.2026).</mixed-citation>
     <mixed-citation xml:lang="en">RAG vs. Fine-Tuning: Comparative Analysis [Elektronnyy resurs] // Monte Carlo Data. — 2025. — Rezhim dostupa: https://www.montecarlodata.com/blog-rag-vs-fine-tuning (data obrascheniya: 01.03.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B17">
    <label>17.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Should You Fine-Tune Your Large Language Models or Let RAG Do the Heavy Lifting [Электронный ресурс] // Centific. — 2025. — Режим доступа: https://www.centific.com/blog/should-you-fine-tune-your-large-language-models-or-let-rag-do-the-heavy-lifting (дата обращения: 01.03.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Should You Fine-Tune Your Large Language Models or Let RAG Do the Heavy Lifting [Elektronnyy resurs] // Centific. — 2025. — Rezhim dostupa: https://www.centific.com/blog/should-you-fine-tune-your-large-language-models-or-let-rag-do-the-heavy-lifting (data obrascheniya: 01.03.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B18">
    <label>18.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Fine-Tuning vs RAG Trade-offs in Large Language Models for Domain-Specific Tasks // Journal of Medical Internet Research. — 2026.</mixed-citation>
     <mixed-citation xml:lang="en">Fine-Tuning vs RAG Trade-offs in Large Language Models for Domain-Specific Tasks // Journal of Medical Internet Research. — 2026.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B19">
    <label>19.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Лыков А.В. Economic Evaluation of RAG and Fine-Tuning Architectures [Электронный ресурс]. — Режим доступа: https:// https:// https://github.com/MrMixaDj32/rag-ft-economic-evaluation (дата обращения: 02.03.2026).</mixed-citation>
     <mixed-citation xml:lang="en">Lykov A.V. Economic Evaluation of RAG and Fine-Tuning Architectures [Elektronnyy resurs]. — Rezhim dostupa: https:// https:// https://github.com/MrMixaDj32/rag-ft-economic-evaluation (data obrascheniya: 02.03.2026).</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
