студент
сотрудник
УДК 336.2 Налоги. Платежи. Отчисления. Сборы
Рассматривается применение архитектуры RAG (Retrieval-Augmented Generation, генерация, дополненная поиском) для задач корпоративного финансового анализа. Предлагается прототип системы, объединяющей механизм поиска по документам и генеративную модель обработки естественного языка. В качестве источников используется демонстрационный корпус финансовых документов, включающий годовые отчёты компаний, регуляторные материалы и отраслевые ориентиры. Реализован гибридный механизм поиска, сочетающий поиск по ключевым словам и векторное представление текста с доменной приоритизацией документов по компании и отчётному периоду. Описана архитектура прототипа, включающая этапы индексации документов, извлечения релевантных фрагментов и генерации аналитического ответа на основе найденного контекста. Показано, что использование поискового компонента повышает интерпретируемость результатов и обеспечивает согласованность аналитических выводов с источниками данных. Ограничения прототипа связаны с демонстрационным объёмом корпуса документов и применением эвристической процедуры проверки фактологической опоры ответа.
искусственный интеллект, большие языковые модели, Retrieval-Augmented Generation, генерация, дополненная поиском, корпоративные финансы, финансовый анализ, анализ отчётности, кредитный риск, долговая нагрузка, рентабельность капитала, интерпретируемость моделей, гибридный поиск, векторное представление текста, информационный поиск
1. Генерация, дополненная поиском (Retrieval-Augmented Generation) // Википедия: свободная энциклопедия. — Режим доступа: https://ru.wikipedia.org/wiki/Генерация,_дополненная_поиском?ysclid=mlwjqeon6i847408939 (дата обращения: 13.02.2026).
2. Положение Банка России от 28.06.2017 № 590-П «О порядке формирования кредитными организациями резервов на возможные потери по ссудам…» // КонсультантПлюс. — Режим доступа: https://www.consultant.ru/document/cons_doc_LAW_220089/ (дата обращения: 13.02.2026).
3. Положение Банка России от 28 июня 2017 г. № 590-П «О порядке формирования кредитными организациями резервов на возможные потери по ссудам…» // Официальный сайт Банка России. — Режим доступа: https://www.cbr.ru/explan/590-p/ (дата обращения: 13.02.2026).
4. МСФО 9 «Финансовые инструменты» // Википедия: свободная энциклопедия. — Режим доступа: https://ru.wikipedia.org/wiki/IFRS_9 (дата обращения: 13.02.2026).
5. Рахаев В. А. Развитие методов оценки кредитного риска для формирования резервов на возможные потери по ссудам // Финансовый журнал. — 2020. — № 24. — С. 82–91. — DOI:https://doi.org/10.26794/2587-5671-2020-24-6-82-91. EDN: https://elibrary.ru/JHVTBS
6. Митичкин О. С. Основные принципы оценки кредитного риска в соответствии со стандартом МСФО 9 // Электронный научный журнал «Дневник науки». — 2019. — С.
7. Подходы к построению EAD-моделей на длинных временных горизонтах // Финансовый журнал•Financial Journal•№ 4•2021. — С. 91–109. — DOI:https://doi.org/10.31107/2075-1990-2021-4-91-109. EDN: https://elibrary.ru/GUEBGY
8. Lewis P., Perez E., Piktus A., Petroni F., Karpukhin V., et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks / NeurIPS 2020 Proceedings. — 2020. — URL: https://arxiv.org/abs/2005.11401 (дата обращения: 14.02.2026). EDN: https://elibrary.ru/JPMMQE
9. Gao Y., Xiong Y., Gao X., Jia K., Pan J., Bi Y. Retrieval-Augmented Generation for Large Language Models: A Survey / arXiv preprint. — 2023. — URL: https://arxiv.org/abs/2312.10997 (дата обращения: 14.02.2026).
10. Huang L. A Survey on Hallucination in Large Language Models / arXiv preprint. — 2023. — URL: https://arxiv.org/abs/2311.05232 (дата обращения: 14.02.2026).
11. Alansari A., Luqman H. A Comprehensive Survey of Hallucination in Large Language Models: Causes, Detection, and Mitigation / arXiv preprint. — 2025. — URL: https://arxiv.org/abs/2510.06265 (дата обращения: 14.02.2026).
12. Karakurt E., Akbulut A. Retrieval Augmented Generation (RAG) and Large Language Models for Enterprise Knowledge Management and Document Automation / Applied Sciences (MDPI). — 2025. — URL: https://www.mdpi.com/2076-3417/16/1/368 (дата обращения: 14.02.2026). DOI: https://doi.org/10.3390/app16010368
13. Farquhar S., et al. Detecting Hallucinations in Large Language Models Using Entropy-Based Methods / Nature. — 2024. — URL: https://www.nature.com/articles/s41586-024-07421-0 (дата обращения: 15.02.2026).
14. Arslan M. A Survey on Retrieval-Augmented Generation and Its Applications / Procedia Computer Science. — 2024. — URL: https://www.sciencedirect.com/science/article/pii/S1877050924021860 (дата обращения: 15.02.2026).
15. Лыков А.В. Corporate RAG System Prototype [Электронный ресурс]. — Режим доступа: https://github.com/MrMixaDj32/corporate-rag-finance (дата обращения: 15.02.2026).



