Смекни!
smekni.com

Совершенствование развития кредитной политики коммерческого банка (стр. 16 из 22)

Такой подход будет способствовать существенному ограничению степени влияния кредитного риска на банковскую систему страны, и, следовательно, способствовать укреплению ее стабильности и эффективности.

3.2 Использование технологии интеллектуального анализа данных, как способ снижения кредитного риска

Для уменьшения риска при операциях кредитования физических лиц рассмотрим метод, основанный на применении технологии интеллектуального анализа данных (Data Mining). Можно привести давно всем известную цепочку связанных событий: чем меньше рискует банк при предоставлении кредита, тем меньше процентная ставка, предлагаемая этим банком; чем меньше процентная ставка, тем больше клиентов обратиться в именно этот банк; чем больше клиентов обратиться в банк, тем большую прибыль получит банк, а это одна из основных целей коммерческой деятельности. Риск, связанный с невозвратом суммы основного долга и процентов можно значительно снизить, оценивая вероятность возврата заемщиком кредита. В последнее время для оценки риска кредитования заемщика в мировой практике широкое распространение получил скоринг. В России ему также уделяют должное внимание. Сущность этого метода состоит в том, что каждый фактор, характеризующий заемщика, имеет свою количественную оценку. Суммируя полученные баллы, можно получить оценку кредитоспособности физического лица. Каждый параметр имеет максимально возможный порог, который выше для важных вопросов и ниже для второстепенных.

На сегодняшний день известно достаточно много методик кредитного скоринга. Одной из самых известных является модель Дюрана. Дюран определил группы факторов, позволяющих максимально определить степень кредитного риска. Но эта модель как любая другая не идеальна и имеет ряд недостатков. Основным недостатком скоринговой системы оценки кредитоспособности физических лиц является то, что она очень плохо адаптируема, а используемая для оценки кредитоспособности система, должна отвечать настоящему положению дел. Например, в США считается плюсом, если человек поменял много мест работы, что говорило о том, что он востребован. В других станах наоборот – данное обстоятельство говорило о том, что человек либо не может ужиться с коллективом, либо это малоценный специалист, а соответственно повышается вероятность просрочки в платежах. Таким образом адаптировать модель просто крайне необходимо, как для разных периодов времени, так и для разных стран и даже для разных регионов страны. Для адаптации скоринговой модели оценки кредитоспособности физических лиц специалисту необходимо проделывать путь, подобный тому, что проделал Дюран. То есть специалисты, которые будут заниматься такой адаптацией должны быть высоко квалифицированными, а значит и очень высокооплачиваемые. Это должны такие люди, которые в состоянии оценить текущую ситуацию на рынке. Результатом такого рода проделанной работы будет набор факторов с весовыми коэффициентами плюс некий порог (значение), преодолев который, человек, обратившийся за кредитом, считается способным погасить испрашиваемую ссуду плюс проценты. Полученные результаты являются по большей части субъективным мнением и, как правило, плохо подкрепленные статистикой (статистически необоснованные). Как следствие всего этого, полученная модель не в полной мере отвечает текущей действительности. Одним из вариантов решения работы является применение алгоритмов, решающих задачи классификации. Задача классификации – это задача отнесения какого-либо объекта (потенциальный заемщик) к одному из заранее известных классов (Давать/Не давать кредит). Такого рода задачи с большим успехом решаются одним из методов Data Mining – при помощи деревьев решений.

Прежде чем приступить к описанию решения необходимо осветить некоторые аспекты методики анализа с использованием механизмов Data Mining. Краеугольным камнем методики является качество исходных данных. От него напрямую зависит качество построенной модели. Чтобы обеспечить его, необходимо придерживаться следующего алгоритма:

1) Выдвижение гипотезы – предположение о влиянии тех или иных факторов на исследуемую задачу. Данную задачу решают эксперты, полагаясь на свой опыт и знания. Результатом на данном этапе является список всех факторов.

2) Сбор и систематизация данных – представление данных в формализованном виде, подготовка данных в определенном виде (например, соблюдение упорядоченности по времени).

3) Подбор модели и тестирование – комбинирование различных механизмов анализа, оценка экспертами адекватности полученной модели. Возврат на предыдущие шаги при невозможности получения приемлемых результатов (например, проверка очередной гипотезы).

4) Использование приемлемой модели и ее совершенствование.

5) Именно с помощью такого подхода составлены анкеты – заявки на получение кредита. Экспертами в данной области были выявлены факторы, наиболее влияющие на результат. Эту информацию и заполняют в анкетах потенциальные заемщики. Помощь в проверке гипотез может оказать реализованный в Deductor факторный анализ. Данный инструмент выявляет значимость тех или иных факторов. [40, URL: http://www.basegroup.ru/library/practice/solvency/]

Итак, задача заключается в построении модели оценки (классификации) потенциальных заемщиков. Решение задачи также должно обладать большой достоверностью классификации, возможностью адаптации к любым условиям, простотой использования модели.

Пользуясь приведенной методикой, была предложена гипотеза о том, какие факторы влияют на кредитоспособность человека. По мнению экспертов, по этим факторам можно учесть суммарный риск. Тем самым должно достигаться и отнесение потенциального заемщика к способным вернуть кредит или не способным.

Дерево решений (рисунок 3.2) – один из методов автоматического анализа данных. Получаемая модель – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Рисунок 3.2 - Дерево решений

Сущность этого метода заключается в следующем:

1) На основе данных, за прошлые периоды строится дерево. При этом класс каждой из ситуаций, на основе которых строится дерево, заранее известен. В нашем случае должно быть известно, была ли возвращена основная сумма долга и проценты, и не было ли просрочек в платежах. При построении дерева все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам, которые в свою очередь также могут быть разбиты на дочерние узлы. Критерий разбиения – это различные значения какого-либо входного фактора. Для определения поля, по которому будет происходить разбиение, используется показатель, называемый энтропия – мера неопределенности. Выбирается то поле, при разбиении по которому устраняется больше неопределенности. Неопределенность тем выше, чем больше примесей (объектов, относящихся к различным классам) находятся в одном узле. Энтропия равна нулю, если в узле будут находиться объекты, относящиеся к одному классу. [40, URL: http://www.basegroup.ru/library/practice/solvency/]

2) Полученную модель используют при определении класса (Давать/ Не давать кредит) вновь возникших ситуаций (поступила заявка на получение кредита).

3) При существенном изменении текущей ситуации на рынке, дерево можно перестроить, т.е. адаптировать к существующей обстановке.

Для демонстрации подобной технологии будет использоваться программа Tree Analyzer из пакета Deductor ver.3. В качестве исходных данных была взята выборка, состоящая из 1000 записей, где каждая запись – это описание характеристик заемщика плюс параметр, описывающий его поведение во время погашения ссуды. При обучении дерева использовались следующие факторы, определяющие заемщика: "N Паспорта"; "ФИО"; "Адрес"; "Размер ссуды"; "Срок ссуды"; "Цель ссуды"; "Среднемесячный доход"; "Среднемесячный расход"; "Основное направление расходов"; "Наличие недвижимости"; "Наличие автотранспорта"; "Наличие банковского счета"; "Наличие страховки"; "Название организации"; "Отраслевая принадлежность предприятия"; "Срок работы на данном предприятии"; "Направление деятельности заемщика"; "Срок работы на данном направлении"; "Пол"; "Семейное положение"; "Количество лет"; "Количество иждивенцев"; "Срок проживания в данной местности"; "Обеспеченность займа"; "Давать кредит". При этом поля: "N Паспорта", "ФИО", "Адрес", "Название организации" алгоритм уже до начала построения дерева решений определил как непригодные (рисунок 3.3) по причине практической уникальности каждого из значений.

Целевым полем является поле "Давать кредит", принимающий значения "Да"(True) и "Нет"(False). Эти значения можно интерпретировать следующим образом: "Нет" – плательщик либо сильно просрочил с платежами, либо не вернул часть денег, "Да" – противоположность "Нет". Факторы для построения дерева были собраны и консолидированы в хранилище данных Deductor Warehouse.

Рисунок 3.3 - Настройка определяющих и целевых факторов

Методология хранилища такова, что информация хранится в процессах, каждый процесс имеет определенный набор измерений и фактов. Т.е. процесс реализован по стандартной схеме "Звезда", в центре которой хранятся факты, а измерения являются лучами. В данном случае процесс отображает выдачу кредита заемщику. Наиболее ценной информацией процесса является статус кредита. Хороший кредит – тот, который заемщик вернул в срок и в полном объеме, плохой – обратная ситуация.