Этапы построения скоринговой карты пример. Разработка скоринговых карт как инструмента оценки уровня риска

Вы не применяете скоринговые карты в рекрутинге? Это плохо!
После моего семинара Аналитика для HR один из участников (из кредитной организации) подошел к риск – менеджеру компании, и они (HR и риск – менеджер) заговорили на одном языке.

Что такое скоринговые карты

Скоринговые карты придут в HR из риск-менеджмента. В риск –менеджменте
Скоринговые карты - Набор характеристик (возраст, доход, профессия, стаж работы, наличие имущества и т.д.) заемщика и соответствующих весовых коэффициентов, выраженных в баллах. Соискатель кредита сообщает о себе необходимые сведения и ему начисляется определенное количество баллов. В зависимости от числа набранных скоринг-баллов рассчитывается максимальная сумма кредита, которую банк готов был предоставить заемщику.
Вот на днях взял книгу издательства Манн, Иванов и Фербер Скоринговые карты для оценки кредитных рисков

Пример

Все мы получали кредит (или почти все). И помним, что размер выплат, первоначального взноса и сама возможность выдачи кредита зависит от нескольких параметров:
  • Возраст
  • Доход
  • Доход со-заемщика
  • Количество членов семьи (ну или типа такого).
  • Наличие кредитов в других банках
  • И т.п…
Каждый из этих параметров переводится в стандартные балы: например,
  • Возраст 35-40 лет – 94 бала
  • Доход 1 500 – 2000 долларов – 75 балов
  • И т.п..
Зная эти параметры, мы можем выйти на планку выдачи кредита, просто слагая балы.

Как это можно использовать в HR

Как принимается в компании решение о приеме на работу?

  • Чаще на глазок.
  • Иногда есть профиль требований к должности
  • Иногда модель компетенций…
У нас есть набор требований к кандидату:
  • Возраст
  • Образование
  • Опыт работы
  • Компетенции
Решение легко принять, если все параметры подходят. А если нет? Что важнее: опыт, компетенции или образование?
И вообще: важно ли образование? И кто в компании принимает решение: важно образование для данной должности или нет? Непосредственный руководитель? А если посмотреть бекгрануд данного руководителя и увидеть, что у него самая высокая текучесть, можно после этого дать ему полную свободу в выборе? Ну и т.п..

Скоринговые карты в HR

В идее скоринговых карт для HR зашито две (на мой взгляд) здравые идеи:
  1. Определение веса каждого параметра кандидата
  2. Объективация оценки факторов
Этому есть правда много преград:
  • Нелюбовь рекрутеров к excel;
  • Отсутствие общей информационной культуры;
  • Отсутствие соответствующей информационной инфраструктуры в виде программного обеспечения;
  • Недостаточная квалификация аналитиков;
  • Сопротивление менеджмента.
Но все преграды перевешивает

Светлое будущее

В результате рекрутер может по таблицам определять общий сводный бал кандидата и принимать решение о приеме / не приеме и прогнозировать успешность / неуспешность кандидата в работе.
Представляете картину, когда кандидат приходит на получасовую беседу с рекрутером, а последний как тот же кредитный менеджер оценивает вас через призму анкеты.
В итоге компания выиграет на оптимизации рекрутинга, что мелочи в сравнении с тем, что компания выиграет на оптимизации работы с персоналом, повысив эффективность, выбирая только лучших, снизив текучесть персонала.

Почему это утопия?

Куда денутся все тренинги по подбору персонала? Возьмите нормального рекрутера и проведите эксперимент. Предложите на выбор изучить практику скоринговых карт или пойти на тренинг по подбору персонала к ….
Потом еще 100 рекрутеров возьмите и спросите их про тоже самое…
Потом вы придете к знакомому HR-директору, который скажет: это все замечательно, но у меня вчера один отдел всем составом заявление об увольнении написал, а ты ко мне со своими планами пристаешь.
И пойдете вы к знакомому риск менеджеру чай пить…
Если все -таки вы хотите начать нелегкий путь к использованию скоринговых карт в рекрутинге для оценки кандидата при приеме на работу, то начните со сбора информации. ну хотя бы как здесь

Сегодня это действительно слишком просто: вы можете подойти к компьютеру и практически без знания того, что вы делаете, создавать разумное и бессмыслицу с поистине изумительной быстротой. (Дж. Бокс)

Cкоринг-карты

Начальный анализ характеристик определяет набор тех из них, которые должны быть учтены в итоговой модели и преобразует их в группированный формат переменных. На стадии составления предварительной скоринг-карты различные методики прогнозирования могут использоваться для нахождения такого набора характеристик, который способствует обеспечению наибольшей точности прогноза.

Применяются методы логистической регрессии, а также деревья решений и нейронные сети. Вообще говоря, итоговые скоринг-карты, создаваемые на этой стадии, должны состоять из 8-20 характеристик. Такое количество значений берется для обеспечения устойчивости карты даже при изменении одной или нескольких характеристик. Скоринг-карты с очень маленьким набором характеристик как правило, не выдерживают испытаний, так как они неустойчивы при малейших изменениях в выбранном профиле (наборе характеристик).

Вне зависимости от используемой методики моделирования, результатом работы должна явиться готовая скоринг-карта, состоящая из оптимальной комбинации характеристик, принятых во внимание, например, могут учитываться:

  • корреляция между характеристиками;
  • статистическая сила скоринг-карты;
  • интерпретируемость выбранных характеристик в конкретной отрасли/отделе;
  • используемые средства моделирования;
  • понятность методологии, соответствие предъявляемым требованиям.

Понятие профиля риска

Скоринг-карты могут разрабатываться и использоваться для различных целей: максимизации качества статистических показателей, эффективности (с использованием небольшого числа переменных), и т.д.

В бизнесе скоринг-карты разрабатываются, чтобы помочь специалисту в принятии решений. Они выступают в роли арбитров, хранят в себе правила для принятия решений. Опытный специалист никогда не будет принимать свое решение исходя только из 4-5 правил формы приложения или истории расчетов. Скорее, он проанализирует сразу несколько обобщающих показателей для формирования профиля риска клиента. Так почему же скоринг-карты разрабатываются всего с 4-5 переменными или характеристиками?

Цель процесса разработки карт - построить наиболее полный профиль риска для каждого клиента. Такой широкий подход делает скоринг-карты не только более эффективными, но и менее восприимчивыми к изменениям в одной отдельной области. Такой профиль риска должен включать в себя характеристики, отражающие столько независимых типов информации, сколько возможно. Для примера, кредитная скоринг-карта пользователя должна включать в себя: демографическую информацию о клиенте (возраст, место проживания, регион и стаж работы); раздел кредитных характеристик, отражающих владение недвижимостью, профессию, платежеспособность, некоторую финансовую информацию, а также степень доверия клиенту в отношении погашения долгов (общий коэффициент невозвращения долга), а также другую значимую для рассмотрения информацию о существующих пользователях.

Профиль пользователя также помогает при последующем мониторинге скоринг-карт по релевантности. Большинство аналитиков, занимающихся изучением рисков, используют ежемесячные отчеты типа "стабильность системы" или "стабильность численности клиентов" для подтверждения эффективности применения карт при текущей численности клиентов. Эти отчеты показывают меры эффективности, исходя лишь из характеристик, используемых в скоринг-карте. Общий же профиль риска более реалистично отражает текущие изменения численности, чем при использовании ограниченного количества переменных из скоринг-карты.

Создание карты клиента на основе профиля риска в теории практически ничем не отличается от других процедур прогнозного моделирования. Разница состоит лишь в представлении конечного набора характеристик. Существует большое количество разнообразных методов, которые могут быть использованы для включения значений профилей рисков клиента в скоринг-карту. Оставшаяся часть статьи будет посвящена методам, использующим logit-регрессию для построения скоринг-карт клиентов.

Logit-регрессия

Logit-регрессия применяется для разработки скоринг-карт в большинстве приложений финансовой сферы, где переменные являются категориальными. В случае непрерывных переменных прогноза используется линейная регрессия. Далее будет рассмотрено использование множественной logit-регрессии для прогноза бинарной переменной (имеющей значения плохо/хорошо).

logit-регрессия, как и большинство других методов прогнозирования, использует набор характеристик прогнозирования для определения вероятности (или возможности) достижения результата (цели). logit-преобразование уравнения возможности наступления события выглядит следующим образом:

Р - итоговая вероятность наступления события;

Х - зависимые переменные;

Начальный(нулевой) уровень линии регрессии;

Параметры

Логит-преобразование - это логарифм отношения вероятности наступления события к вероятности его ненаступления: log(p(наступления события)/р(ненаступления события)), и используется оно для линеаризации итоговой вероятности, ограничивая вероятность от 0 до 1. Для оценки параметров и используется метод максимального правдоподобия. Эти параметры оценивают меру изменения результата логит-преобразования при изменении входной переменной на одну единицу (в согласовании с другими входными переменными). На самом деле, эти коэффициенты показывают наклон линии регрессии между переменной-целью (target), и соответствующей входной переменной .

Параметры зависят от единицы измерения входной переменной, например, выражаются в процентном отношении к объему всех анализируемых данных, и их необходимо стандартизировать для облегчения анализа. Стандартизация может быть выполнена различными методами, включая и метод стандартизированных оценок. Другой способ стандартизации состоит в общей отмене единиц измерения входных данных, и выполнении регрессии не на входные данные, а на WOE для каждой группировки, созданной на прошлом шаге.

Регрессия подразумевает наличие целевой переменной и серий входных данных. Эти данные могут иметь различные формы представления. Наиболее общий способ - это использовать необработанную входную информацию для числовых данных и создавать замену для переменных с категориальными данными. Далее в анализе используется метод стандартизированных оценок для нейтрализации эффекта, оказываемого различными единицами измерения входных данных.

В случае скоринг-карт по сгруппированным переменным, входные данные могут быть представлены в виде средних значений для числовых переменных, например средний возраст по каждой группе, или некоторое взвешенное среднее, или замененные переменные для категориальных групп. Но использование замененных переменных для категориальных переменных имеет существенный недостаток - получается, что разница между группой категориальных переменных состоит в их названии. Более предпочтительно использовать для сгруппированных переменных WOE каждой группы в качестве входных данных. Данный подход не только решает проблемы различий единиц измерения входных переменных, но и принимает в расчет точный тренд и шкалу отношений одной группы к другой. В дополнение, если группировка была произведена верно, можно быть уверенным, что значения, распределенные по группам при шкалировании скоринг-карты являются логически обоснованными и отражают разницу в родстве между группами.

Регрессия может быть применена для нахождения наиболее вероятной модели, использующей все доступные опции. Обычно это принято называть методикой "регрессии по доступным параметрам". Данный метод оказывается довольно эффективным, особенно если имеется большое количество независимых входных переменных. Гораздо реже используются следующие три типа поэтапной logit-регрессии:

Предварительный выбор:

Этот метод строит модель по одной характеристике(переменной), затем постепенно добавляет остальные характеристики в эту модель по возрастанию до тех пор, пока не останется переменных с р-value меньше уровня значимости (например, 0,5). Этот метод эффективен, но может не работать, если имеется очень большое количество переменных или присутствует высокая степень их корреляции.

Метод исключения:

Противоположный предварительному выбору метод, работает сразу со всеми переменными модели, и последовательно исключает переменные с наименьшим уровнем значимости. Процесс идет до тех пор, пока все оставшиеся переменные не будут иметь р-value ниже уровня значимости, например 0,1. Этот метод учитывает корреляцию больше, нежели метод предварительного выбора, или поэтапного выбора. Однако это не идеальный метод для исключения корреляции. Обратное исключение также может быть использовано для объединения значимых взаимодействий в модель.

Поэтапный выбор:

Комбинация двух предыдущих методов. Использует и добавление и удаление переменных динамически в карту качества на каждом этапе, вплоть до достижения наилучшей комбинации признаков. Пользователь может задать минимальные p-value, при которых переменная добавляется в создаваемую модель, или остается в модели. Дополнительную информацию Вы можете получить на статистическом портале и сайте компании СтатСофт.

Конструирование скоринг-карты

Пока возможно построить карту качества, применив ко всем переменным регрессионную модель и сгенерировав статистически оптимальный результат, этот метод не может принести лучшие результаты. Разработчик скоринг-карты обычно опирается на некоторые статистические показатели, такие как p-value, ХИ-квадрат, R-квадрат и некоторые другие для определения качества построенной модели. Далее приведены некоторые задачи, решение которых необходимо при разработке скоринг-карты.

Первая задача состоит в определении наилучшего набора входных переменных, и построении полного профиля рисков. Методика построения профиля рисков была описана выше. В идеале, этот профиль должен быть построен с использованием как можно большего числа независимых переменных, например демографических, финансовых, кредитных вопросов, платежеспособности, и т.д. Процесс разработки должен учитывать проблемы корреляции и коллинеарности, и другие факторы, затрагивающие надежность модели.

Разработанная скоринг-карта должна соответствовать по своей структуре с последовательностью принятия решений в организации. Если модель является единственным решающим фактором, необходимость построения всестороннего профиля рисков возрастает. Если модель предполагается использовать для поддержки принятия решений, то переменные, включаемые в карту, должны перекликаться с остальными показателями, и не противоречить им. Например, включение таких характеристик как банкротство, TDSR, информация о совершенных преступлениях, должно быть сведено к минимуму, так как присутствует в полицейских стандартах.

Пример, приведенный в таблице 1, показывает переменные-факторы скоринг-карты, взятые из профиля рисков. Заметьте, что среди показателей представлены различные типы информации, как из внутренних, так и из внешних источников. Включение запросов за последние 12 и за 3 месяца сделано для того, чтобы можно было определить масштаб как коротко- так и долгосрочного кредитования. Банкротство и "статистика нарушений" не были включены в карту показателей, так как они используются в полицейских правилах и автоматически отсеиваютсоответствующих кандидатов.

Обычно подобная скоринг-карта не является результатом автоматического регрессионного алгоритма. Как же получается подобная скоринг-карта?

Рассмотрим на примере.

Разработчик скоринг-карт имеет на вооружении несколько методов, с помощью которых он может построить итоговую форму модели. Предполагается отбор параметров, при котором изначально рассматриваются лишь необходимые, или те, которые "может быть пригодятся".

Один из способов добиться результата - это предположить значимые для модели переменные, шаг за шагом, причем переменные предполагаются совершенно специфичным для каждого шага путем. Этот процесс похож на регрессию с поэтапным выбором (stepwise). Пример приведен в таблице 2 ниже:

Используя данный метод, регрессионный алгоритм сначала выбирает параметры, используя logit-регрессию либо по предварительному отбору, либо по методу исключения, либо поэтапный выбор. Характеристики, удовлетворяющие поставленным критериям отбора (напр. Когда p-value параметра оценивается на каком-либо уровне доверия, параметры добавляются к карте в первую очередь, или наоборот, удаляются из нее в случае регрессии по методу исключения.) В приведенном примере характеристики "возраст", "дата смены места жительства" и "опыт работы" будут вычислены при первой итерации. Характеристика "возраст" появится в модели как оказывающая наибольшее влияние на прогноз.

При второй итерации того же уровня, алгоритм рассмотрит две оставшиеся характеристики, принимая во внимание уже отобранную переменную "возраст". Если окажется, что одна либо обе рассматриваемые переменные оказывают значимое влияние на результат прогноза, то они тоже будут добавлены в модель. Регрессионный анализ остановится, когда не будет ни одной переменной, которую можно было бы добавить, либо исключить из набора данных для анализа.

Все характеристики, включенные в модель на первом шаге, будут участвовать в ней и на 2м шаге. Регрессионный алгоритм на этом шаге проверит такие характеристики как "район", "индекс", и "область", но проверка начнется с характеристик, отобранных на первом шаге и уже включенных в модель. Вновь, такие показатели как p-value и уровень значимости будут использованы для определения значимых характеристик (которые войдут в модель).

Подобный анализ будет проведен для каждого последующего уровня. Итогом анализа будет являться скоринг-карта. Характеристики, включенные в модель на более ранних шагах, будут также включены в модель и при последующих итерациях.

Статистические показатели, такие как ХИ-квадрат или стандартизированные оценки могут быть использованы для определения силы прогноза модели на каждом шаге итерации.

Опытный пользователь может проконтролировать процесс анализа для увеличения шансов вынесения правильного диагноза. Слабые и "Привилегированные" характеристики могут быть помещены на более ранние шаги итерации в целях увеличения шансов их добавления в модель, и для максимизации влияния бесспорных (проверенных) переменных. В дальнейшем, добавление других переменных увеличит точность прогноза.

Более значимые характеристики помещаются в конец, и могут не войти в скоринг-карту, если их влияние может быть уже смоделировано по одному или нескольким другим критериям. Использование нескольких слабых критериев для моделирования поведения одного более значимого применяется для стабилизации, причем без потери силы прогноза, например, 5 характеристик, добавляющих 200 баллов каждая в скоринг-карте предпочтительнее, чем две характеристики, добавляющие по 500 баллов каждая. Модель будет эффективна при более широкой базе (наборе характеристик). Это соответствует идее создания профилей рисков.

Схожие критерии("возраст", "дата смены места жительства" и "опыт работы") объединяются в один шаг итерации для того, чтобы корреляция между этими характеристиками была рассмотрена в дальнейшем. Наиболее подходящие среди коррелированных характеристик войдут в скоринг-карту. Схожие коэффициенты должны быть также помещены в один и тот же шаг итерации в качестве информации о числителе и знаменателе. Вдобавок, рассмотрение различной независимой информации на каждом шаге увеличивает шансы добавления хотя бы одной переменной из каждой группы в итоговую скоринг-карту.

Регрессионный анализ будет повторяться для различных комбинаций характеристик на разных этапах и с разными уровнями доверия в цикличном процессе для построения наилучшего набора правил модели. Характеристики могут быть перемещены на более высокие или более низкие шаги в целях достижения разнообразных комбинаций для скоринг-карт. Эти карты будут оценены позже, с использованием бизнес критериев и статистических показателей прогнозной силы модели.

На практике этот подход реализуется моделью с опцией выбора последовательности в logit-регрессии с поэтапным выбором. Вот два наиболее часто используемых подхода:

Простая регрессия

Выполняется однократный запуск алгоритма регрессионного анализа, причем порядок размещения характеристик следующий: - Все "слабые" характеристики размещаются вверху(вначале), все более значимые характеристики - в конце. Внутри каждого типа информации характеристики могут быть отсортированы, начиная самой менее значимой, и заканчивая наиболее значимой характеристикой. Весомость каждой характеристики может быть рассчитана по ее значению.

Множественная регрессия

При использовании данного подхода алгоритм регрессионного анализа повторяется многократно, рассматривая различную информацию на каждом шаге анализа.

  • Все "слабые" характеристики рассматриваются в первую очередь, на начальных шагах регрессионного анализа.
  • При каждом регрессионном анализе характеристики располагаются в порядке возрастания их значимости, то есть от самой "слабой" к самой "сильной".
  • Характеристики, включенные в скоринг-карту на более ранних шагах анализа, включаются во все последующие шаги.

Также, как и при процессе группировки, такой подход к разработке скоринг-карт восприимчив к понижению эластичности. Хорошее понимание всех шагов анализа, а также статистических компонентов, таких как набор анализируемых характеристик, снизит шансы получения неудовлетворительного качества прогнозирования. Данный подход должен быть протестирован с использованием нескольких различных комбинаций характеристик, чтобы понять динамику изменения данных перед составлением итоговой скоринг-карты.

Этот процесс включает в себя статистическое моделирование (например, регрессионный анализ) и бизнес-анализ. Осуществляется разработка устойчивой, эффективной скоринг-карты, содержащей характеристики из различных источников, и отображающей различные независимые типы информации(демографическая, запросы, информация о прошлой деятельности, о з/п и т.д.). Заметим, что регрессионный анализ выполняется с использованием устойчивого набора характеристик, выбранных из первично отобранных характеристик, и все слабые критерии уже были устранены. Все тесты на значимость следуют из выбора итоговой композиции характеристик, входящих в скоринг-карту, но это не единственный критерий для рассмотрения. Получившаяся карта имеет свою статистическую силу и воздействие. Чаще всего, это как раз то, что используют риск-менеджеры и другие специалисты по принятию решений для выработки компенсирующих риски стратегий.

Когда набор характеристик для включения в скоринг-карту получен, эти характеристики могут быть применены к анализу в сгруппированном виде, для получения итоговых параметров регрессии. Подобные процессы происходят с каждой скоринг-картой при построении, для каждого сегмента в отдельности. Типично несколько скоринг-карт используют различные комбинации характеристик для каждого сегмента, и учитывают поставленные цели и задачи для определения итогового решения. Скоринг-карта с более низкой "силой" может получить больший приоритет, если она нацелена на стратегию, цели и задачи организации.(например, большая прибыль), чем другая, с большей "силой", и поэтому необходимо сравнить несколько карт соответствующим образом, чем полагаться единственно на статистические показатели. Кстати выбор критериев скоринг-карт и их утверждение будет рассмотрено в последующих главах.

В итоге на данном этапе создаются несколько различных скоринг-карт, обобщающих некоторое число характеристик и их параметры регрессии.

При подборе персонала на вакантные должности компании (особенно в массовом подборе) специалисты сталкиваются с большим количеством рисков. Эти риски связаны с ошибочным отсевом кандидатов и как следствие с принятием на работу не профессионалов, что в дальнейшем может порождать все новые и новые цепочки рисков. Следовательно специалисту по подбору персонала важно располагать инструментами, помогающими быстро и по универсальным параметрам оценить степень риска при рассмотрении того или иного кандидата. «Скоринг» (от англ. Scoring) - дословно подсчет очков в игре. В бизнесе скоринг активно используют в маркетинге, страховании, у сотовых операторов в телекоммуникационной сфере и наиболее широко - при кредитовании физических лиц. В общем виде скоринговая модель представляет собой математическую модель, описывающую зависимость степени риска от набора входных факторов. Реализацию данная модель находит в скоринговых картах. Например, применительно к кредитованию - это некоторый набор основных характеристик заемщика, таких как возраст, доход, профессия, стаж работы, наличие имущества и т.д. и соответствующих весовых коэффициентов, выраженных в баллах. Потенциальный заемщик заполняет анкету, сообщая таким образом необходимые для анализа сведения о себе. В результате функционирования скоринговой модели для каждого потенциального заемщика получают интегральный показатель, представляющий собой взвешенную сумму определенных признаков. Надежность клиента можно оценить по уровню данного значения. В зависимости от суммы набранных скоринг-баллов банк определяет класс риска и рассчитывает максимальную сумма кредита, уточняет процентную ставку и срок. Основными критериями банковского скоринга физических лиц являются значения следующих параметров: возраст, пол, совокупный доход (как заемщика, так и поручителей), количество иждивенцев, место жительства и работы и т.п. Каждый из этих параметров переводится в стандартные балы. Подобный подход логично использовать и в процессе принятия решения по отбору кандидатов как при отборе на открытые вакансии или при отборе кандидатов в кадровый резерв. Модель скоринговой оценки строится на основе накопленных данных о зависимости дефолта (увольнения, несоответствия занимаемой должности и т.п.) потенциального кандидата от определенных характеристик. После чего используя статистический аппарат и приемы математического моделирования, составляется скоринговая карта. В процессе моделирования разрабатывается несколько скоринговых карт, каждая из которых будет зависеть от типа вакансии и ряда других признаков. При анализе, сопоставив конкретные анкетные данные о потенциальном или действующем кандидате на вакансию со скоринговой картой, получают соответствующий результат. Для построения эффективной скоринговой модели необходимо решить следующие задачи. На первом этапе необходимо определить ключевую цель, т.е. для чего конкретно будет использоваться скоринг (оценка кандидата, определение оптимальной стратегии по кандидатам на испытательном сроке и т.п.). На втором этапе выделяют показатели, которые будут использованы для моделирования, а также источники их получения. Например, знания кадровых специалистов о требованиях вакансии и компетенциях соискателей, статистика по уже работающему персоналу, учитывающая «успешных» и «плохих» кандидатов. На третьем этапе проводится предварительный анализ данных, их очистку и подготовку, ведь каждый соискатель обладает своим уникальным набором параметров. Для такого анализа необходима унификация данных и специализированное программное обеспечение бизнес-анализа класса Business Intelligence (BI). Система должна предоставлять возможность обработки данных: просмотра, фильтрации, поиска, ручной и автоматической замены. Часто для лучшего понимания данных и для определения их целостности необходимо проводить экспресс-анализ, который осуществляется на основе базовых статистик распределений. Следовательно, система должна уметь проводить частотный анализ и строить распределения. Если очистка данных произведена, необходимо подготовить данные к моделированию. До начала построения модели следует рассчитать на основе функциональных зависимостей все возможные производные параметры, которые будут использованы для дальнейшего анализа. На четвертом этапе полученные признаки разбиваются на классы, выявляются их предиктивные характеристики. Большинство алгоритмов скорингового моделирования основываются на классификации элементов (соискателей), обладающих одинаковыми признаками. Кроме того, в процессе построения модели появляется необходимость разбиения некоторых признаков на классы. Основной принцип в данном случае - группировка соискателей с максимально похожим поведением в один класс. Такой подход основывается на экспертных данных. На основе проводимого анализа выделяются предиктивные характеристики, между значениями которых и вероятностью негативного события существует корреляция. Теоретически предиктивным может быть любой параметр, характеризующий соискателя. К ключевым характеристикам могут быть отнесены следующие: возраст, средний срок работы на одном месте, стаж работы, место жительства, наличие кредитов, количество детей/иждивенцев и т.п. Для каждой модели составляется свой перечень предиктивных характеристик. На основе статистических данных и экспертных оценок для каждой характеристики вводится свой весовой коэффициент, определяющий степень ее влияния на вероятность возникновения негативного события. Отобранные предиктивные характеристики анализируются в совокупности. Это связано с существованием возможных корреляций. Может оказаться, что ввод дополнительной характеристики в модель ухудшит ее качество. На пятом этапе строится нескольких вариантов моделей, из которых выбирается наиболее оптимальный с точки зрения соотношения «качество/ стабильность». На шестом этапе определяют уровень стабильности модели, т.е. ее способность сохранять точность в течение какого-либо будущего периода. Стабильность построенной модели определяется аналитиком на основе тестовых данных. Если на тестовых данных система показывает эффективность, схожую с эффективностью на обучающих данных, считается, что модель стабильна. На седьмом этапе формируют балл отсечения, который базируется на стратегии, используемой фирмой (массовый подбор или закрытие «уникальной» вакансии, поиск уникального специалиста и др.). Балл отсечения устанавливается в зависимости от выбранного приоритета. При внедрении скоринговой модели в практику работы, специалисту по кадрам необходимо определить коэффициенты для различных факторов-характеристик надежности соискателя. Следовательно, кадровый специалист должен быть в состоянии оценить текущую ситуацию на рынке. В результате такой оценки получают набор факторов с весовыми коэффициентами и пороговое значение (балл отсечения), которые являются весьма субъективным мнением и зачастую являются статистически необоснованными. На последнем, восьмом этапе оценивают эффективность разработанной модели При использовании скоринговых карт в подборе персонала специалист по кадрам сможет быстро определять общий сводный бал кандидата и принимать решение о приеме/не приеме, а также прогнозировать успешность/неуспешность кандидата в работе. Преимуществом применения скоринговых карт при массовом подборе (когда обрабатываются данные о сотнях потенциальных соискателей) является возможность получения общего балла каждого кандидата, и автоматическое отсечение тех, кто не набирает «установленного достаточного минимума». Ценность применения скоринговой модели также и в том, что: - легко структурировать и визуализировать полученные данные при подборе на любую должность; - у специалиста по кадрам появляется четкое понимание, что необходимо узнать о соискателе и из какого источника; - оценки становятся стандартизированными, увеличивается прозрачность процедуры отбора в целом; - компания может легко проследить корреляцию между характеристиками нанятых сотрудников и их дальнейшей эффективностью Тем не менее, скоринговые карты не могут полностью заменить специалиста. Как и в банковском деле при нестандартных ситуациях (сложных вакансиях) окончательное решение должно приниматься не по набранным баллам, а по результатам дополнительного анализа соискателя и живого собеседования с ним. Применяя скоринговые карты предприятие оптимизирует бизнес-процессы подбора персонала, повысит эффективность, выбирая только лучших из кандидатов, и снизит риски текучести персонала.

Банки сегодня активно оптимизируют свой бизнес: заменяют дорогостоящую филиальную сеть дистанционным обслуживанием, аккуратно сокращают персонал, нанимая многофункциональных специалистов в режиме «три по цене одного», автоматизируют все, что автоматизируется. Одним из инструментов оптимизации бизнеса, а именно кредитного процесса, является скоринг.

С развитием кредитования в России размеры кредитных департаментов банков разрослись до невозможности. Оценка заемщиков, представление их на кредитный комитет - это тонны бумаги и отчетов. И вот тут на помощь российским банкам пришел . Этот умный помощник способен быстро и без эмоций оценить любого заемщика. Ну или почти любого. Все-таки, сколько бы ни инвестировал банк в автоматизацию кредитного процесса, без человеческого участия по-прежнему не обойтись. К тому же каким бы волшебным и умным ни был автомат, но мошенника от честного клиента он отличит не всегда.

Как это работает

Скоринг работает довольно просто. Сразу после внесения данных заявки в систему она анализирует массу параметров заемщика - от экономических (размер дохода, закредитованность и пр.) до социально-демографических (возраст, пол, семейное положение, наличие детей, профессия и т. д.). Кредитный специалист получает на выходе скоринговый балл, после чего проводит дополнительную собственную оценку адекватности и психического здоровья потенциального заемщика - то есть выполняет работу, которую автоматическая система сделать не может.

Скоринг так или иначе используется во всех видах розничного кредитования. Но в зависимости от продукта меняется вес скоринговой оценки в кредитном процессе. Например, в экспресс-кредитовании скоринг оказывает значительное влияние на итоговое решение, а в ипотеке, где важен индивидуальный подход, ему уделяется меньшее внимание. Чем сложнее параметры кредитной сделки, такие как наличие предмета залога, поручителя, различных источников получения дохода, нестандартная схема выплат по кредиту, тем менее важна скоринговая модель. К тому же для того, чтобы накопить достаточное количество статистики для построения скоринговых моделей в жилищном кредитовании, требуется больше времени, чем вся история ипотеки в России. «Кредиты выдаются на 15 лет и более, а история обслуживания насчитывает 5-7 лет максимум», - объясняет вице-президент банка ВТБ 24 Ольга Балаева.

Внедрение скоринговой системы - это вопрос и структурный, и финансовый. Цена здесь сильно зависит от масштаба работ. По словам директора департамента розничных рисков ХКФ Банка Евгения Иванова, стоимость скоринговых карт по различным продуктам может достигать сотен тысяч долларов. Скоринговые карты - это набор утвержденных банком определенных характеристик и соответствующих весовых коэффициентов (баллов) по различным кредитным направлениям. Скоринговых карт в банке обычно несколько: к примеру, под ипотеку необходима одна карта, а под кредиты на покупку автомобиля уже совершенно другая. Если же банк хочет поставить весь кредитный процесс на поток (запустить так называемый кредитный конвейер), то затраты могут достигать нескольких миллионов долларов. Ведь это не только запуск отдельных скоринговых карт, но и построение глобальной скоринговой инфраструктуры, внедрение специального банковского оборудования на всех этапах кредитной оценки. Затраты на поддержание внедренной системы скоринга относительно небольшие, соизмеримые с месячной зарплатой бухгалтера.

Без рук и эмоций

Большинство банков стремятся перевести процедуры оценки заемщиков в автоматический режим. Это нормально, потому что покупка одной системы позволяет не то чтобы уволить «лишних» сотрудников, но избавиться от человеческих рук и эмоций. В зависимости от сложности процесса проверки заявки соотношение «человек - машина» может варьировать в пропорции 1:20 и выше. То есть пока человек проверяет одну заявку, машина успевает проверить до 20. По словам Ольги Балаевой, скоринг позволяет обрабатывать увеличивающийся поток клиентов с минимальным расширением штата. Причем скоринг работает не только на количество, но и на качество. «Внедрение новых скоринговых карт сопровождается снижением дефолта по вновь выданным кредитам», - говорит заместитель директора департамента контроля рисков банка «Петрокоммерц» Руслан Морозов.

Скоринг убивает сразу двух зайцев. С одной стороны, он «скор» на рассмотрение заявок благодаря технической составляющей. С другой - автомат свободен от предубеждений. Он не видит, в какой одежде пришел человек, как потенциальный клиент себя ведет. Скоринг просто быстро и бесстрастно выполняет свою работу.

По словам начальника управления риск-менеджмента физических лиц, малого и микробизнеса Райффайзенбанка Ольги Конюшковой, несомненный плюс скоринга заключается в том, что он не подвержен человеческому воздействию. Результат оценки конкретного заемщика основан на анализе десятков тысяч кредитов таких же клиентов и всегда будет более точным, чем применение любых экспертных правил или политик. Также плюсом является его низкая стоимость и высокая скорость работы, позволяющая принимать решения в режиме реального времени.

Человека не забыли

И все же отсутствие человеческого фактора в оценке заемщика может обернуться для банка финансовыми потерями. Беда в том, что скоринг не может зачастую вычленить выгодных для банка заемщиков из-за их нетипичности. «В качестве основного минуса скоринга можно назвать невозможность одобрения через систему скоринговой оценки нестандартных заявок, которые тем не менее могут быть интересны банку», - соглашается заместитель директора департамента развития бизнеса банка «Западный» Валерий Кретов.

Простой пример. Потенциальный клиент находится в социальной группе высокого риска (скажем, имеет пятерых детей на иждивении и стаж на последнем месте работы в районе полугода). Однако дополнительная информация, которой обладает андеррайтер, но которая не «зашита» в скоринговую модель, позволяет с уверенностью говорить о хорошей платежеспособности заемщика. Скажем, речь идет о заемщике, который берет на ремонт в новом доме. При этом он имеет достаточно высокий доход, собирается продавать имеющиеся активы, машину или квартиру и определенно намерен погасить раньше положенного времени. В скоринговую карту доход, конечно же, «зашит», но, учитывая остальные опции, такой клиент получит низкий скоринговый балл.

Другая история. Банк выходит в совершенно новый для себя сегмент кредитования, а значит, применение разработанных ранее скоринговых карт вообще может дать непредсказуемый результат. По словам Руслана Морозова из банка «Петрокоммерц», скоринг, применяемый на клиентах одного банка, не подойдет банку, работающему в другом сегменте кредитования и, следовательно, имеющему другой тип заемщиков. Скоринг, «обученный» на клиентах-россиянах, не будет работать на тех, кто не является гражданином РФ. «В некоторых сферах скоринг вообще не работает, например в корпоративном или инвестиционном кредитовании. В этих случаях каждую сделку нужно рассматривать индивидуально», - отмечает Евгений Иванов из ХКФ Банка.

Доверчивая машина

Скоринг отсекает неблагонадежных заемщиков, но не в состоянии справиться с обманом. Машина заведомо считает, что документы и другие сведения, поданные по заявке на кредит, - достоверные. Поэтому данный инструмент серьезный банк будет использовать только как вспомогательный. А с мошенниками и лгунами борются другими методами - например, с помощью внешних антимошеннических сервисов, дополнительного анализа кредитных специалистов и службы безопасности банка.

«Скоринг действительно считает, что данные из анкеты верны», - указывает начальник отдела скоринга розничных кредитных продуктов ОТП Банка Олег Ильин. «Наибольший риск представляют преднамеренное искажение клиентом информации о себе и подделка документов, мошеннические действия со стороны клиента, - поясняет директор департамента финансовых и розничных рисков Промсвязьбанка Александр Васютович. «Скоринг не всегда может выявить случаи, когда мошенник подает заявку с ложными данными или от имени другого лица - к примеру, имеющего хорошую кредитную историю», - подчеркивает советник председателя правления по рискам Алтайэнергобанка Павел Михайлов. Скоринговая модель, построенная для предотвращения одного из видов риска, может пропустить заявку с высоким уровнем риска другой категории. «Мошенник может предоставить ложные данные, которые обеспечат высокий скоринговый балл», - приводит пример директор по розничным рискам НОМОС-Банка Алексей Каликин.

Кроме того, в процессе скоринга возможны статистические ошибки. Конкретных примеров банкиры приводить не стали. Однако директор департамента розничного бизнеса СМП Банка Наталья Мишина указала, что возникновение ошибок влечет за собой потерю средств для банка: либо в случае возникновения «некачественного» кредита, либо при ошибочном отказе «хорошему» заемщику. Поэтому скоринг нужно постоянно совершенствовать и обучать: обновлять статистическую базу, вносить опциональные изменения в скоринговые карты.

И еще один момент, с которым скорингу никак не справиться. Это различные экономические изменения на рынке. В то время как банковский специалист, обладающий аналитическим складом ума, способен среагировать на обострение кризисных явлений практически моментально, машина окажется более неповоротливой - в нее еще нужно будет внести изменения и поправить настройки оценки.

Технологии скоринга – автоматической оценке кредитоспособности физического лица – в банковской среде традиционно уделяется повышенное внимание. Сегодня можно сказать, что экспертные методы уходят в прошлое, и все чаще при разработке скоринговых моделей обращаются к алгоритмам Data Mining. Классическую скоринговую карту можно построить при помощи логистической регрессии на основе накопленной кредитной истории, применив к ней ROC-анализ для управления рисками.

Постановка задачи. В коммерческом банке имеется продукт «Нецелевой потребительский кредит»: займы предоставляются на любые цели с принятием решения за один день. В настоящее время решение о выдаче кредита принимается на основе скоринговой карты, построенной экспертным способом, с процентом отказа, равным 55%, при этом объем просроченной задолженности велик. Накоплена статистическая информация о заемщиках и качестве обслуживания ими долга за несколько месяцев. Руководство банка, понимая, что высокий уровень отказов препятствует расширению розничного бизнеса в области потребительского кредитования, поставило перед отделом розничных рисков задачу разработать новую скоринговую карту, которая позволила бы значительно сократить число отказов в выдаче и снизить сумму просроченной задолженности.

Исходные данные. Вообще говоря, информация о заемщиках – физических лицах и кредитных договорах хранится в банковской информационной системе. Там же содержатся графики и даты погашений кредита, сведения о просрочках, об их суммах, о процентах и т.д. Получить для построения скоринговой модели таблицу с параметрами заемщиков и информацию о наличии просрочек – отдельная задача. Будем считать, что она уже выполнена и результат представлен в виде текстового файла.

Важным также является вопрос о том, что понимать под параметрами заемщика. Здесь уместно обратиться к методическим аспектам подготовки и сбора данных для анализа, и вспомнить, что на этом этапе требуется активное взаимодействие с экспертами: они с высоты своего опыта ограничат круг входных переменных, которые потенциально могут влиять на кредитоспособность будущего заемщика. Кроме того, следует учитывать аспекты бизнеса и технические вопросы (например, сложно проверить в короткий срок достоверность признака «Сфера деятельности компании», а потому полагаться на него не стоит).

Скоринговые карты часто строятся на категориальных переменных, и для этого непрерывные признаки квантуются при помощи ручного выбора точек разрыва (или полуручного, см., например, «Тест Чоу»). Скажем, переменная Стаж работы разбивается на три категории: «до 1 года», «от 1 до 3 лет», «свыше 3 лет». Такую модель легче интерпретировать, но она менее гибкая при моделировании связей: горизонтальные «ступени» дают плохую аппроксимацию при наличии частых крутых «склонов».

В банковской практике перед скорингом заемщик, как правило, проходит процедуру андеррайтинга – проверку на удовлетворение жестким требованиям: соответствие возрасту, отсутствие криминального прошлого и, конечно, наличие определенного дохода. При этом выдвигаются требования к минимальному уровню дохода, и рассчитывается возможный лимит кредита. При его расчете участвует один из двух коэффициентов – П/Д либо О/Д.

Коэффициент «Платеж/Доход» (П/Д) – отношение ежемесячных платежей по кредиту заемщика к его доходу за тот же период. Считается, что значительная величина этого коэффициента (свыше 40%) свидетельствует о повышенном риске как для кредитора, так и для заемщика.

Коэффициент «Обязательства/Доход» (О/Д) – отношение ежемесячных обязательств заемщика к его доходу за тот же период с учетом удержаний налогов. В обязательства включаются расходы, связанные с выплатой планируемого кредита, а также имеющиеся другие долгосрочные обязательства (выплаты по иным кредитам, на содержание иждивенцев, семьи, алиментов, обязательные налоговые платежи и пр.). Считается, что размер ежемесячных обязательств заемщика не должен превышать 50-60% его совокупного чистого дохода.

Заявки клиентов, не прошедшие андеррайтинг, получат отказ и даже не попадут на скоринг. Поэтому на вход скоринговой процедуры выгоднее подавать не доход клиента, а отношение О/Д или П/Д.

В нашей задаче представлено 2709 кредитов (файл loans.txt) с известными исходами платежей на протяжении нескольких месяцев после выдачи кредита.

В табл. 5.1 отображены структура и описание полей текстового файла с кредитными историями.

Таблица 5.1. Данные по заемщикам и качеству обслуживания ими долга

Поле

Описание

Служебный код заявки

Дата выдачи кредита

Дата/время

Коэффициент О/Д («Обязательства/До­ход») в %

Вещественный

Возраст заемщика (полных лет) на момент принятия решения о выдаче кредита

Проживание

Основание для проживания: собственник; муниципальное жилье; аренда

Строковый

Срок проживания в регионе

Менее 1 года; от 1 года до 5 лет; свыше 5 лет

Строковый

Семейное положение

Холост/не замужем; женат/замужем; разве­дена/вдовство; другое

Строковый

Образование

Среднее; среднее специальное; высшее

Строковый

Стаж работы на последнем месте

Менее 1 года; от 1 года до 3 лет; свыше 3 лет

Строковый

Уровень должности

Сотрудник; руководитель среднего звена; руководитель высшего звена

Строковый

Кредитная история

Информация берется из бюро кредитных историй. Если имеется негативная информация о клиенте (просрочки по прошлым кредитам), то ему присваивается категория «отрицательная»

Строковый