Находим похожие карточки и проверяем их в 10 раз быстрее
Мы полностью обновили центральную технологию, «сердце» всех продуктов HFLabs: «Фактора», «Единого клиента» и «Подсказок». Теперь при прежних мощностях серверов они отвечают на все онлайн-запросы в десять раз быстрее — за 0,2 секунды. И справляются с сотнями тысяч запросов в час.
Десять лет назад онлайн-нагрузка была минимальной, да и клиентские базы измерялись всего миллионами записей. Тогда казалось, что онлайн-проверки данных навсегда останутся разовыми задачами. Но рынок развивался иначе. Сейчас бизнесу нужен умный и быстрый онлайн-поиск.
Сейчас у HFLabs есть заказчики с объемами клиентской базы в миллиард исходных записей. И все проверки клиентов они проводят в онлайне. Например, стандартное количество онлайн-запросов в бизнес-процессах одного из наших заказчиков — 300 тысяч в час.
Михаил Берёзин,
руководитель продукта «Единый клиент»
Онлайн-поиск по клиентам компании предотвращает появление сотен дублирующихся записей. Менеджеры уже при вводе данных видят похожих клиентов. Часто заводить новую карточку не приходятся, потому что она уже существует.
Онлайн-проверки умеют много полезного. Например, находят подозрительных контрагентов, сравнивая компании с реестрами банкротов, проверяя по ЕГРЮЛ и различным «черным» спискам. Или по «белым» — скажем, сверяя клиента со списком селебрити из «Википедии». А еще подбирают правильные адреса, ФИО, данные налоговой.
Также онлайн-проверки отсеивают мошенников «на входе». В том числе и очень хитрых. Скажем, тех, кто маскирует личные данные с помощью намеренных опечаток и подмен букв похожими цифрами.
Например, злоумышленники пишут фамилию «Иванов» через цифру 0: Иван0в. А цифру 1 в номере телефона меняют на латинскую I: +7 953 772 67 I7.
Бывает, так прячутся «плохие» клиенты страховых. Те, кто уже пытался обмануть компанию и получить выплату по якобы страховому случаю. Узнав их, бизнес откажет в договоре или введет повышенный коэффициент.
Клиенты требовательны к скорости онлайн-поиска. Человек не будет полчаса ждать одобрения кредита или расчета стоимости страхового полиса. Он обратится в другой банк или страховую, где услугу предложат сразу.
Сейчас все наши заказчики перешли на новые алгоритмы.
Мы разрабатывали новую технологию поиска дубликатов с февраля 2021 года. За это время полностью изменили архитектуру матчинга данных — основу в «Едином клиенте». Благодаря ей CDI-система ищет дублирующиеся данные. Мы изменили принципы хранения и оперирования данными для поиска дубликатов, которые заложили 15 лет назад.
Михаил Березин,
руководитель продукта «Единый клиент»
«Единый клиент» HFLabs — это CDI-система (альтернативное название этого класса решений — клиентский MDM). Очищает данные от дублей, опечаток и мусора, собирает информацию о клиентах в эталонные карточки.