image
Новости

Запись вебинара «Поиск дубликатов в мастер-системах клиентских данных»

29.01.2021
1 мин

Миша Берёзин рассказал, как CDI-решения ищут дубликаты в базах клиентских данных. Запись уже на YouTube, посмотрите.

О чем шла речь

Чтобы построить «золотую» карточку клиента, нужно для начала понять, из каких «кирпичей» эту карточку собрать. То есть найти похожие записи — те, что описывают одного и того же человека.

Это непростая задача, и главное здесь — нащупать равновесие. Если правила поиска дубликатов сделать слишком мягкими, можно объдинить разных людей и получить «кентавра». Если же сильно перестраховаться, толку от мастер-системы не получишь — в базе останется полно дублей.

На вебинаре мы поговорим о тонкостях выявления записей-дубликатов:

  • почему не все дубликаты одинаково полезны и что такое «серая» зона;
  • что делать с дубликатами, по которым не удалось принять автоматическое решение;
  • как объединять карточки, когда кажется, что в них совсем мало данных;
  • как искать похожие карточки среди десятков миллионов записей за часы, а не дни.

Михаил готовит доклад, опираясь на реальные проекты HFLabs, боль и каждодневные задачи. Он расскажет, как все работает в жизни, а не в маркетинговых материалах мастер-систем.

Кому будет полезно

Вебинар пригодится архитекторам, дата-инженерам, аналитикам, специалистам по безопасности информации. И всем, кто хочет разобраться в сложностях работы с клиентскими данными.

Спикер

Михаил Берёзин, в HFLabs руководит разработкой мастер-системы «Единый клиент».

На этой позиции Михаил изучает алгоритмы создания и обновления «золотых» записей. Анализирует эффективность подходов и типовые ошибки в работе.

«Единый клиент» используют такие компании как «Открытие», «Росгосстрах», «Альфастрахование», МТС, «Мегафон».

В общем, посмотрите вебинар, там интересные и важные штуки.

Выбор редакции
image
Полезное
Что представляет собой нормативная база по адресам в России: краткий обзор
Разбираемся, какие документы регулируют использование адресов в России и чем они могут быть полезны IT-специалистам
Татьяна Бунто
27.08.2024
4 мин.
image
Новости
АБД представила результаты тестирования риск-модели деобезличивания
Показали результаты тестирования модели оценки рисков повторной идентификации с использованием продукта для обезличивания данных «Маскировщик».
Алина Соломина
19.06.2024
2 мин.
image
Обновления
Масштабно обновили «Центр управления согласиями» (и внедрили AI)
Внедрили нулевое согласие, доработали визуализацию и сделали интеграцию с GPT.
Тимур Сафиуллин
22.04.2024
1 мин.
image
Новости
HFLabs теперь по-новому работает с интеграторами. Что? Да!
Рады объявить: мы готовы передать часть наших новых продуктов — «коробок» системным интеграторам на дистрибуцию.
Екатерина Илюхина
27.02.2024
1 мин.
image
Полезное
10 самых частых вопросов о «Маскировщике»
Подготовили ответы на вопросы, которые нам чаще всего задают на демо-сессиях и пресейлах по «Маскировщику».
Ольга Сердобинцева
11.09.2023
3 мин.