Обработка данных

Имена, адреса и телефоны — это наиболее часто встречающаяся и наиболее сложная для обработки информация о клиентах.

Мы постоянно прикладываем максимум усилий, чтобы обеспечить наивысшее качество обработки этих данных и наиболее актуальные справочные данные для их актуализации.

Адреса

Приведение адресов к единому формату по КЛАДР/ФИАС или разбиение их по компонентам — регион, район, город, улица, дом, корпус, строение, квартира или офис. В качестве входных данных может быть как разбитый по компонентам адрес, так и представленный единой строкой.

Наша технология позволяет обрабатывать даже адреса, заданные в транслитерации и содержащие опечатки и сокращения, а также эвристически восстанавливать некоторые пропущенные компоненты, такие как почтовый индекс, регион и иногда даже город или другой населенный пункт.

Более подробно про стандартизацию адресов.

Телефоны

Во многих базах данных телефоны либо содержатся единой строкой, или разбиты по типам. Они также могут быть перепутаны местами и быть в разных форматах — с разными разделителями, с и без кода города, с дополнительными пометками и т.д.

Наша технология позволяет разделять телефоны, описанные в одной строке или разбитые по полям, автоматически определять их тип (мобильный, рабочий, домашний и т.д.), отсекать лишнюю информацию и приводить их к единому формату. Если телефон не содержит код города, или этот код неправильный, то он может быть также определен автоматически на основании части адреса или набора согласованных предположений.

Более подробно про стандартизацию телефонов.

ФИО и пол

В большинстве баз данных фамилия, имя и отчество либо представлено единой строкой, либо разбито по полям. Но даже разбивка по полям не гарантирует того, что на месте фамилии не окажется имя или отчество.

Мы можем разбить ФИО, заданное единой строкой на компоненты, или переставить компоненты местами, если в уже разбитом адресе были допущены несоответствия. Мы собрали базу данных из десятков тысяч мужских и женских имен, отчеств, а также ряд эвристик по поводу фамилий, что позволяет нам автоматически обрабатывать практически все встречающиеся на территории РФ ФИО, а также выполнять обратную транслитерацию и исправлять ошибки в именах, отчествах, и большинстве фамилий.

Более подробно про стандартизацию имен и определение пола.

 

Заказать консультацию