Zsoft: Применение
     
 
Компания Zsoft
О компании
Партнёры
Заказчики
Услуги
Вакансии

Data Mining
Введение
Применение
Пример
Стандарты
Глоссарий

Продукты
Библиотека Xelopes:
О продукте
Применение
Лицензия
Документация
Демо

3D визуализатор Exero
О продукте

Визуализатор Recomendation Engine
Демо

Применение


Электронная коммерция

В системах электронной коммерции, где особую важность имеют вопросы привлечения и удержания клиентов, технологии Data Mining часто применяются для построения рекомендательных систем Интернет магазинов и для решения проблемы персонализации посетителей web сайтов. Рекомендации товаров и услуг, построенные на основе закономерностей в покупках клиентов, обладают огромной убеждающей силой. Статистика показывает, что почти каждый посетитель магазина Amazon, не упускает возможности посмотреть на то, что же купили "Customers who bought this book also bought: ...". Персонализация клиентов, другими словами, автоматическое распознание принадлежности клиента к определенной целевой аудитории, позволяет компании проводить более гибкую маркетинговую политику.
Поскольку в электронной коммерции деньги и платежные системы, также электронные, то важной задачей становится обеспечение безопасности при операциях с пластиковыми карточками. Data Mining позволяет обнаруживать случаи мошенничества (fraud detection).
В области электронной коммерции также остаются справедливыми все Data Mining методологии, разработанные для обычного маркетинга. С другой стороны, эта область тесно связана с понятием Web Mining.

Web Mining

Специфика Web Mining заключается в применении традиционных технологий Data Mining для анализа крайне неоднородной, распределенной и значительной по объему информации, содержащейся на web узлах. Здесь можно выделить два направления. Это web content mining и web usage mining. В первом случае, речь идет об автоматическом поиске и извлечении качественной информации из перегруженных "информационным шумом" источников Интернет, а также о всевозможных средствах автоматической классификации и аннотировании документов. Данное направление также называют text mining. Web usage mining направлен на обнаружение закономерностей в поведении пользователей конкретного web узла (группы узлов). В частности на то, какие страницы и, в какой временной последовательности, запрашиваются пользователями и какими группами пользователей.

Маркетинг

Основанная задача маркетинга заключается в продвижении товаров и услуг на рынке. Для успешного маркетинга, таким образом, всегда важно знать, что и как продается, а также, кто является потребителем. Исчерпывающий ответ на первый вопрос, дают такие средства Data Mining, как анализ рыночных корзин и сиквенциальный анализ. Зная связи между покупками и временные закономерности, можно оптимальным образом регулировать предложение. С другой стороны, маркетинг имеет возможность непосредственно управлять спросом. Но для этого необходимо знать как можно больше о потребителях - целевой аудитории маркетинга. Data Mining позволяет решать задачи выделения групп потребителей со схожими стереотипами поведения, т.е. сегментировать рынок. Для этого можно применять такие технологии Data Mining как кластеризацию и классификацию.

Телекоммуникации

Телекоммуникационный бизнес является одной из наиболее динамически развивающихся областей современной экономики. Возможно поэтому, традиционные проблемы, с которыми сталкивается в своей деятельности любая компания, здесь ощущаются особо остро. Приведем некоторые цифры. Телекоммуникационные компании работают в условиях жесткой конкуренции, что проявляется в ежегодном оттоке около 25% клиентов. При этом известно, что удержать клиента в 4-5 раз дешевле, чем привлечь нового, а вот вернуть ушедшего клиента, будет стоить уже в 50-100 раз больше, чем его удержание. Далее, как и в целом в экономике, справедливо правило Парето - только 20% клиентов приносят компании основной доход. Помимо этого, существует ряд клиентов, наносящих компании прямой вред. 10% всего дохода телекоммуникационной индустрии в год, теряется из-за случаев мошенничества. Это составляет 4 миллиарда долларов. Таким образом, использование технологий Data Mining, направленных как на анализ доходности и риска клиентов (churn prevention), так и на защиту от мошенничества (fraud detection), сэкономит компании огромные средства.

Промышленное производство

Промышленное производство создает идеальные условия для применения технологий Data Mining. Причина этого заключается в самой природе технологического процесса, который должен быть воспроизводимым и контролируемым. Все отклонения в течение процесса, оказывающие влияния на качество выходного результата, также находятся в заранее известных пределах. Таким образом, создается статистическая стабильность, о первостепенной важности которой говорят в работах по классификации. Естественно, что в таких условиях, использование Data Mining способно дать лучшие результаты, чем, к примеру, при прогнозировании ухода клиентов телекоммуникационных компаний. В последнем случае, причинами ухода могут стать не некие, присущие целым группам абонентов, предрасположенности к смене мест, а внешние, совершенно случайные и поэтому не образующие никаких закономерностей обстоятельства. Скажем, удачно проведенная конкурентами рекламная компания, экономические кризисы и т. д. В общем, все то, что нарушает обычный ход вещей и лежащий в основе Data Mining и статистики принцип прецедента. Опыт работы компаний, предлагающих Data Mining решения для промышленного производства, также свидетельствует об успешности такой интеграции. Приме-ром применения Data Mining в промышленности может быть прогнозирование качества изделия в зависимости от замеряемых параметров технологического процесса.

Биоинформатика

Биоинформатика - область науки, разрабатывающая и применяющая вычислительные алгоритмы для анализа и систематизации генетической информации, с целью выяснения структуры и функции макромолекул и последующим использованием этих знаний для объяснения различных био-логических явлений и создания новых лекарственных препаратов (drug design). Объектом исследования биоинформатики являются огромные объемы информации о последовательностях ДНК и первичной структуре белков, появившиеся в результате изучения структуры геномов микроорганизмов, млекопитающих и человека. Абстрагируясь от конкретного содержания этой информации, ее можно рассматривать как набор генетических текстов, состоящих из протяженных символьных последовательностей. Выявление структурных зако-номерностей в таких последовательностях входит в число задач, эффективно ре-шаемых средствами Data Mining. Например, с помощью сиквенциального и ассоциативного анализа.
Основная область практического применения биоинформатики - это разработка лекарств нового поколения, которые полностью преобразят современную медицину. Сегодня, разработка одного препарата в США занимает в среднем 10-12 лет, а ее стоимость составляет 300-500 миллионов долларов. Биоинформатика сокращает эти цифры вдвое. Биоинформатика, опирающаяся на аппарат Data Mining, может еще больше ускорить и удешевить дофармакологогическую фазу исследования новых препаратов.

Банковское дело

Классическим примером применения Data Mining на практике является решение проблемы о возможной некредитоспособности клиентов банка. Этот вопрос, тревожащий любого сотрудника кредитного отдела банка, можно разрешить и интуитивно. Если образ клиента в сознании банковского служащего соответствует его представлению о кредитоспособном клиенте, то кредит выдавать можно, иначе - отказать. По схожей схеме, но более продуктивно и полностью автоматически, работают установленные в тысячах американских банках системы поддержки принятия решений (Decision System Support) со встроенной функциональностью Data Mining. Лишенные субъективной предвзятости, они опираются в своей работе только на историческую базу данных банка, где записывается детальная информация о каждом клиенте и, в конечном итоге, факт его кредитоспособности. Классификационные алгоритмы Data Mining обрабатывают эти данные и, полученные результаты, используются далее для принятия решений.

Страховой бизнес

В страховании, также как банковском деле и маркетинге, возникает задача обра-ботки больших объемов информации для определения типичных групп (профилей) клиентов. Эта информация используется для того, чтобы предлагать определенные услуги страхования с наименьшим для компании риском и, воз-можно, с пользой для клиента. Также, с помощью технологий Data Mining решается такая часто встречающаяся в страховании задача, как определение слу-чаев мошенничества(fraud detection).

Медицина и биология

В медицинских и биологических исследованиях, равно как и в практической медицине, спектр решаемых задач настолько широк, что возможно использование любых методологий Data Mining. Примером может служить построение диагностической системы или исследование эффективности хирургического вмешательства.

Другие области применения

Data Mining может применятся практически везде, где возникает задача автоматического анализа данных. В качестве примера, приведем такие популярные направления как анализ и последующая фильтрация спама, а также разработка, так называемых, виртуальных собеседников. Последнии, сейчас являются не более чем экзотическим дополнением к интерфейсу некоторых сайтов. Но предполагается, что в будущем они могут заменить собой call-центры компаний.





Выбрать язык

Ссылки
Третье издание
Второе издание