АНАЛІЗ І ПРОГНОЗУВАННЯ ВІДТОКУ КЛІЄНТІВ СИСТЕМИ УПРАВЛІННЯ ПРОЕКТАМИ
Анотація
На основі даних системи управління проектами ПланФікс прогнозується відтік клієнтів після закінчення використання пробної версії сервісу. Прогнозування відтоку клієнтів - поширена задача машинного навчання, яке вирішується багатьма компаніями на основі аналізу власних даних, що не дозволяє використовувати для цих цілей готові програмні продукти. Описується алгоритм попередньої обробки даних, отриманих з бази даних MySQL, для отримання таблиці, що представляє собою «охайні дані», зручною для обробки методами машинного навчання, яка не містить зайвої інформації, а також пропущених значень. Зроблено відбір кількісних і бінарних ознак, значимо впливають на цільову змінну за допомогою статистичних критеріїв з поправками, призначеними для перевірки множинних гіпотез. Для вирішення поставленого завдання використовуються алгоритми класифікації, такі як логістична регресія, дерева рішень, випадковий ліс; показано, що кожен з цих алгоритмів добре справляється з поставленим завданням: за допомогою дерева рішень були відібрані найбільш значимі ознаки, які потім були параметрами для більш складних моделей; модель випадкового лісу найбільш точно дозволяє класифікувати клієнтів за цільовим ознакою, а логістична регресія дозволяє розрахувати ймовірності оформлення передплати для клієнтів, які використовують різні додаткові сервіси; проводиться порівняння отриманих моделей; вказані бінарні характеристики записів клієнтів, найбільш сильно впливають на шанси переходу клієнта на платний пакет після закінчення безкоштовного пробного періоду. Дано рекомендації щодо продовження досліджень, серед яких підбір найбільш ефективної форми моделі випадкового лісу для полегшення впровадження інтелектуального аналізу клієнтів в програмний продукт; попередня обробка і побудова моделей проводиться на мові програмування R.
