Скачать 32.91 Kb.
|
(04.10.10) Лекция, Анализ Данных. Поиск ассоциативных правил. Пример: товары. Применается: Розничная торговля:
Перекрёстные продажи:
Маркетинг:
Пример:
Хлеб – a Молоко – b Печенье – c Сметана – d Колбаса – e Хамон – z Конфеты – f Поиск частых наборов в большом множестве наборов. Частые наборов – товары, которые покупают вместе. Supp {a, b, c} = 3/6 * 100% = 50% Supp_min – минимальная поддержка. Человек, который покупает краску с вероятностью в 50% купит ещё и кисточку. Из события А следует событие Б. Достоверность – вероятность одного с другим. Conf {b,c} = 3 * 100% / 4 = 75% Apriori 2 фазы работы:
Набор Supp {a} 3 {b} 4 {c} 3 {d} 4 ------------------- {a, b} 3 {a, c} 3 {b, c} 3 {b, d} 3 Сливать можно только те наборы, у которых все наборы элементов, кроме последнего могут совпадать. Порядок. {a, b, c} 3 Итог: {a, b, c} Формирование более длинных цепочек: для формирования k-элементных наборов кандидатов берутся k-1 наборы, полученные на предыдущем шаге. Новый кандидат будет формироваться путём добавления к k-1 элементному набора p к другому k-1 элементному набору q. Добавляется последний элемент набора q, который по порядку выше, чем последний элемент набора p. При этом все k-2 элемента обоих наборов одинаковы. Поддержка любого набора объектов не может превышать поддержки любого их его подмножеств. [a] [b] [c] [d] [ab] [ac] [bc] [cd] [bd] [abc] [abd] [bcd] [abcd] Сиквентенциальный анализ (поиск последовательностей). Поиск взаимосвязей событий во сремени. Если человек купил товар А и через какой время человек придёт за товаром Б.
Поддержка последовательностей – отношение числа покупателей, у которых присутствует данная последовательность к общему количеству людей. Apriori ALL Фаза сортировки Фаза отбора кандидатов Фаза трансформации Фаза генерации последовательностей Фаза максимизации GSP MinGSP MaxGSP Таксономии |
![]() | Описание: Вводная лекция. Понятие данных. Предшественники баз данных. Назначение и основные компоненты среды базы данных. Системы... | ![]() | База данных – это упорядоченный набор данных. Обычно база данных состоит из строки заголовков (текст описания) и строк данных, которые... |
![]() | В соответствии с приказом информационно-методического центра от 31. 10. 2011г. №52 «Об организации работы по консолидации баз данных... | ![]() | Функцией систем обработки данных состоят в выполнение требуемых операций. Исторически первые системы обработки данных были предназначены... |
![]() | Лекция № Общие принципы эффективной организации учебного процесса. Физиологическая цена учебных нагрузок | ![]() | Лекция № Общие принципы эффективной организации учебного процесса. Физиологическая цена учебных нагрузок |
![]() | Лекция № Общие принципы эффективной организации учебного процесса. Физиологическая цена учебных нагрузок | ![]() | Лекция № Общие принципы эффективной организации учебного процесса. Физиологическая цена учебных нагрузок |
![]() | Экзамен: 2 теоретических вопроса. Первый вопрос – базовый, ответить обязательно, тройка. Второй – посложнее | ![]() | Иерархия запоминающих устройств (время доступа убывает, стоимость хранения 1 бита возрастает, объем убывает) |