04. 10. 10 Лекция, Анализ Данных




Скачать 32.91 Kb.
Название04. 10. 10 Лекция, Анализ Данных
Дата публикации23.03.2013
Размер32.91 Kb.
ТипЛекция
odtdocs.ru > Маркетинг > Лекция
(04.10.10) Лекция, Анализ Данных.
Поиск ассоциативных правил.

Пример: товары.
Применается:
Розничная торговля:

  • определение товаров, которые стоит выдвигать совместно,

  • выбор местоположения товара в магазине,

  • анализ потребительской корзины,

  • прогназируемый спрос.


Перекрёстные продажи:

  • если потребитель купил товары а б в, то какие из них купят товар г.


Маркетинг:

  • поиск рыночных сегментов,

  • тенденций покупательского поведения,

  • сегментация клиентов,

  • выявление общих характеристик компании,

  • выделение общих групп покупателей,

  • оформление каталогов,

  • анализ сбытовых компаний фирмы.


Пример:


TID

Покупки

100

Хлеб, молоко, печенье

200

Молоко, сметана

300

Молоко, хлеб, сметана, печенье

400

Колбаса, сметана

500

Хлеб, молоко, печенье, сметана

600

Конфеты, хамон


Хлеб – a

Молоко – b

Печенье – c

Сметана – d

Колбаса – e

Хамон – z

Конфеты – f
Поиск частых наборов в большом множестве наборов.

Частые наборов – товары, которые покупают вместе.
Supp {a, b, c} = 3/6 * 100% = 50%

Supp_min – минимальная поддержка.

Человек, который покупает краску с вероятностью в 50% купит ещё и кисточку.

Из события А следует событие Б.
Достоверность – вероятность одного с другим.
Conf {b,c} = 3 * 100% / 4 = 75%
Apriori

2 фазы работы:

  1. Формирование кандидатов.

  2. Подсчёт поддержки кандидатов.


Набор Supp

{a} 3

{b} 4

{c} 3

{d} 4

-------------------

{e} 1

{f} 1

{z} 1

{a, b} 3

{a, c} 3

{a, d} 2

{b, c} 3

{b, d} 3

{c, d} 2
Сливать можно только те наборы, у которых все наборы элементов, кроме последнего могут совпадать. Порядок.
{a, b, c} 3

{b, c, d} 2
Итог: {a, b, c}
Формирование более длинных цепочек: для формирования k-элементных наборов кандидатов берутся k-1 наборы, полученные на предыдущем шаге. Новый кандидат будет формироваться путём добавления к k-1 элементному набора p к другому k-1 элементному набору q. Добавляется последний элемент набора q, который по порядку выше, чем последний элемент набора p. При этом все k-2 элемента обоих наборов одинаковы.
Поддержка любого набора объектов не может превышать поддержки любого их его подмножеств.
[a] [b] [c] [d]

[ab] [ac] [bc] [cd] [bd]

[abc] [abd] [bcd]

[abcd]
Сиквентенциальный анализ (поиск последовательностей).
Поиск взаимосвязей событий во сремени.

Если человек купил товар А и через какой время человек придёт за товаром Б.


ID Покупателя

Время

ID Товаров

1

08/23/10

30

1

08/23/10

90

2

08/18/10

10.2

2

21

30

2

27

40, 60, 70

3

15

30, 50, 70

4

8

30

4

16

40, 70,

4

25

90

5

20

90


Поддержка последовательностей – отношение числа покупателей, у которых присутствует данная последовательность к общему количеству людей.
Apriori ALL
Фаза сортировки

Фаза отбора кандидатов

Фаза трансформации

Фаза генерации последовательностей

Фаза максимизации
GSP

MinGSP

MaxGSP
Таксономии

Добавить документ в свой блог или на сайт

Похожие:

Лекция №01 Введение в курс "Базы Данных"
Описание: Вводная лекция. Понятие данных. Предшественники баз данных. Назначение и основные компоненты среды базы данных. Системы...

Лабораторная работа №4 Тема: Создание и анализ баз данных в OpenOffice Calc
База данных – это упорядоченный набор данных. Обычно база данных состоит из строки заголовков (текст описания) и строк данных, которые...

Анализ заполнения баз данных аиас арм «Директор» в муниципальных...
В соответствии с приказом информационно-методического центра от 31. 10. 2011г. №52 «Об организации работы по консолидации баз данных...

Лекция №2 (19. 02. 10) Теперь «Узлы и блоки»
Функцией систем обработки данных состоят в выполнение требуемых операций. Исторически первые системы обработки данных были предназначены...

Лекция №1
Лекция № Общие принципы эффективной организации учебного процесса. Физиологиче­ская цена учебных нагрузок

Лекция №1
Лекция № Общие принципы эффективной организации учебного процесса. Физиологиче­ская цена учебных нагрузок

Лекция №1
Лекция № Общие принципы эффективной организации учебного процесса. Физиологиче­ская цена учебных нагрузок

Лекция №1
Лекция № Общие принципы эффективной организации учебного процесса. Физиологиче­ская цена учебных нагрузок

Лекция Введение. Бд это «Набор связанных данных»
Экзамен: 2 теоретических вопроса. Первый вопрос – базовый, ответить обязательно, тройка. Второй – посложнее

Лекция «Кэширование данных»
Иерархия запоминающих устройств (время доступа убывает, стоимость хранения 1 бита возрастает, объем убывает)

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
odtdocs.ru
Главная страница