Учебные материалы для студентов

Здравоохранение, медицина


Здравоохранение, медицина



ПРАКТИКУМ В DEDUCTOR


Рассмотрим на конкретных примерах использование некоторых методов визуального и интеллектуального анализа медицинских данных. В качестве инструментального средства мы будем использовать отечественную аналитическую платформу Deductor.

II.1. Лабораторная работа №1. Создание, наполнение, подключение хранилища данных

Создание хранилища данных

Для создания нового хранилища данных в Deductor необходимо выполнить следующие действия:

1. Открыть панель «Источники данных». (Меню Вид - Источники данных).

2. На дереве источников данных вызвать контекстное меню и выбрать последовательно команды Хранилище данных – Создать локальное хранилище данных. На экране появится диалоговое окно, в котором нужно задать имя, метку и расположение хранилища данных. Например, если у выполняющего задание фамилия Иванов, заполнить поля рекомендуется следующим образом:

Наполнение хранилища данных

Рассмотрим на примере базы данных Сеть розничных аптек.mdb, последовательность действий, необходимую для наполнения хранилища данных информацией.

База данных состоит из следующих связанных таблиц:

1. На панели «Сценарии» запустить Мастер импорта (кнопка или клавиша F6). На первом шаге мастера выбрать в качестве источника данных MS Access. На втором шаге – указать путь доступа к файлу базы данных Сеть розничных аптек.mdb и выбрать таблицу Группы. На третьем – нажать кнопку Пуск, затем Далее. На 4 и 5 - оставить принятые по умолчанию параметры и на шестом – указать имя узла – Импорт Групп. В результате в Deductor импортируются данные по группам товаров, представленные в форме таблицы.

2. Аналогичную процедуру повторить для импорта данных из таблиц Товары (имя узла – Импорт Товаров) и Приход (имя узла – Импорт Прихода товаров).

3. Так как процесс поступления товара не содержит ссылку на группу, к которой указанный товар относится, его архитектура не имеет форму «звезды». Измерение КодГруппы опосредованно (через измерение КодТовара) участвует в процессе поступления товара. Отсутствие измерения в процессе не позволит строить аналитические отчеты в разрезе групп товаров. Чтобы исправить это, на узле Импорт Прихода товаров нужно вызвать Мастер обработки (кнопка или клавиша F7). Выбрать команду Слияние, затем в качестве источника данных указать - MS Access, в качестве файла базы данных - Сеть розничных аптек.mdb и в качестве таблицы - Товары. При слиянии на шаге 6 мастера задать общие поля двух таблиц, которые называются измерениями. В нашем случае измерением служит поле КодТовара, фактом – поле КодГруппы.

После слияния к исходной таблице добавятся поля-факты (узел Слияние для создания звезды).

С помощью кнопок в нижней или правой части экрана можно увидеть результаты статистической обработки числовых данных.

4. Перед наполнением пустого хранилища нужно определиться, какие поля являются измерениями, а какие – фактами, какие таблицы представляют собой процессы. В нашем случае измерениями являются: КодПрихода, КодТовара, ОкончСрокаГодности, КодГруппы, причем только два измерения (КодТовара и КодГруппы) имеют свойства. КодТовара – свойства: КодГруппы, НаименованиеТовара, ЦенаЗакупки, ЦенаРеализации. КодГруппы – свойство НаименованиеГруппы). Фактом является поле – КоличествоПрих, а процессом – таблица на узле Слияние для создания звезды.

Загружать в ХД измерения отдельно вне процесса имеет смысл, если оно имеет свойства. При загрузке процесса измерение со свойствами загружается по его коду, а при загрузке измерения загружаются также и его свойства.

Для загрузки в ХД измерения КодГруппы выделить узел Импорт Групп и вызвать Мастер экспорта (кнопка или клавиша F8). В качестве источника выбрать Измерение и в списке доступных ХД указать Local_Warehouse_Ivanov. Первоначально никаких измерений нет. Для загрузки нового измерения следует либо дважды щелкнуть левой клавишей мыши на строке Создать новое измерение либо один раз – в правом углу этой строки. Появиться окно редактора измерений, в котором КодГруппы – измерение, а НаименованиеГруппы – свойство.

После стандартного прохождения всех этапов Мастера экспорта присвоить имя узлу – Экспорт в ХД измерения Группы.

5. Аналогичным образом экспортировать измерение КодТовара, которого сделать неиспользуемым свойство КодГруппы (чтобы исключить дублирование информации). Присвоить узлу имя Экспорт в ХД измерения Товары.

6. Данные из таблицы на узле Слияние для создания звезды загрузить в ХД в виде процесса с именем Процесс Прихода товара. Оставить в качестве факта поле КоличествоПрих, все остальные поля сделать измерениями.

На четвертом шаге Мастера экспорта можно указать измерение, по которому будет происходить удаление фактов при повторной загрузке. Например, указав в качестве такого измерения КодПрихода, из хранилища будут удалены все факты прихода, в случае, если такой же код имеется в источнике. Таким образом, достигается устранение дублирующих значений по какому-либо измерению. Присвоить узлу экспорта процесса имя Экспорт в ХД процесса Прихода товара.

В результате проделанных действий сценарий наполнения хранилища будет иметь следующий вид:

7. Сохранить проект (меню Файл – Сохранить). Указать в качестве имени фамилию исполнителя (например, Иванов.ded). На запрос «Сохранить источники данных?» ответить – нет (иначе при последующем открытии Deductor другим пользователем в качестве источника данных будет подключено ваше ХД).

Подключение хранилища данных

1. Загрузить Ваш файл-проект в Deductor.

2. Открыть панель «Источники данных». (Меню Вид - Источники данных). Если список подключенных ХД не пуст, удалить «чужие» ХД.

3. На дереве источников данных вызвать контекстное меню и выбрать последовательно команды Хранилище данных – Подключить локальное хранилище данных. На экране появится диалоговое окно, аналогичное окну для создания ХД, в котором нужно задать имя, метку и расположение хранилища данных.