Учебные материалы для студентов

Здравоохранение, медицина


Здравоохранение, медицина



ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЗДРАВООХРАНЕНИИ


Введение

(Основы анализа данных. Модели «черного ящика». Основные этапы построения моделей. Методика анализа данных.)

Анализ информации является неотъемлемой частью ведения бизнеса и одним из самых важных фактором повышения его конкурентоспособности. При этом в подавляющем числе случаев все сводится к применению одних и тех же базовых механизмов анализа. Они являются универсальными и применимы к любой предметной области.

Основой для анализа данных служит моделирование. Построение моделей позволяет обнаруживать зависимости, извлекать новые знания, прогнозировать, управлять и решать множество других задач.

Как правило, модели сложных экономических систем представляют собой модель «черного ящика». Графически это выглядит следующим образом:

Система представляется в виде прямоугольника с множеством входных и выходных переменных, внутреннее устройство которого скрыто от исследователя, а чаще всего неизвестно.

Перед построением модели следует определить задачу, которую следует решить, например, задачу прогнозирования, классификации, поиска ассоциативных правил и т.д. (или комплекс задач).

Процесс построения модели схематично выглядит следующим образом:

Когда речь идет о систематизации данных, часто всплывает вопрос о точности будущей модели. Так как процесс построения модели носит итерационный характер, в процессе которого она корректируется и уточняется, то на первых этапах не имеет смысла требовать высокую точность. Главное, чтобы модель была бы адекватной (пусть даже грубой). Адекватность означает, что при построении модели исследователь учел наиболее важные, существенные факторы, влияющие на конечный результат. Можно утверждать, что с ростом количества факторов увеличивается сложность модели.

Основным этапом моделирования является непосредственно поиск самой модели, которая объясняла бы имеющиеся данные. Существует огромное количество моделей систем, в том числе и экономических. Однако, на практике они не применимы. Нередко возникают ситуации, когда трудно сделать хоть какие то предположения. В результате аналитик вынужден использовать различные эвристические предположения или воспользоваться мнением специалистов предметных областей, или экспертов. Логично, что может возникнуть не одна, а несколько моделей. В этом случае выбирается модель наиболее адекватная решаемой задаче.

Таким образом, во-первых, универсальных моделей нет, а, во-вторых, сложность модели не гарантирует ее точность. Мастерство исследователя заключается в том, чтобы найти компромисс между простотой, прозрачностью с одной стороны и приемлемым качеством результатов с другой.

Современные информационные технологии анализа данных и моделирования экономических систем рассмотрим в рамках аналитической платформы Deductor.