Вы здесь

Анализ данных медицинских информационных систем.

_Title Анализ данных медицинских информационных систем.
_Author
_Keywords

Аннотация
Анализ данных, накапливаемых в медицинских информационных системах, зачастую невозможен из-за неформализованности хранящейся в них информации. Если же экспорт данных реализуется в стандартных форматах, то открываются возможности применения профессиональных средств анализа данных – статистических пакетов, нейросетевых пакетов и др. Приводится аннотация книги О.Ю. Ребровой «Статистический анализ медицинских данных».

ANALYSIS OF DATA OF MEDICAL INFORMATION SYSTEMS
Rebrova Olga Yurievna (olga@neurology.ru)
Institute of Neurology, Moscow

Abstract
Analysis of data which are accumulated in hospital information systems concerning patients is impossible because of non-formalized information in most of fields of databases. However if export of data in standard formats is provided then the professional software for data analysis including statistical methods, artificial neural networks, data mining and knowledge discovery can be carried out. The annotation of the book “Statistical analysis of medical data” is presented.

Большинство разрабатываемых в настоящее время медицинских информационных систем, в том числе больничных информационных систем, предусматривающих хранение данных о пациентах, не содержат полностью формализованной информации, допуская в значительной части полей ввод свободного текста. Анализ информации, накопленной в такого рода информационных системах является весьма ограниченным, то есть возможен лишь в отношении формализованных полей. Данное ограничение является принципиальным при решении вопроса о приобретении программных продуктов, в частности в научных медицинских учреждениях, где применяются профессиональные средства анализа данных – например, статистический анализ, нейросетевые методы, технологии выявления скрытых закономерностей (data mining, knowledge discovery).

В связи с указанными обстоятельствами необходимо подчеркнуть, что все современные пакеты прикладных программ для анализа данных предусматривают обмен данными (как импорт, так и экспорт) в распространенных форматах – dbf, xls, txt и др. Одним из таких пакетов является система статистического анализа данных STATISTICA.

Для врачей-исследователей в 2002 г. нами издана книга «Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA» - руководство по применению статистических методов в клинических и эпидемиологических исследованиях. Изложенные принципы применения статистических методов универсальны и могут применяться при использовании любых пакетов статистических программ.

Для читателей-медиков и биологов знание основ математической статистики является желательным, но не обязательным. Тем же, кто знаком с основами статистики, книга поможет освоить технологию анализа данных с использованием пакета STATISTICA. Книга снабжена указателем литературы, поэтому при желании глубже освоить те или иные методы статистики читатель может воспользоваться им для поиска необходимой литературы.

Довольно широко распространено мнение, что анализ данных в биологических экспериментальных исследованиях проводить не требуется: «если требуется анализ данных, то это значит, что сам эксперимент плох» (в смысле того, что фиксируемый эффект незначителен). Однако применение статистики в медицинских и биологических исследованиях не ограничивается анализом данных. Очень важно применить статистику на этапе планирования биологического эксперимента или медицинского исследования. Мы придерживаемся мнения, что и в биологическом эксперименте для анализа данных необходимо применение статистики, в противном случае выводы нельзя считать научно доказанными.

Медицинские клинические исследования намного более сложны по сравнению с биологическими экспериментами: во-первых, на человеке эксперимент возможен лишь в ограниченных рамках, поэтому возможности задания необходимых условий исследования существенно ограничены; во-вторых, фиксируемые эффекты обычно невелики (не превышают 20%); в-третьих, выборки гораздо менее однородны. Именно поэтому в клинических исследованиях статистический анализ данных значительно более сложен и трудоемок.

В настоящее время становятся все более актуальными корректное применение статистических методов, научный подход к планированию медицинских исследований. Это связано с развитием доказательной медицины (evidence-based medicine), постепенной интеграцией отечественной науки в мировую, развитием грантовой системы поддержки науки и, следовательно, с повышением требований к методической стороне исследований.

Основной целью применения статистических методов является минимизация случайных ошибок в научном исследовании. При этом могут решаться следующие основные задачи:
- планирование объемов выборок (как для выдвижения, так и для проверки научных гипотез);
- выдвижение научных гипотез (в т.ч. изучение структуры наблюдений, изучение структуры признаков, визуализация данных и результатов их анализа, построение моделей явлений, проверка статистических гипотез);
- проверка научных гипотез путем проверки статистических гипотез.

В данном издании мы постарались осветить решение перечисленных основных задач с применением статистических методов.

В первой главе излагаются основные понятия доказательной медицины и клинической эпидемиологии, использование принципов которых при проведении исследований становится в мировой медицинской науке и практике все более значимым. Показана роль статистического анализа при планировании исследования и обработке его результатов.

В последующих главах изложены основные подходы к подготовке и статистическому анализу данных, а также преставлению результатов. Изложение построено в соответствии с последовательностью, которой рекомендуется придерживаться при анализе данных оригинальных исследований. Подробно описаны методы анализа, которые наиболее часто рекомендуется применять в медицинских исследованиях. Приводятся примеры. Даны пояснения по содержанию интерфейсных окон пакета STATISTICA.

Кратко описаны методы многофакторного статистического анализа, которые являются более сложными и должны, по мнению автора, использоваться только специалистами в области медицинской статистики. Однако знание возможностей многомерных методов необходимо каждому исследователю, работающему в медицинской науке.

Необходимо подчеркнуть, что в данном издании не освещен весь широкий спектр статистических методов пакета STATISTICA, а описаны подробно лишь основные, наиболее важные способы анализа данных клинических исследований.

Выбор ППП STATISTICA для иллюстрации методов анализа данных связан с широким распространением этого пакета в России, его достаточными возможностями для решения основных задач медицинских исследований, выпуском в 1999 г. локализованной русскоязычной версии пакета российским отделением компании «StatSoft-Russia». Изложение построено в предположении, что читатель обладает по крайней мере минимальным опытом работы в среде Windows. В связи с тем, что в России также широко распространена оригинальная англоязычная версия пакета STATISTICA, в тексте приведены англоязычные аналоги большинства терминов и понятий.

Книга является обобщением опыта автора в области статистического анализа данных научных исследований в области клинической медицины. Издание рассчитано на проводящих научные исследования медиков и биологов, аспирантов и студентов, заинтересованных в освоении методов применения статистики в научных исследованиях.

Таким образом, хотелось бы еще раз подчеркнуть, что преодоление разработчиками медицинских информационных систем проблем интегрируемости их продуктов с программными продуктами для анализа данных с нашей точки зрения в значительной степени может повысить конкурентноспособность их разработок и эффективность применения таких систем.