18-29-03131 Разработка технологии хранения и обработки больших массивов слабоструктурированных биомедицинских данных

Авторы ВВГУ:
Шахгельдян Карина Иосифовна
Грибова Валерия Викторовна

Уровень проекта: Федеральные (РФФИ, НФПК, РГНФ)

Направление: Программная реализация интеллектуальных систем

Финансирование: РФФИ

Начало проекта: 06.07.2018

Окончание проекта: 02.07.2021

Цель проекта:

Целью проекта является создание комплексной технологии интеллектуальной обработки и хранения гетерогенных биомедицинских данных, результатов их формализации, структурирования и обработки, а также необходимой для этого дополнительной информации в форме онтологий и баз знаний, шаблонов статистических отчетов и др. Для достижения этой цели необходимо решить следующие задачи:
1. разработать концепцию и модель единого гетерогенного хранилища данных медицинской статистики и клинических исследований, моделей, алгоритмов обработки и форм представления результатов, а также онтологий и баз знаний, необходимых для формализации текстов историй болезни и создания медицинских экспертных систем;
2. разработать интерфейсы взаимодействия с хранилищем, обеспечивающие импорт и извлечение данных для их дальнейшей обработки методами математической статистики, машинного обучения и искусственного интеллекта, а также сохранение результатов анализа в форме моделей, алгоритмов, представлений данных и др.;
3. разработать онтологии медицинской терминологии, заболеваний и их симптомов, наполнить соответствующие базы знаний по нескольким направлениям клинической медицины (нейрохирургия, гастроэнтерология, онкология, кардиология, пульмонология);
4. разработать методы и алгоритмы формализации клинических данных с целью их структурирования и обеспечения возможности дальнейшей обработки методами математической статистики, машинного обучения и искусственного интеллекта;
5. выполнить апробацию методов формализации историй болезни в нескольких областях клинической медицины (нейрохирургия, гастроэнтерология, онкология, кардиология, пульмонология); 
6. разработать методы повышения качества статистических данных, описывающих систему регионального здравоохранения и его эффективность;
7. разработать сервисы, обеспечивающие формирование баз знаний, шаблонов грамматик, загрузку и обработку исходных клинических данных, извлечение формальных параметров, сохранение результатов обработки в хранилище;
8. используя модели и алгоритмы обработки, хранящиеся в репозитории, разработать сервисы для врачей, обеспечивающие возможность прогнозирования клинического течения заболеваний, оценки рисков развития осложнений, эффективности проводимой терапии.



Результат:

Проект направлен на развитие технологий формализации, структурирования и хранения медико-популяционных и клинических данных, результатов их обработки и необходимой для этого дополнительной информации в форме онтологий и баз знаний.