Реферат - Диков Андрій Вікторович - Розробка комп'ютерної системи прогнозування ускладнень на прикладі ускладнень новонароджених при пологах у хворих на цукровий діабет

  1. Реферат за темою випускної роботи зміст
  2. 1. Актуальність
  3. 2. Мета і завдання дослідження
  4. 3. Огляд методів прогнозування
  5. 4. Побудова дерева рішення для прогнозування ускладнень
  6. 4.1 Постановка завдання
  7. 4.2 Математична модель
  8. 4.3 Реалізація та результати
  9. висновки
  10. Список джерел

Реферат за темою випускної роботи

зміст

Вступ

Цукровий діабет - захворювання, в патогенезі якого лежить абсолютний або відносний недолік інсуліну в організмі, що викликає порушення обміну речовин і патологічні зміни в різних органах і тканинах [ 1 ].

В даний час чітко простежується тенденція до збільшення числа вагітних хворих на цукровий діабет. За даними спеціалізованих установ, число пологів у жінок з цукровим діабетом з року в рік зростає. Частота пологів при цукровому діабеті становить 1-3% від загального числа пологів. Існує думка, що з 100 вагітних жінок приблизно у 2-3 є порушення вуглеводного обміну [ 2 ].

Проблема цукрового діабету і вагітності знаходиться в центрі уваги акушерів-гінекологів, ендокринологів та неонатологів, так як при цій патології виникає велике число акушерських ускладнень, відзначаються висока перинатальна захворюваність і смертність і несприятливі наслідки для здоров'я матері і потомства [ 3 ]. Тому дана робота дозволить, спрогнозувавши ускладнення новонароджених, застосувати відповідні заходи спрямовані на запобігання даних ускладнень.

1. Актуальність

Актуальність даної теми полягає в тому, що цукровий діабет при вагітності залишається однією з найважливіших проблем в сучасному акушерстві, так як ця патологія пов'язана з великим числом акушерських ускладнень, високою перинатальною захворюваністю і смертністю, і несприятливими наслідками для здоров'я матері і дитини. При вирішенні задачі прогнозування ускладнень новонароджених у хворих на цукровий діабет з'явиться можливість здійснювати прогнозування на етапі вагітності, де на основі отриманих ускладнень новонародженого лікар зможе виробляти оптимальний вибір напрямку лікування або плану профілактичних заходів для вагітної.

2. Мета і завдання дослідження

Метою досліджень є розробка методики складання якісних прогнозів, які забезпечують високу точність прогнозування ускладнення новонародженого у хворих на цукровий діабет. Прогнози ґрунтуються на історії пацієнтів пройшли вже вагітність і будуються з використанням оптимальних математичних алгоритмів.

Основні завдання дослідження:

  1. Дослідити методи прогнозування;
  2. Вибрати відповідний метод для отримання якісного прогнозу ускладнень новонароджених;
  3. Вивчити параметри вхідних даних і їх вплив на результат;
  4. Реалізувати обраний метод.

Об'єкт дослідження: предметна область пов'язана з прогнозуванням ускладнень «на прикладі ускладнень новонароджених при пологах у хворих на цукровий діабет».

Предмет дослідження: методи прогнозування.

3. Огляд методів прогнозування

На сучасному етапі розвитку існує безліч методів, моделей, алгоритмів і пакетів вже готових прикладних програм дозволяють здійснювати прогнозування з заданою точністю. Розглянемо основні з них:

Нечітка логіка. Більшість методів прогнозування не дають можливості працювати з якісними показниками, в той час як теорія нечіткої логіки надає зручний інструментарій для подачі експертно встановлених правил розвитку в математичній формі, забезпечує автоматичне налагодження параметрів моделі з урахуванням кількісних і якісних показників [ 4 ]. Основними недоліками нечіткої логіки є:

  • відсутність стандартної методики конструювання нечітких систем;
  • неможливість математичного аналізу нечітких систем існуючими методами.

Дерево прийняття рішень. Використовується в області статистики та аналізу даних для прогнозних моделей. Структура дерева являє собою наступне: «листя» і «гілки». На ребрах ( «гілках») дерева рішення записані атрибути, від яких залежить цільова функція, в «листі» записані значення цільової функції, а в інших вузлах - атрибути, за якими розрізняються випадки. Щоб класифікувати новий випадок, треба спуститися по дереву до листа і видати відповідне значення. Подібні дерева рішень широко використовуються в інтелектуальному аналізі даних [ 5 ].

переваги:

  • Дозволяє оцінити модель за допомогою статистичних тестів. Це дає можливість оцінити надійність моделі.
  • Є надійним методом. Метод добре працює навіть в тому випадку, якщо були порушені початкові припущення, включені в модель.
  • Дозволяє працювати з великим об'ємом інформації без спеціальних підготовчих процедур. Даний метод не вимагає спеціального обладнання для роботи з великими базами даних.

недоліки:

  • Проблема отримання оптимального дерева рішень є неповною з точки зору деяких аспектів оптимальності навіть для простих завдань. Таким чином, практичне застосування алгоритму дерев рішень засноване на евристичних алгоритмах, таких як алгоритм «жадібності», де єдино оптимальне рішення вибирається локально в кожному вузлі. Такі алгоритми не можуть забезпечити оптимальність всього дерева в цілому.
  • Для даних, які включають категоріальні змінні з великим набором рівнів, більший інформаційний вага присвоюється тим атрибутам, які мають більшу кількість рівнів.

Регресійний аналіз. Застосовується переважно в середньостроковому прогнозуванні, а також в довгостроковому прогнозуванні. Середній і довгостроковий періоди дають можливість встановлення змін в середовищі бізнесу та обліку впливів цих змін на досліджуваний показник [ 6 ]. Найпростішим варіантом регресійній моделі є лінійна регресія. Цей варіант найчастіше використовується на практиці в силу своєї простоти. Основним недоліком нелінійних регресійних моделей є складність визначення виду функціональної залежності, а також трудомісткість визначення параметрів моделі. До недоліків також можна віднести те, що, як показує практика, більшість залежностей в прогнозуванні є нелінійними, що робить використання даного методу недоцільним.

Генетичні алгоритми (genetic algorithm, GA). Часто застосовується для вирішення завдань оптимізації, а також пошукових завдань. Однак деякі модифікації GA дозволяють вирішувати завдання прогнозування [ 7 ]. Алгоритм прогнозування на основі GA дозволяє приділити належну увагу більше 15 зовнішніх факторів, використовуючи базовий GA. До основних переваг генетичних алгоритмів можна віднести:

  • можливість використання для широкого класу задач;
  • простата і прозорість в реалізації;
  • можуть бути використані в задачах з змінюється середовищем.

До недоліків генетичних алгоритмів відносять такі:

  • НЕ гарантується виявлення глобального рішення за прийнятний час;
  • не гарантують і того, що знайдене рішення буде оптимальним;
  • у випадках, коли це може стати вирішеною спеціально розробленим для неї методом, практично завжди такі методи будуть ефективніше генетичних алгоритмів, як по швидкодії, так і по точності знайдених рішень.

Нейронні мережі. З огляду на недоліки попередніх моделей, найбільш підходящими для прогнозування ускладнень новонародженого будуть нейронні мережі [ 8 ].

Здібності нейронної мережі до прогнозування безпосередньо випливають з її здатності до узагальнення і виділення прихованих залежностей між вхідними та вихідними даними. Після навчання мережа здатна передбачити майбутнє значення якоїсь послідовності на основі декількох попередніх значень і (або) якихось існуючих зараз чинників. Слід зазначити, що прогнозування можливо тільки тоді, коли попередні зміни дійсно в якійсь мірі визначають майбутні. Зазвичай при прогнозуванні використовуються багатошарові, найчастіше тришарові, нейронні мережі прямого поширення. Виглядає така мережа в такий спосіб. Якщо нам потрібен один вихід, то мережа має структуру, представлену на рис. 1.

Малюнок 1 - Структура тришарової нейронної мережі (анімація: 7 кадрів, 25 циклів повторення, 141 кілобайт)

Основними достоїнствами нейронних мереж є:

  • нелінійність. Нейронні мережі дозволяють отримати нелінійну залежність вихідного сигналу від вхідного;
  • адаптивність. Нейронні мережі мають здатність адаптувати свої синаптичні ваги до змін навколишнього середовища. Більш того, для роботи в нестаціонарному середовищі (де статистика змінюється з часом) можуть бути створені нейронні мережі, що змінюють синаптичні ваги в реальному часі;
  • відмовостійкість. Нейронні мережі, реалізовані на основі електронних компонентів, потенційно відмовостійкості, так як контекстна інформація розподілена по всьому зв'язків нейронної мережі.

Основний недолік нейронних мереж полягає в тому, що розробнику, недоступно те, що відбувається всередині мережі [ 9 ]. Він формуємо входи, після цього розраховує виходи і просто зіставляє одне з іншим. Немає можливості детально і покроково простежити те, як отримані на виході значення були розраховані. Цей режим виконання обчислень в «чорному ящику» надзвичайно ускладнює процес інтерпретації результатів і модифікації мережі - неясно, що в ній потрібно змінити, щоб стало точніше.

4. Побудова дерева рішення для прогнозування ускладнень

В даний час проблема організації збору, обробки та аналізу інформації, отриманої в процесі медичної діяльності, є однією з найбільш актуальних і невирішених проблем. Медичні працівники в процесі своєї діяльності значну частину робочого часу присвячують збору, обробки та аналізу медичної інформації, а також діагностики, прогнозування, вибору оптимального шляху лікування або плану профілактичних заходів. Для обробки і аналізу інформації в даному випадку доцільно використовувати дерева рішень, що представляють собою інтелектуальні моделі. Такі моделі мають високі узагальнюючими здібностями і добре інтерпретуються людьми-фахівцями в прикладних областях, які, як правило, не знайомі з методами і моделями штучного інтелекту. При вирішенні задачі прогнозування ускладнень новонароджених у хворих на цукровий діабет за допомогою дерева рішень з'явиться можливість здійснювати прогнозування на етапі вагітності, на основі отриманих передбачуваних ускладнень новонародженого лікар зможе виробляти оптимальний вибір напрямку лікування або плану профілактичних заходів для вагітної.

4.1 Постановка завдання

Для навчання моделі ми будемо використовувати реальні медичні дані, отримані при обстеженні вагітних жінок, які хворіють на цукровий діабет. Ці дані будуть нашим безліччю об'єктів:

де де   - досліджуваний об'єкт, тобто, вагітна жінка - досліджуваний об'єкт, тобто, вагітна жінка. Кожен об'єкт характеризується набором змінних:

де де   - незалежні змінні, значення яких відомі і на підставі яких визначається значення залежної змінної - незалежні змінні, значення яких відомі і на підставі яких визначається значення залежної змінної .

Кожна змінна xh може приймати значення з деякого безлічі:

В даному прикладі незалежними змінними є параметри отримані при обстеженні вагітних жінок, частково представлені в табл. 1.

Таблиця 1. Назва параметрів і діапазон їх значень характеризують вагітну

№ Назва параметра Діапазон 1 Вік [16; 50] 2 Вага [50; 150] 3 Добова доза інсуліну [30; 90] 4 СД хворіє з віку [1; 50] 5 Форма (важка (3), середня (2), легка (1)) 1,2,3 6 Вагітність №, [1; 10] 7 Пологи № [1; 10]

залежна змінна залежна змінна   в нашому випадку представляє можливі ускладнення новонародженого, які необхідно визначати в нашому випадку представляє можливі ускладнення новонародженого, які необхідно визначати.

Кодування даних. Кодування даних нам знадобиться для того, щоб закодувати залежну змінну Кодування даних , Так як новонароджена дитина при народженні може мати відразу кілька діагнозів ускладнень. Для цього змінну представимо в двійковому коді, де кожен біт буде відповідати певному діагнозу. Перелік всіх діагнозів новонародженого і відповідний йому номер біта представлений в таблиці 2.

Таблиця 2. Назви діагнозів новонародженого і відповідний їм номер біта

Назва діагнозу Номер біта Пупкова грижа 1 бронхопневмания 2 Морфо-функціональна незрілість 3 НГЛД 4 Великий до терміну гестації 5 Жовтуха, 6 Перинатальне гіпонсіческі-ішемічне ураження ЦНС 7 Вроджена розсіювання ателектази легенів 8 Д / фетопатія 9 Мертвий дитина 10 Немає ускладнень 11

Для прикладу, якщо у дитини будуть діагнози: д / фетопатія, перинатальне гіпонсіческі-ішемічне ураження ЦНС і бронхопневмания, то змінна Y дорівнюватиме 00101000010

4.2 Математична модель

Для побудови дерева рішення розглянемо метод С4.5 [ 10 - 11 ]. Загальний принцип побудови дерева рішень, полягає в рекурсивном розбитті множини об'єктів з навчальної вибірки на підмножини, що містять об'єкти, які стосуються однаковим класах.

Для вибору атрибута розбиття С4.5 використовує критерій, званий ставленням приросту інформації. Цей критерій дозволяє оцінити частку інформації, отриманої при розбитті, яка є корисною, тобто сприяє поліпшенню класифікації:

де

вираз

називається приростом інформації. Сама ж ентропія вузла дерева рішень визначається формулою:

і являє собою суму всіх ймовірностей появи прикладів, що відносяться до певного класу, помножену на логарифм цієї ймовірності.

Ентропія розбиття - це сума ентропії всіх вузлів, помножених на частку записів кожного вузла в числі записів вихідного безлічі:

Вибирається атрибут, який максимізує вираз (4), тобто він забезпечить найкращу розбивку, і буде використаний для розбивки в результаті чого будуть створені дочірні вузли. До отриманих підмножини застосовуємо такий же підхід знаходження оптимального атрибута і продовжуємо рекурсивно процес побудови дерева, до тих пір, поки в вузлі не опиняться приклади з одного класу.

4.3 Реалізація та результати

На основі даного методу було розроблено програмне забезпечення для побудови дерева рішень по заданій вибірці даних.

За допомогою розробленого програмного забезпечення вирішувалася описана вище завдання з прогнозування ускладнень новонароджених, у вагітних хворіють на цукровий діабет. На рис. 1 наведено побудоване дерево рішень для прогнозування ускладнень новонародженого.

Малюнок 2 - Побудоване дерево рішень

Як видно, в процесі побудови дерева були виділені найбільш інформативні дані про вагітну, хвору на цукровий діабет, що впливають на діагнози новонародженого.

Помилка класифікації по побудованій дереву рішень, обчислена за даними тестової вибірки, знаходиться в межах 4-6%.

висновки

В ході проведення досліджень були розглянуті основні методи і моделі для прогнозування ускладнень новонароджених у вагітних хворіють на цукровий діабет. Виділивши недоліки кожного з методів, було прийнято рішення використовувати нейронні мережі для вирішення поставленого завдання. Надалі доцільно буде використовувати не один, а комбінацію декількох методів, що дозволить домогтися кращих результатів.

При написанні даного реферату магістерська робота ще не завершена. Остаточне завершення: зима 2014-2015 рр. Повний текст роботи та матеріали по темі можуть бути отримані у автора або його керівника після зазначеної дати.

Список джерел

  1. І.М.Грязнова, В.Г.Второва "Цукровий діабет і вагітність" Медицина, 1985р.
  2. АФП як прогностичний показник стану новонародженого / Алексєєва М.Л., ПУСТОТІН О.А., Фанченко Н.Д., Понкратова Т.С. // Проблеми репродукції. - 2005. - № 5. - С. 79-82.
  3. Ведмідь AA Особливості перебігу вагітності, пологів і стану новонароджених у пацієнток з гестаційним цукровим діабетом /А.А.Ведмедь, Е.В.Шапошнікова "// Вісник Російського університету дружби народів. 2009.
  4. В.В.Круглов, М.І.Длі, Р.Ю.Голунов. Нечітка логіка і штучні нейронні мережі -М .: ФИЗМАТЛИТ, 2000.-224 с.
  5. Вільна енциклопедія «Вікіпедія» - Дерево прийняття рішень [Електронний ресурс]. - Режим доступу: Посилання .
  6. Гаррі Сміт, Норман Дрейпер. Прикладний регресійний аналіз -К .: Діалектика, 2007.-912 с.
  7. Г.К.Вороновскій, К.В.Махотіло, С.Н.Петрашев, С.А.Сергеев. Генетичні алгоритми, штучні нейронні мережі і проблеми віртуальної реальності -Харків: Основа, 1997.-107с.
  8. Вільна енциклопедія «Вікіпедія» - Нейронні мережі [Електронний ресурс]. - Режим доступу: Посилання .
  9. С. Хайкін.Нейронние сеті.Полний курс. 2-е изд., Испр.: Пер. з англ. -М .: ТОВ «І.Д.Вільямс», 2006.-1104 с.
  10. Classification and regression trees / L. Breiman, JH Friedman, RA Olshen, CJ Stone. - California: Wadsworth & Brooks, 1984. - 368 p.
  11. Rokach L. Data Mining with Decision Trees. Theory and Applications / L. Rokach, O. Maimon. - London: World Scientific Publishing Co, 2008. - 264 p.