Аналіз, моделювання та прогнозування епідеміологічних процесів
Завантажити презентаціюПрезентація по слайдам:
Національний технічний університет України «КПІ» ННК “Інститут прикладного системного аналізу” Магістерська дисертація тема: “Аналіз, моделювання та прогнозування епідеміологічних процесів” Виконав: студент гр. КА-46м Колбасюк Дмитро Анатолійович Науковий керівник: к.т.н., м.н.с. асистент каф. ММСА ННК ІПСА О.М. Терентьєв Київ 2010
ПОСТАНОВКА ЗАДАЧІ ДОСЛІДЖЕННЯ Огляд та аналіз існуючих найбільш відомих програм та пакетів призначених для аналізу, моделювання та адаптивного короткострокового прогнозування часових наборів даних. Аналіз існуючих математичних методів та підходів прогнозування. Розробка архітектури СППР для аналізу, моделювання та прогнозування епідеміологічних процесів. Реалізація методів адаптивного короткострокового прогнозування таких як: Хольта, Тейла-Вейджа, Брауна, Бокса-Дженкінса та Вінтерса; методів експоненційного згладжування, множинної регресії та подібних траєкторій – у вигляді програмних модулів для комп’ютерної програми. Апробація розробленої програми на реальних статистичних даних.
Актуальність проблеми Невтішні факти: Щороку у світі різні типи хвороб реєструються більш ніж у 2 млрд. людей. У 16 з 51 млн. людей, які щорічно помирають у світі, вони є причиною смерті. Особливо від епідемій страждають діти. Серед приблизно 10 млн. щорічно помираючих дітей у більш ніж половині випадків винні інфекції. Епідемія – значне поширення будь-якої інфекційної хвороби, яке перевищує звичайний для даної місцевості рівень захворюваності.
Епідеміологія : історія виникнення Основоположником науки епідеміології вважається Гіппократ. Близько 2400 років тому, під словом «епідемія» розуміли масові захворювання серед людей, які могли включати хвороби інфекційної і неінфекційної природи. У 1920 р. в Одесі (Новоросійський університет) була створена перша в світі кафедра епідеміології. Її організатор - видатний вчений і активний практичний діяч Д. К. Заболотний, який перший створив підручник з епідеміології і започаткував школу вітчизняних епідеміологів. Гиппократ (460—370 до н. э.) Заболотний Данило Кирилович (1866—1929)
Класифікація процесів епідеміології Інфекційні хвороби викликаються певним живим збудником, передаються від хворого організму здоровому і можуть спричинити епідемії.
Перелік основних методів та моделей прогнозування Методи регресійного аналізу : АР – моделі з авторегресійною складовою; АРКС – авторегресійні моделі з ковзним середнім; моделі у вигляді тренду; АРІКС моделі; ARMAX –моделі. множинна регресія. Методи адаптивного прогнозування : експоненційне згладжування; моделі лінійного росту: Хольта; Брауна; Тейла-Вейджа; Бокса-Дженкінса; сезонні моделі Вінтерса. Інші математичні методи та розробки: Подібні траєкторії. Відомі пакетні програми для прогнозування: MatLab Statistic Toolbox; Eviews 6 SPSS 16 MS Exel 2003/07 SAS + власна програма «Alpha»
Математичні методи для побудови моделей і прогнозування . 1. Метод експоненційного згладжування Метод “пошуку по сітці значень” альфа 1. Область зміни параметра альфа розбивається з кроком 0.1 на підмножину: [0; 0.1; 0.2; …; 1.9; 2]. 2. Обирається початкове наближення: So=x1. 3. Для кожного значення aльфа за методом експоненційного згладжування обчислюється прогноз для навчальних даних. 4. По обчисленим значення прогнозу та реальним даним з навчальної вибірки обчислюється значення середньої квадратичної похибки. 5. Обирається альфа, для якого значення середньої квадратичної похибки найменше. Формула виглядає так:
Математичні методи для побудови моделей і прогнозування . 2. Моделі лінійного росту Структура моделей: Моделі лінійного росту розроблені для випадку, коли моделі мають тенденції лінійного росту. Загальне рівняння для моделей такого типу виглядає так: Визначення початкових умов: Підхід №1 Підхід №3
Математичні методи для побудови моделей і прогнозування . 2.1 Модель Хольта Параметри адаптації: 2.2 Модель Брауна Структура моделі: ,
Математичні методи для побудови моделей і прогнозування . Структура трьохпараметричної моделі: 2.3 Модель Бокса-Дженкінса де - параметри моделі, ; - похибка прогнозування.
Математичні методи для побудови моделей і прогнозування . 2.4 Модель Тейла-Вейджа Процес Тейла-Вейджа в аналітичному вигляді записується як: Рекурентні формули: прогноз очищений від тренду параметр лінійного тренду
Математичні методи для побудови моделей і прогнозування 3. Сезонні моделі Ряди з сезонними тенденціями можна представити моделями двох типів: Моделі мультиплікативного типу: де динаміка величини характеризує тенденцію розвитку процесу; коефіцієнти сезонності; кількість фаз в повному сезонному циклі; неавтокорельований шум з нульовим математичним сподіванням. Моделі адитивного типу:
Математичні методи для побудови моделей і прогнозування 3.1 Сезонна модель Вінтерса з лінійним ростом Структура мультиплікативної моделі:
Математичні методи для побудови моделей і прогнозування 4. Модель множинної регресії 5. Метод подібних траєкторій 1) Обчислимо перші різниці 2) Визначаємо розмір опорного ланцюжка р і розмір алфавіту 3) Перехід від числового ряду до символьного 4) Розбиття ряду на вектори розміром р і пошук подібних траєкторій 5) Пошук прогнозу – ймовірність появи символу за умови, що попередніми символами є Алгоритм:
Структура системи підтримки прийняття рішень (СППР) Призначення: аналіз даних; моделювання; прогнозування; прийняття рішень.
Блок-схеми алгоритмів пошуку оцінок моделей Пошук коефіцієнта згладжування по сітці значень Метод найменших квадратів
Загальний вигляд програми “Alpha” Середовище реалізації: мова програмування Delphi 7 Створена на базі розробленої архітектури СППР
1. Аналіз статистики захворюваності на туберкульоз в Україні Для аналізу ситуації захворюваності на туберкульоз використовувались дані нових випадків туберкульозу серед громадян по всій України. Дані для аналізу були взяті з відкритого інформаційного ресурсу Європейської бази даних ЗДВ (HFA-DB) ВООЗ за адресою в Інтернеті: http://data.euro.who.int/hfadb/shell_ru.html
1. Аналіз статистики захворюваності на туберкульоз в Україні Розбиття вибірки: навчальна - (1990 – 2005 рр.) прогнозна - (2006 – 2008 рр.) Вибрана статистика нових випадків туберкульозу включає річні показники з 1990 р. по 2008 р. Розмір вибірки складає 19 річних даних.
1.1 Адаптивні моделі розповсюдження туберкульозу за допомогою програми “Alpha” Мат. модель методу “Експоненційного згладжування”: Мат. модель “Хольта”: Мат. модель “Тейла-Вейджа”: Мат. модель “Брауна”: Мат. модель “Бокса-Дженкінса”: Мат. модель “Вінтерса”:
1.3 Прогнозування на 2006-2008 рр. Найкращий прогноз: модель Бокса-Дженкінса Час Реальні значення Тейл-Вейдж Хольт Е.З. Браун Вінтерс Бокс-Дженкінс Подібні траєкторії 2006 41265 38379 40127 39608 39131 38593 38448 42249 2007 37517 38460 41075 41265 40369 45295 38074 43241 2008 37832 41346 42621 37517 42282 32775 40224 44233
1.4 Порівняння статистичних характеристик отриманих моделей Найбільш адекватна модель: Тейла-Вейджа Мінімальне значення СКП побудованого прогнозу має модель: Бокса-Дженкінса Критерій порівняння: середньоквадратична похибка Тип моделі Характеристика моделі Характеристика прогнозу СКП навчальної вибірки СКП прогнозної вибірки Е.З. 10027,38 4110,03 Хольта 9860,16 6074,11 Тейла-Вейджа 9531,32 4643,96 Брауна 11406,17 5700,61 Бокса-Дженкінса 10044,63 3736,95 Вінтерса 34722,76 8784,52 Подібних траєкторій - 8644,12
1.5 Прогнозування розповсюдження туберкульозу на 2010 р. Сценарії приросту нових хворих на туберкульоз в Україні Темпи росту захворюваності на туберкульоз зростають з кожним роком. На 2010 рік за середньоочікуваним прогнозом приріст нових інфікованих буде збільшуватися на 3%, у порівнянні з 2008 роком (кількість хворих становила 37832 чол. ). Варіант прогнозу На 2010 рік Песимістичний 40972 чол. Середньоочікуваний 39071 чол. Оптимістичний 37169 чол.
2. Аналіз щомісячної статистики динаміки росту ВІЛ/СНІД в Україні Для аналізу ситуації ВІЛ/СНІД захворювань використовувались офіційно зареєстровані дані нових випадків ВІЛ серед громадян по всій України. Статистика відображається на сайті Міжнародного Альянсу з ВІЛ/СНІД в Україні за адресою в Інтернеті (http://www.aidsalliance.org.ua/), з періодичним поквартальним оновленням. Вибрана статистика нових випадків ВІЛ включає щомісячні показники з січня 2002 р. по грудень 2009 р. Розмір вибірки складає 96 місячних даних. Розбиття вибірки: навчальна - (січень 2002 – грудень 2008 рр.) прогнозна - (січень 2009 – грудень 2009 рр.)
2.1 Адаптивні моделі з використанням програми “Alpha” Мат. модель методу “Експоненційного згладжування”: Мат. модель “Хольта”: Мат. модель “Тейла-Вейджа”: Мат. модель “Брауна”: Мат. модель “Бокса-Дженкінса”: Мат. модель “Вінтерса”:
2.2 Математичні моделі регресії з використанням “Eviews 5.0” Мат. модель “Тренда першого порядку”: Мат. модель “Тренда другого порядку”: Мат. модель “АР(13)”: Мат. модель “АРКС(13,8)”: Мат. модель “АРІКС(11,1,8)”: де
2.4 Прогнозування на 12 місяців 2009 р. (адаптивні моделі) Найкращий прогноз: модель Тейла-Вейджа Час Реальні значення Тейл-Вейдж Хольт Е.З. Браун Вінтерс Бокс-Дженкінс Подібні траєк-торії 2009/1 1568 1609,8 1609,86 1636,83 1645,31 1606,11 1609,86 1604,5 2009/2 1883 1618,07 1618,18 1595,53 1646,21 1822,50 1618,18 1750,8 2009/3 1821 1619,01 1619,16 1768,01 1625,66 1959,29 1619,16 2056,9 2009/4 1526 1659,28 1659,46 1799,8 1736,20 1711,80 1659,46 1723,8 2009/5 1558 1694,18 1694,37 1635,52 1788,02 1556,93 1694,38 1870,1 2009/6 1688 1691,04 1691,25 1589 1704,50 1614,58 1691,25 1856,6 2009/7 1558 1687,42 1687,63 1648,4 1656,71 1455,88 1687,64 1843,1 2009/8 1437 1697,18 1697,39 1594,16 1674,18 1495,23 1697,40 1829,6 2009/9 1652 1688,79 1689 1499,86 1633,91 1597,55 1689,00 1975,9 2009/10 1652 1661,58 1661,78 1627,65 1556,70 1656,47 1661,78 1802,6 2009/11 1729 1658,31 1658,49 1591,14 1588,50 1654,96 1658,49 1948,9 2009/12 1715 1655,18 1655,33 1688,46 1611,39 1834,19 1655,34 1935,4
2.5 Прогнозування на 12 місяців 2009 р. (регресійні моделі) Найкращий прогноз: модель АР(13) Час Реальне значення Тренд 1-го порядку Тренд 2-го порядку АР(13) АРКС(13,8) АРІКС(11,1,8) 2009/1 1568 1684,62 1621,94 1608,47 1614,39 1614,39 2009/2 1883 1696,94 1630,53 1742,15 1760,22 1760,22 2009/3 1821 1709,25 1639,03 1734,02 1723,67 1723,67 2009/4 1526 1721,57 1647,46 1688,33 1697,23 1697,23 2009/5 1558 1733,89 1655,80 1622,56 1625,16 1625,16 2009/6 1688 1746,21 1664,06 1652,34 1637,93 1637,93 2009/7 1558 1758,53 1672,25 1644,18 1649,22 1649,22 2009/8 1437 1770,85 1680,35 1547,02 1549,80 1549,80 2009/9 1652 1783,17 1688,37 1622,59 1635,53 1635,53 2009/10 1652 1795,49 1696,30 1738,60 1720,02 1720,02 2009/11 1729 1807,81 1704,16 1687,20 1668,98 1668,98 2009/12 1715 1820,13 1711,94 1703,72 1736,40 1736,40
2.7 Порівняння статистичних характеристик отриманих моделей Тип моделі Характеристики моделі Характеристика прогнозу R2 СКП навчальної вибірки IKA DW СКП прогнозної вибірки Адаптивні моделі: Е.З. 0,98656 1287,63 - 2,26778 501,65 Хольта 1,04533 1248,67 - 1,34018 493,60 Тейла-Вейджа 1,04479 1249,01 - 1,33468 493,47 Брауна 0,99809 1290,34 - 1,40685 550,86 Бокса-Дженкінса 1,04532 1248,68 - 1,34018 493,61 Вінтерса 1,06731 2385,77 - 1,50029 675,68 Подібн.траєктор. - - - - 836,27 Регресійні моделі: Тренд1 0,86849 1 065,27 12,39666 1,79010 583,1 Тренд2 0,86932 1061,93 12,41418 1,80132 518,9 АР(13) 0,87806 845,19 12,17924 1,86660 346,81 АРКС(13,8) 0,88331 826,81 12,16305 1,84720 370,07 АРІКС(11,1,8) 0,61973 849,95 12,25696 1,98926 478,55
3. Аналіз річної статистики динаміки росту ВІЛ/СНІД в Україні Вибрана статистика нових випадків ВІЛ включає річні показники з 1995 по 2009 рр. Розмір вибірки складає 15 річних даних. Розбиття вибірки: навчальна - (1995 – 2006 рр.) прогнозна - (2007 – 2009 рр.)
3.1 Адаптивні моделі з використанням програми “Alpha” Мат. модель методу “Експоненційного згладжування”: Мат. модель “Хольта”: Мат. модель “Тейла-Вейджа”: Мат. модель “Брауна”: Мат. модель “Бокса-Дженкінса”: Мат. модель “Вінтерса”:
3.2 Математичні моделі регресії з використанням “Eviews 5.0” Мат. модель “Тренда першого порядку”: Мат. модель “Тренда другого порядку”: Мат. модель “АР(1)”: Мат. модель “АРКС(1,7)”: Мат. модель “АРІКС(5,1,2)”: де
3.3 Графіки найбільш адекватних моделей Модель експоненційного згладжування Модель АРІКС(5,1,2)
3.4 Прогнозування з 2007-2009рр. (адаптивні моделі) Найкращий прогноз: модель Подібні траєкторії Час Реальні значення Тейл-Вейдж Хольт Е.З. Браун Вінтерс Бокс-Дженкінс Подібні траєкторії 2007 17670 15806 15170 17760 14671 22037 14394 16697 2008 18905 20224 18201 17615 18651 20093 22620 18615 2009 19787 20060 19708 19678 19224 22357 14166 20533
3.5 Прогнозування з 2007-2009 рр. (регресійні моделі) Найкращий прогноз: модель Тренд 2-го порядку Час Реальне значення Тренд 1-го порядку Тренд 2-го порядку АР(1) АРКС(1,7) АРІКС(5,1,2) 2007 17670 14972 16966 16321 9557 18251 2008 18905 15936 18851 16498 13001 21926 2009 19787 16900 20867 16651 11903 19651
3.7 Порівняння статистичних характеристик отриманих моделей Тип моделі Характеристики моделі Характеристика прогнозу R2 СКП навчальної вибірки IKA DW СКП прогнозної вибірки Адаптивні моделі: Е.З. 0,93128 6065,49 - 1,95213 1297,07 Хольта 0,89976 8514,55 - 1,607212 2598,05 Тейла-Вейджа 1,09232 10925,46 - 1,731016 2299,63 Брауна 0,96652 9821,36 - 1,32726 3061,94 Бокса-Дженкінса 1,05983 7811,62 - 1,403288 7491,65 Вінтерса 1,38908 12949,86 - 3,213357 11514,17 Подібн.траєктор. - - - - 1259,78 Регресійні моделі: Тренд1 0,76048 6471,24 18,23655 0,875732 4941,7 Тренд2 0,79349 6008,88 18,25496 1,059359 1230,61 АР(1) 0,72087 5744,04 18,11546 0,972492 4175,86 АРКС(1,7) 0,98378 1384,44 15,81519 1,589847 15034,89 АРІКС(5,1,2) 0,99999 4,022 5,496365 1,854177 3079,68
Аналіз отриманих результатів прогнозування Сценарії приросту нових хворих на ВІЛ в Україні Темпи росту ВІЛ невпинно зростають з кожним роком. На 2016 рік за середньоочікуваним прогнозом приріст нових інфікованих буде збільшуватися майже на п’ятдесят відсотків, у порівнянні з 2009 роком. Загальний висновок для України досить невтішний, кожні 7 років загальна кількість хворих на ВІЛ/СНІД збільшується майже у двічі. Варіант прогнозу На 2010 рік (кількість нових випадків ВІЛ ) У 2016 році (кількість нових випадків ВІЛ ) Песимістичний 21617 чол. 37278 чол. Середньоочікуваний 20916 чол. 31268 чол. Оптимістичний 20214 чол. 25257 чол. Зареєстровані на ВІЛ (нових випадків) у 2009 році 19787 чол.
Висновки В роботі виконаний огляд глобальних процесів та задач епідеміології, щодо найбільш поширених показників інфекційних захворювань та існуючих методів щодо їх аналізу. Описано тенденції розповсюдження епідемій на сьогодення. В основній частині роботи наведена детальна теоретична інформація, щодо існуючих методів прогнозування у вигляді моделей адаптивного короткострокового прогнозування, подібних траєкторій та множинної регресії. Запропонована оригінальна архітектура СППР для аналізу, моделювання та прогнозування часових наборів даних на базі якої, реалізована комп’ютерна програма “Alpha”, яка написана на мові програмування – Delphi 7. В якості прикладів застосування програми, досліджено процеси захворювань на туберкульоз та ВІЛ/СНІД в Україні.
Перспективи щодо подальших досліджень Подальше вдосконалення розробленої комп’ютерної програми, за рахунок реалізації нових математичних методів. Реалізація методів для оцінки коефіцієнтів регресійних моделей (ММП, РММП, РМНК, метод моментів та ін.). Застосування інших методів та моделей для аналізу та прогнозування епідеміологічних показників. Наприклад, нейронні мережі, дерева рішень , стохастичні методи (метод Монте-Карло), методи групового врахування аргументів (МГВА, НМГВА), динамічні неперервні мережі Байєса та інші методи інтелектуального аналізу даних (ІАД).
Результати впровадження, публікації Участь у VIII Міжнародній науково-практичній конференції “Менеджмент малого и среднего бизнеса: эффективность, конкурентноспособность, устойчивость” , м.Севастополь, 2009 рік Участь в Міжнародній науковій конференції “Интеллектуальные системы принятия решений и проблемы вычислительного интеллекта” м.Євпаторія, 2010 рік Участь у XII Міжнародній науково-технічній конференції “Системний аналіз та інформаційні технології”, м.Київ, 2010 рік
Результати впровадження, публікації Публікація наукової статті “Застосування методів регресійного аналізу для моделювання та прогнозування епідемії ВІЛ” у фаховому виданні “Вісник університету Україна” 2010 рік Подання заявки №34419 для оформлення авторського свідоцтва на комп’ютерну програму “Alpha” від 21.05.2010 року Акт впровадження комп’ютерної програми “Alpha” в Державному закладі “СМСЧ №3” МОЗ України в Рівненській обл.
Схожі презентації
Категорії