Logo bg.centerdiseasecondtrol.com

Разширена статистика - Приспособления за анализ - Визуално табло - Ръководство за потребителя - Поддръжка - Epi Info ™

Съдържание:

Разширена статистика - Приспособления за анализ - Визуално табло - Ръководство за потребителя - Поддръжка - Epi Info ™
Разширена статистика - Приспособления за анализ - Визуално табло - Ръководство за потребителя - Поддръжка - Epi Info ™

Видео: Разширена статистика - Приспособления за анализ - Визуално табло - Ръководство за потребителя - Поддръжка - Epi Info ™

Видео: Разширена статистика - Приспособления за анализ - Визуално табло - Ръководство за потребителя - Поддръжка - Epi Info ™
Видео: Глава МККК: Абсурдно, что первыми и главными жертвами конфликта становятся гражданские лица 2023, Може
Anonim

Притурки за анализ

Разширена статистика

  • Линейна регресия
  • Свойства на линейна регресия
  • Логистична регресия
  • Свойства на логистичната регресия
  • Сложни примерни FTM
  • Събира примерни честоти
  • Сложни примерни средства
  • Сложни примерни таблици

Линейна регресия

Линейна регресия е инструмент за анализ, който идентифицира връзка между непрекъсната променлива и една или повече независими променливи. Може да се използва за обикновена линейна регресия (само една независима променлива), за множествена линейна регресия (повече от една независима променлива) и за количествено определяне на връзката между две непрекъснати променливи (корелация). Можете да използвате линейна регресия, когато искате да определите връзката между една зависима променлива с една или повече независими променливи.

В примера по-долу се използва линейна регресия, за да се определи дали систолното кръвно налягане може да се прогнозира въз основа на теглото и възрастта на бебето. Зависимата променлива е систолното кръвно налягане, а независимите променливи са теглото при раждане в унции и възрастта в дни.

  1. Задайте източника на данни на проекта Sample. PRJ. Отворете формата BabyBloodPressure от менюто Explorer Source Explorer.
  2. Щракнете върху OK.
  3. Щракнете с десния бутон върху платното и изберете Добавяне на приспособление за анализ> Разширена статистика> Линейна регресия. Прозорецът за конфигурация на притурката Regression Properties се отваря на панела със свойства Variables. (Вижте следващия раздел Свойства на линейна регресия за екранна снимка на приспособлението.)
  4. От падащия списък Променлива на резултатите изберете SystolicBlood.
  5. От падащия списък Независими променливи изберете AgeInDays и тегло при раждане.
  6. Щракнете върху OK. Резултатите от линейната регресия се появяват в платното на Visual Dashboard.

    Linear Regression results
    Linear Regression results

    Фигура 8.52: Резултати от линейна регресия

Коефициентите и за двете независими променливи са положителни, а F-статистиката, свързана с всяка независима променлива, е много значима (р-стойност под 0, 01). Тези резултати предполагат, че всяка променлива (AgeInDays и тегло при раждане) е предиктор за по-високо систолично кръвно налягане.

Свойства на линейна регресия

Linear Regression gadget
Linear Regression gadget

Фигура 8.53: Приспособление за линейна регресия

  • Променливата Output е зависимата променлива за регресията. Променливата на резултата трябва да е числова или да / не.
  • Може да бъде избрана променлива тегло, която да се използва при претеглени анализи.
  • Опцията Ограничения на доверие указва нивото на вероятност, при което Epi Info изчислява граници на доверие.
  • Ако потребителят постави отметка в полето No Intercept, регресията се извършва без постоянен термин, което принуждава регресионната линия през първоначалния източник.
  • Падащият списък „ Полета“ съдържа променливите (независими).
  • Когато бъде избран, променливите на прогнозата ще се появят в полето за списък под падащото поле „ Полета“. Кликнете два пъти върху променлива, за да я премахнете от списъка.
  • Кликнете върху променлива от полето Списък на полета, за да активирате бутона Make Dummy. Ако щракнете върху Make Dummy, избраната променлива ще се появи в полето Dummy Variable. Кликнете два пъти върху променлива, за да я премахнете от списъка.
  • Условията за взаимодействие се дефинират с бутона Make Interaction. Бутонът Make Dummy се превръща в Make Interaction, когато две или повече променливи са избрани едновременно от полето Fields list (задръжте клавиша CTRL, за да изберете повече от една променлива в този списък). Ако щракнете върху Направи взаимодействие, връзката попълва полето за списък с термини за взаимодействие. Make Interaction добавя всички възможни комбинации от избраните променливи към регресията като термини за взаимодействие.

Логистична регресия

В Epi Info ™ 7 може да се използва таблицата M x N / 2 x 2 или Logistic Regression, когато променливата на резултата е дихотомична (например, Ill – Yes / Ill – Не). Анализът M x N / 2 x 2 обаче е полезен само когато има един „рисков фактор“или обяснителна променлива. Логистичната регресия е полезна, когато броят на обяснителните променливи („рискови фактори“) е повече от един. Логистичната регресия показва връзката между изходна променлива с две стойности и обяснителни променливи, които могат да бъдат категорични или непрекъснати. За да използвате логистичната регресия, зависимата (резултат) променлива трябва да бъде дихотомна (може да бъде разделена само на две части) Да / Не или числова 0/1. Независимите (други променливи) могат да бъдат цифрови, категорични или променливи Да / Не.

Записите с липсващи стойности се изключват от анализите на логистичната регресия. Ако опцията Включи липсващ се използва с липсващи стойности и полета Да / Не, фиктивните променливи ще се генерират автоматично, допринасяйки с Да срещу липсващо и Не срещу липсващо. Независимите променливи от текстов тип автоматично се превръщат в фиктивни променливи, които сравняват всяка стойност спрямо най-ниската стойност в реда за сортиране. Независимите променливи от датата или числовия тип се третират като непрекъснати променливи, освен ако не са зададени като фиктивни променливи, които сравняват всяка стойност спрямо най-ниската стойност.

Следващият пример използва логистична регресия за определяне на коефициента на шансове на шест храни, които биха могли да бъдат причина за хипотетично заболяване, пренасяно с храна. Зависимата променлива е Ill, а независимите променливи са кафяв хляб, зеле, вода, мляко, шоколад и ванилия.

  1. Задайте източника на данни на проекта Sample. PRJ. Отворете формуляра Oswego от менюто Explorer Source Explorer.
  2. Щракнете върху OK.
  3. Щракнете с десния бутон върху платното и изберете Добавяне на приспособление за анализ> Разширена статистика> Логистична регресия. Прозорецът за конфигурация на притурката за логистична регресия се отваря на панела със свойства Variables. (Вижте следващия раздел Свойства за логистична регресия за екранна снимка на приспособлението.)
  4. От падащия списък Резултат изберете ILL.
  5. От падащия списък Независими променливи изберете BROWNBREAD, CABBAGESAL, WATER, MILK, CHOCOLATE и VANILLA.
  6. Щракнете върху OK. Резултатите се показват на платното на Visual Dashboard.

    Logistic Regression results
    Logistic Regression results

    Фигура 8.54: Резултати от логистичната регресия

Резултатите показват, че ванилията има коефициент и коефициент на увереност значително по-голям от един. Това показва, че консумацията на ванилия вероятно е била причина за хранителни заболявания.

Свойства на логистичната регресия

Logistic Regression gadget
Logistic Regression gadget

Фигура 8.55: Притурка за логистична регресия

  • Променливата Output е зависимата променлива за регресията. Променливата на резултата трябва да е числова или да / не.
  • Може да бъде избрана променлива тегло, която да се използва при претеглени анализи.
  • Променлива за съвпадение идентифицира променливата, показваща членството в групата на всеки запис.
  • Опцията Ограничения на доверие указва нивото на вероятност, при което Epi Info изчислява граници на доверие.
  • Ако потребителят отметне полето No intercept, регресията се извършва без постоянен термин.
  • Настройката за включване на липсващи стойности контролира независими променливи. Ако се използва Включване на липсващи стойности с липсващи стойности и true / false, фиктивни променливи ще бъдат създадени автоматично. Това ще допринесе за да срещу липсващо и не срещу липсващо. Независимите променливи от текстов тип автоматично се превръщат в фиктивни променливи, които сравняват всяка стойност спрямо най-ниската стойност в реда за сортиране. Дата или числов тип Независимите променливи се третират като непрекъснати променливи, освен ако не са обозначени като фиктивни стойности с помощта на бутона Make dummy. Ако това се случи, те автоматично се превръщат в фиктивни променливи, които сравняват всяка стойност спрямо най-ниската стойност.
  • Падащият списък Независими променливи съдържа променливите (независими).
  • Когато е избрано, променливите на прогнозата ще се появят в полето за списъка под падащото меню Независими променливи. Кликнете два пъти върху променлива, за да я премахнете от полето Други променливи. Изберете променлива от полето Независими променливи, за да активирате бутона Make Dummy. Ако щракнете върху Make make dummy, избраната променлива след това ще се появи в полето Dummy variables. Кликнете два пъти върху променлива, за да я премахнете от списъка с Dummy променливи.
  • Условията за взаимодействие се дефинират с бутона Направи взаимодействие. Бутонът „ Манекен манекен “се превръща в Направи взаимодействие, когато две или повече променливи са избрани едновременно от полето „ Полета “(задръжте клавиша CTRL, за да изберете повече от една променлива в този списък). Ако щракнете върху Направи взаимодействие, връзката попълва полето за списък с термини за взаимодействие. Направете взаимодействие добавя всички възможни комбинации от избраните променливи към регресията като термини за взаимодействие. Кликнете два пъти върху променлива, за да я премахнете от списъка с термини за взаимодействие.
  • Бутонът за изчистване на термини изчиства всички променливи от полетата Dummy променливи и термини за взаимодействие.

Сложни примерни честоти, таблици и средства

Опциите за честота, таблица и средства в Epi Info ™ 7 извършват статистически изчисления, при условие че данните са събрани с помощта на обикновена случайна извадка или безпристрастна систематична извадка. Много проучвания също използват по-сложни стратегии за вземане на проби, като стратификация, клъстерно вземане на проби и използване на неравномерни фракции за вземане на проби. Visual Dashboard предоставя три възможности за анализ на сложни примерни данни: сложни примерни честоти, сложни примерни средства и сложни примерни таблици.

Обикновено в сложния анализ на извадката има променлива за основната единица за вземане на проби (PSU) или клъстер, от която е избран обект на извадка. Ако PSU са избрани от различни слоеве (напр. Щати или окръзи), може да има променлива на стратификация (Stratify by). Концепцията на стратификацията на пробата в сложната пробна конструкция се различава от концепцията за стратификация по време на епидемиологичен анализ, използвайки командата TABLES, тъй като слоевете се избират в процеса на вземане на проби преди анализ. В допълнение, променлива тежест (Тегло) се използва, когато стратегиите за вземане на проби водят до нееднакви вероятности за подбор. Сложните примерни команди в Epi Info ™ 7 могат да изчисляват пропорции или средства със стандартни грешки и граници на доверие. Ако се изисква таблица 2 × 2, се посочва коефициентът на коефициент, коефициентът на риск и разликата в риска.

Сложни примерни честоти

Опцията Комплексни честотни проби създава честотни таблици за избрани променливи. Проектът за пример съдържа клетъчно проучване за разширена програма за имунизация (EPI). Използвайки метода на EPI, екип избра 30 общности (т.е. клъстери) от избраната географска област и посети всяка от 30-те общности. Във всяко от тях те избраха седем деца в подходящ възрастов диапазон и определиха състоянието на имунизацията (VAC) на всяко дете. Следващият пример ще определи честотата на ваксинациите, използвайки сложни честотни проби.

  1. Задайте източника на данни на проекта Sample.prj.
  2. Изберете формуляра Epi1 от менюто Data Explorer Explorer.
  3. Щракнете с десния бутон върху платното и изберете притурка за добавяне на анализ> Разширена статистика> Сложни честотни примерни честоти.
  4. Прозорецът за конфигуриране на сложни примерни честоти се отваря на панела със свойствата Променливи.

    Complex Sample Frequencies gadget
    Complex Sample Frequencies gadget

    Фигура 8.56: Приспособление за сложни примерни честоти

    Опциите за сложни примерни честоти са:

    • Честота на идентифициране на променливата (ите), чиято честота се изчислява.
    • Избира се променлива тегло за използване при претеглени анализи.
    • Стратифициране чрез идентифициране на променливата, която ще се използва за стратификация или групиране на честотните данни.
    • PSU идентифицира първичната единица за вземане на проби.
  5. От падащия списък Frequency Of изберете VAC (броя на получените ваксинации). Това ще изчисли честотата на ваксинациите в набора от данни.
  6. От падащия списък PSU изберете CLUSTER (групата на населението за всеки случай).
  7. Щракнете върху OK.
  8. Сложните примерни честоти се появяват на платното.

    Complex Sample Frequencies results
    Complex Sample Frequencies results

    Фигура 8.57: Резултати от сложни проби

Информацията, предоставена в изхода включва:

  • Ред% - процентът на реда; честотата винаги ще бъде 100%, защото общият брой случаи винаги ще бъде 100%.
  • Col% - процентът на колоната. Това число представлява изчисляването на честотата; в този случай децата с 1 ваксинация представляват 73.810%, а децата с 2 ваксинации представляват 26.190% от общо 210 случая.
  • SE% - стандартната грешка, която отчита сложния дизайн на извадката.
  • LCL% - Долна граница на увереност.
  • UCL% - горна граница на увереност.
  • Общо - общ брой изследвани индивиди / елементи.

Резултатите показват, че 73, 8% от анкетираните 210 деца са ваксинирани, като интервалът на доверие 95% е от 64, 4% до 83, 2%.

Следващият пример е подобен на този по-горе, с изключение на това, че това е стратифицирано клъстерно проучване с отделно проучване от 30 клъстера, попълнено във всяка от 10 страта. За да анализираме правилно този набор от данни, ще вземем предвид къде живее всяко дете (МЕСТОПОЛОЖЕНИЕ). Ще използваме и променлива тегло, за да отчитаме разликите в размерите на популацията между различните места.

  1. Задайте източника на данни на проекта Sample.prj.
  2. Изберете формуляра Epi10 от менюто Data Explorer Explorer.
  3. Щракнете с десния бутон върху платното и изберете притурка за добавяне на анализ> Разширена статистика> Сложни честотни примерни честоти.
  4. Прозорецът за конфигуриране на сложни примерни честоти се отваря на панела със свойствата Променливи.
  5. От падащия списък Frequency Of изберете VAC.
  6. От падащия списък Тегло изберете POPW (процентът от общото население във всеки клъстер).
  7. От падащия списък Stratify By изберете LOCATION.
  8. От падащия списък PSU изберете CLUSTER.
  9. Щракнете върху OK.
  10. Резултатите от сложните примерни честоти се появяват на платното.

    Complex Sample Frequencies stratified and weighted results
    Complex Sample Frequencies stratified and weighted results

    Фигура 8.58: Сложни честотни проби, стратифицирани и претеглени резултати

Резултатите показват, че 55, 3% от анкетираните 2152 деца са ваксинирани, като интервалът на доверие 95% е от 50, 1% до 60, 4%.

Сложни примерни средства

Командата Complex Sample Means може да се използва, когато променливата на резултата е непрекъсната, като възраст, ниво на холестерол и т.н. Можете или да изчислите общата средна стойност с нейните мерки за промяна, или да сравните средните стойности за групираща променлива. Като пример за изчисляване на средства с променлива за групиране, използвайте данните от формата Smoke, намираща се в папката Sample project. В този пример изследователят се интересува да определи дали сред пушачите има разлика в средния брой пушени цигари между мъже и жени. В тези данни променливата SEX е кодирана като 1 = мъжки и 2 = женски.

  1. Задайте източника на данни на проекта Sample.prj.
  2. Изберете формата за дим от менюто Explorer Explorer Explorer.
  3. Щракнете с десния бутон върху платното и изберете притурка за добавяне на анализ> Разширена статистика> Комплексни примерни средства.
  4. Прозорецът за конфигурация Complex Sample Means се отваря на панела със свойствата Variables.

    Complex Sample Means gadget
    Complex Sample Means gadget

    Фигура 8.59: Приспособление за сложни примерни средства

    Опции за сложни примерни средства:

    • Средства за идентифициране на променливата, за която се изчислява средната стойност.
    • Избира се променлива тегло за използване при претеглени анализи.
    • Стратифициране чрез идентифициране на променливата, която ще се използва за стратификация или групиране на честотните данни.
    • Кръстосано табулиране чрез идентифициране на променливата, която да се използва за кръстосано табулиране на основната променлива.
    • PSU идентифицира първичната единица за вземане на проби.
  5. От падащия списък Means Of изберете NUMCIGAR (брой пушени цигари).
  6. От падащия списък Тегло изберете SAMPW (изчислява се въз основа на размера на извадката и размера на популацията).
  7. От падащия списък Stratify By изберете Strata.
  8. От падащия списък Cross-tabulate By изберете Sex.
  9. От падащия списък PSU изберете PSUID.
  10. Щракнете върху OK.
  11. Резултатите от Complex Sample Means се появяват на платното.

    Complex Sample Means results
    Complex Sample Means results

    Фигура 8.60: Резултати от комплексни проби

Резултатите показват, че сред 82-те индивиди, които са пушили цигари, средният брой пушени цигари на ден (NUMCIGAR) за мъже е 18, 7, и 16, 1 за жените, с диапазон на доверителен интервал от 95% от 15, 6 до 21, 8 за мъже и 13, 7 до 18, 4 за жени. Обърнете внимание, че файлът с дим има 337 индивида (тази стойност е показана в горния десен ъгъл на платното). Броят на пушените цигари на ден обаче има данни само за 82 пушачи. За непушачите тази променлива остана празна и следователно се третира като липсващи данни и се изключва от анализа.

Сложни примерни таблици

Опцията сложни примерни таблици в Visual Dashboard ви позволява да укажете променлива за експозиция и променлива за резултатите. Следващият пример използва сложни примерни таблици, за да покаже дали майката, получавала пренатална грижа (PRENATAL), влияе върху състоянието на ваксинацията на детето. Ако майката е получила пренатална грижа, PRENATAL = 1, иначе PRENATAL = 2.

  1. Задайте източника на данни на проекта Sample.prj.
  2. Изберете формуляра Epi10 от менюто Data Explorer Explorer.
  3. Щракнете с десния бутон върху платното и изберете притурка за добавяне на анализ> разширена статистика> сложни примерни таблици.
  4. Прозорецът за конфигуриране на сложни примерни таблици се отваря на панела със свойства Variables.

    Complex Sample Tables gadget
    Complex Sample Tables gadget

    Фигура 8.61: Приспособление за сложни примерни таблици

    Опции за сложни таблици:

    • Експозицията идентифицира променливата, която ще се появи на хоризонталната ос на таблицата. Той се счита за рисков фактор.
    • Резултатната променлива идентифицира променливата, която ще се появи на вертикалната ос на таблицата.
    • Избира се променлива тегло за използване при претеглени анализи.
    • Стратифициране чрез идентифициране на променливата, която ще се използва за стратификация или групиране на честотните данни.
    • PSU идентифицира първичната единица за вземане на проби.
  5. От падащия списък Експозиция изберете PRENATAL.
  6. От падащия списък Резултат изберете VAC.
  7. От падащия списък Тегло изберете POPW (процентът от общото население във всеки клъстер).
  8. От падащия списък Stratify By изберете Местоположение.
  9. От падащия списък PSU изберете Клъстер.
  10. Щракнете върху OK.
  11. Резултатите от сложните примерни таблици се появяват на платното. Може да се наложи да превъртите надолу, за да видите пълните резултати.

    Complex Sample Tables results
    Complex Sample Tables results

    Фигура 8.62: Резултати от сложни таблици

Резултатите показват, че 60, 7% от децата, чиито майки са получили пренатална грижа, са ваксинирани, в сравнение с 42, 6% от тези деца, чиито майки не са получавали пренатална грижа.

Данните 2 x 2 показват, че коефициентът на коефициент в данните е 2.088, коефициентът на риск е 1.427 и тази разлика в риска е 18.2%. Коефициентът на разпространение (риск) показва, че 1.427 пъти повече деца на жени, които са получили пренатална грижа, са били ваксинирани (60.734% разделени на 42.560% = 1.427), в сравнение с деца, родени от жени, които не са получавали пренатална грижа - 40% разлика.

Популярни по теми