3.3. Метод факторного аналізу
Згідно з теорією факторного аналізу (Kim J.-O., Mueller C.W., 1986), вважається, що спостережувані параметри (змінні) є лінійною комбінацією деяких латентних (гіпотетичних, неспостережуваних) факторів. Іншими словами, фактори - це гіпотетичні, такі, що безпосередньо не вимірюються, приховані змінні, в термінах яких описуються вимірюванні змінні. Деякі із факторів допускаються спільними для двох і більше змінних, інші - характерні для кожного параметру окремо. Характерні (унікальні) фактори ортогональні один до одного, тобто не вносять вкладу у коваріацію між змінними. Іншими словами, лише загальні фактори, кількість яких значно менша від кількості змінних, вносять вклад у коваріацію між ними. Можна точно ідентифікувати латентну факторну структуру шляхом дослідження результуючої коваріаційної матриці. На практиці неможливо отримати точну структуру факторної моделі, можна лише знайти оцінки параметрів факторної структури. Тому, за принципом postulate of parsimony, приймають модель з мінімальним числом загальних факторів.
0дним із методів факторного аналізу є аналіз головних компонент. Головні компоненти (ГК) - це лінійні комбінації спостережуваних змінних, які володіють властивостями ортогональності, тобто це природні ортогональні функції. 0тже, ГК протилежні до загальних факторів, позаяк останні - гіпотетичні і не виражаються через комбінацію змінних, тоді як ГК - це лінійні функції від спостережуваних змінних.
Суть методу ГК полягає у лінійному перетворенні і конденсації початкової інформації. На основі матриць кореляції визначається система ортогональних, лінійно незалежних функцій, номінованих власними векторами, які відповідають системі незалежних випадкових величин, номінованих власними числами матриці кореляції (J). Кілька перших власних чисел кореляційної матриці вичерпують основну частину сумарної дисперсії поля, тому при аналізі результатів розкладання особлива увага приділяється першим власним числам і відповідних їм компонентам. А поскільки широкомасштабні процеси, якими є функціональні системи організму, характеризуються великою дисперсією, то справедливо припустити, що саме вони відображені у перших компонентах.
Подібність аналізу ГК і факторного аналізу в тім, що в обох методах відбувається скорочення даних і вони застосовуються при дослідженні взаємозалежності змінних. Проте ГК, на відміну від загальних факторів, не пояснюють кореляції, а лише дисперсію; у випадку некорельованих змінних головних компонент не існує, тобто всі вони рівноправні, кожній з них відповідає одинакова доля дисперсії. Далі, факторний аналіз представляє коваріаційну структуру в термінах гіпотетичної моделі, при цьому аналіз ГК скорочує дані шляхом використання кількох лінійних комбінацій спостережуваних змінних, чим відкидає необхідність введення гіпотетичної моделі, що уможливлює пояснення кореляцій в термінах невеликого числа факторів. При цьому латентна факторна структура залишається "річчю в собі", тобто недоступною свідомості.
Аналіз ГК - це метод перетворення даної послідовності спостережуваних змінних у іншу послідовність змінних. Метод отримання напрямків головних осей базується на знаходженні власних чисел і векторів кореляцій (коваріацій). Власне число (J) - найважливіша характеристика матриці (R); використовується при декомпозиції коваріаційної матриці і водночас - як критерій визначення числа виділюваних факторів і як міра дисперсії, що відповідає даному фактору. Власний вектор (V) - вектор, зв'язаний із відповідним власним числом і отримується в процесі виділення первинних факторів. Ці вектори, представлені у нормованій формі, є факторними навантаженнями. Зв'язок між згаданими характеристиками виражається рівнянням: RV = JV.
Перше власне число представляє величину дисперсії, що відповідає першій головній осі, друге - другій і т.д. Сума власних чисел дорівнює числу змінних, а доля дисперсії, відповідна даному напрямку чи ГК, отримується від поділу власного числа на число змінних. Завдання ГК полягає у поясненні максимальної долі дисперсії спостережень, а завдання загальних факторів - пояснення кореляцій між змінними.
В n-мірному факторному просторі перша ГК являє собою представництво точок (даних) вздовж вибраної головної осі, вона відтворює максимальну долю дисперсії експериментальних даних. Якщо описувати кожну точку в новій системі координат, то втрати інформації не відбувається. У випадку лінійного зв'язку між змінними перша ГК вміщує всю інформацію для опису кожної точки, якщо ж змінні незалежні, то головна вісь відсутня, і аналіз ГК не сприяє навіть мінімальному стисненню результатів спостереження. За наявності більш-менш тісного зв'язку між змінними решта інформації міститься у наступних ГК, при цьому вісь другої ГК перпендикулярна до осі першої ГК і вздовж неї розташована менша частина даних, тобто друга ГК відтворює наступну за величиною долі дисперсії; ще менше інформації міститься вздовж осі третьої ГК, перпендикулярної до перших двох, і т.д. Вважається, що для вивчення факторної структури досліджуваного поля можна обмежитися розглядом такої кількості ГК, сумарний вклад яких у загальну дисперсію вихідних даних перевищує 2/3.
Факторна структура вважається найпростішою, якщо всі змінні мають одиничну факторну складність, тобто коли кожна змінна має ненульове навантаження лише на один загальний фактор. Якщо факторів не менше двох, то кожен рядок містить лише один ненульовий елемент, кожен стовбець має кілька нулів, для кожної пари стовбців нульові елементи не співпадають. Проте така проста структура для реальних даних недосяжна. Простота структури визначена, якщо для кожного фактора існує не менше трьох змінних, які мають на цей фактор значне навантаження. Первинні факторні навантаження - це проекції змінних на осі n-мірного простору (п=числу факторів), тобто навантаження визначаються при опусканні перпендикуляра із даної точки на первинні ортогональні осі. Проста факторна структура отримується, коли всі значення змінних лежать на цих осях. В ортогональному випадку проста структура задається множиною точок, які мають ненульові навантаження лише на один фактор (вісь). Проекція ненульова, якщо кут між скупченням точок відмінний від прямого. Отже, можна допустити, що скупчення точок знаходиться на первинних осях, або що проекції точок на вторинних осях - нульові.
З метою знаходження матриці факторного відображення, найближчої до найпростішої ідеальної структури, проводиться процедура ортогональної ротації методами quartimax, varimax i equamax. Varimax - метод отримання ортогонального розв'язку, що зводиться до спрощення факторної структури з використанням критерія мінімізації стовбця матриці факторного відображення; quartimax - критерій отримання ортогонального розв'язку, що зводиться до спрощення опису рядків матриці, а equamax - поєднує властивості обидвох перших. Застосовуючи критерій quartimax, можна досягти простоти інтерпретації змінних за рахунок простоти інтерпретації факторів. Опис змінних спрощується при зменшенні числа загальних факторів, водночас опис факторів спрощується, якщо незначна кількість змінних мають суттєві навантаження на цей фактор, а інші - нульові. Метод varimax дає краще розділення факторів, ніж quartimax, позаяк в ньому розглядається дисперсія квадратів навантажень фактора замість дисперсії квадратів навантажень змінної. Факторна матриця, отримувана з допомогою методу ротації varimax, в більшій мірі інваріантна стосовно вибору різних множин змінних. Викладені аргументи зумовили наш вибір саме методу varimax.
Водночас факторний аналіз використано нами в якості евристичного методу виділення кластерів серед зареєстрованих даних, оскільки знайдені структури розглядаються як гіпотези, що відображують в отриманих даних деякі тенденції до скупчення змінних в кластери.
Підсумок факторного аналізу методом ГК поля змінних основної групи хворих відображено на табл. 3.11.
Таблиця 3.11
|
Факторні навантаження (Varimax normalized). Кластери навантажень, котрі детермінують косокутні фактори для ієрархічного аналізу (гастроентерологічні хворі)__________________________________________________
|
|
Індекс Оріе в спокої |
IO |
|
0,45 |
|
|
|
|
|
|
|
Час вигнання |
ET |
|
0,40 |
|
|
|
|
|
|
|
Час вигнання, % належного |
ET% |
|
0,39 |
|
|
|
|
|
|
|
Циркулярне напруження міокарду |
Hm |
|
0,32 |
|
|
|
|
|
|
|
Mg-АТФаза еритроцитів |
Mg-ATPase |
|
0,29 |
|
|
|
|
|
|
|
Індекс тахікардійно-гіпертензивної реакції на 0,5 Вт/кг |
ITCHTR-1 |
|
|
0,82 |
|
|
|
|
|
|
Індекс фізичного стану Astrand |
ІФС |
|
|
0,79 |
|
|
|
|
|
|
Питоме максимальне поглинання кисню |
VO2malr |
|
|
0,79 |
|
|
|
|
|
|
Індекс Оріе при навантаженні 1,5 Вт/кг |
IOw |
|
|
0,79 |
|
|
|
|
|
|
Інд. тахікардійно-гіпертензивної реакції на 1,5 Вт/кг |
ITCHTR-2 |
|
|
0,78 |
|
|
|
|
|
|
Середньодинамічний тиск (навантаження1,5 Вт/кг) |
Pmw |
|
|
0,77 |
|
|
|
|
|
|
Систолічний тиск при навантаженні 1,5 Вт/кг |
Psw |
|
|
0,72 |
|
|
|
|
|
|
Індекс тахікардійної реакції на навантаження 0,5 Вт/кг |
ІТКР-1 |
|
|
0,72 |
|
|
|
|
|
|
Діастолічний тиск при навантаженні 1,5 Вт/кг |
Pdw |
|
|
0,70 |
|
|
|
|
|
|
Маса тіла |
MB |
|
|
0,61 |
|
|
|
|
|
|
Площа тіла |
SB |
|
|
0,56 |
|
|
|
|
|
|
Маса тіла, % належної |
MB% |
|
|
0,54 |
|
|
|
|
|
|
Креатинфосфокіназа плазми |
КК |
|
|
0,53 |
|
|
|
|
|
|
Холестерин пре-p-ліпопротеїдів |
LPVLD |
|
|
|
0,88 |
|
|
|
|
|
Тригліцеридемія |
TG |
|
|
|
0,87 |
|
|
|
|
|
Холестерин пре-p-ліпопротеїдів, % СВН |
LPVLD% |
|
|
|
0,86 |
|
|
|
|
|
Тригліцеридемія, % СВН |
TG% |
|
|
|
0,86 |
|
|
|
|
|
Коефіцієнт атерогенності Клімова, % СВН |
CAG% |
|
|
|
0,67 |
|
|
|
|
|
Коефіцієнт атерогенності Клімова, |
CAG |
|
|
|
0,63 |
|
|
|
|
|
Холестерин а-ліпопротеїдів |
LPHD |
|
|
|
0,51 |
|
|
|
|
|
Урикемія, % СВН |
Ur% |
|
|
|
0,50 |
|
|
|
|
|
Холестерин а-ліпопротеїдів, % СВН |
LPHD% |
|
|
|
0,48 |
|
|
|
|
|
Урикемія |
Ur |
|
|
|
0,48 |
|
|
|
|
|
Магнійемія |
Mg |
|
|
|
0,43 |
|
|
|
|
|
Хлоридемія |
Cl |
|
|
|
0,31 |
|
|
|
|
|
Індекс Кердо в спокої |
ІК |
|
|
|
|
0,73 |
|
|
|
|
Тривалість серцевого циклу |
RR |
|
|
|
|
0,65 |
|
|
|
|
Вік |
Age |
|
|
|
|
0,45 |
|
|
|
|
Натрійемія |
Nap |
|
|
|
|
0,41 |
|
|
|
|
Товщина міжшлуночкової перемички в систолі |
IVSTS |
|
|
|
|
0,24 |
|
|
|
|
Абсолютна фізична працездатність |
PWC150 |
|
|
|
|
|
0,86 |
|
|
|
Питома фізична працездатність |
PWC150r |
|
|
|
|
|
0,82 |
|
|
|
Абсолютне максимальне поглинання кисню |
VO2max |
|
|
|
|
|
0,79 |
|
|
|
Індекс Кердо при навантаженні 1,5 Вт/кг |
IKw |
|
|
|
|
|
0,64 |
|
|
|
Індекс тахікардійної реакції на 1,5 Вт/кг |
ІТКР-2 |
|
|
|
|
|
0,53 |
|
|
|
Кальційемія |
Са |
|
|
|
|
|
0,51 |
|
|
|
Калій еритроцитів |
Ке |
|
|
|
|
|
0,45 |
|
|
|
Холестерин p-ліпопротеїдів, % СВН |
LPLD% |
|
|
|
|
|
|
0,80 |
|
|
Холестерин p-ліпопротеїдів |
LPLD |
|
|
|
|
|
|
0,80 |
|
|
Холестеринемія |
Chol |
|
|
|
|
|
|
0,76 |
|
|
Холестеринемія, % СВН |
Chol% |
|
|
|
|
|
|
0,73 |
|
|
Фосфатемія |
P |
|
|
|
|
|
|
0,44 |
|
|
Товщина задньої стінки лівого шлуночка в систолі |
lvpws |
|
|
|
|
|
|
|
0,95 |
|
Циркулярне напруження міокарда |
Ap |
|
|
|
|
|
|
|
0,84 |
|
Товщина міжшлуночкової перемички в діастолі |
IVSTD |
|
|
|
|
|
|
|
0,84 |
|
Товщина задньої стінки лівого шлуночка в діастолі |
lvpwd |
|
|
|
|
|
|
|
0,81 |
|
Маса міокарда |
MM |
|
|
|
|
|
|
|
0,78 |
|
№,К-АТФаза еритроцитів |
Na,K-ATPase |
|
|
|
|
|
|
|
0,56 |
|
Калійемія |
Kp |
|
|
|
|
|
|
|
0,41 |
|
Меридіональне напруження міокарда |
Sm |
|
|
|
|
|
|
|
0,40 |
|
Са-АТФаза еритроцитів |
Са-АТРase |
|
|
|
|
|
|
|
0,29 |
|
Власне число |
? |
16,0 |
10,2 |
8,76 |
6,55 |
5,89 |
5,07 |
4,97 |
4,74 |
|
Доля відтворюваної дисперсії |
% |
17,2 |
11,0 |
9,4 |
7,0 |
6,3 |
5,5 |
5,3 |
5,1 |
|
Кумулятивна доля відтворюваної дисперсії |
% |
17,2 |
28,2 |
37,6 |
44,6 |
50,9 |
56,4 |
61,7 |
66,8 |
|
Канонікальна кореляція |
r* |
0,97 |
0,95 |
0,95 |
0,93 |
0,92 |
0,91 |
0,91 |
0,83 |
Остання є, по суті, матрицею факторного відображення, елементами якої є факторні навантаження - коефіцієнти кореляції між факторами (ГК) і змінними.
Як бачимо, перша ГК, за означенням, відтворює максимальну долю варіабільності, що міститься в інформаційному полі обстеженої групи осіб. Вона пов'язана із 21 параметром, в тому числі суттєво (r>0,70) - із 14. При цьому останні стосуються насосної функції серця, а також симпатичного тонусу. В меншій мірі перша ГК пов'язана із параметрами периферійного опору судин, вагальним тонусом та вмістом в еритроцитах натрію, тому може бути інтерпретована як стан інтракардіальної та центральної гемодинаміки в спокої, а також адрено-холінергічних та катіонних регуляторних механізмів. Звертає на себе увагу, по-перше, вища інформативність запропонованого нами індексу скоротливої активності порівняно із фракцією вигнання та індексом
Sagawa (0,91>0,66>0,49); при цьому актуальний індекс Ружило-Поповича інформативніший від нормованого (0,91>0,76). По-друге, серцевий індекс (л/хв*м2) інформативніший від показників серцевої продуктивності (л/хв) та її нормованої величини (% належної для статі та віку): (0,92>0,86>0,83). Аналогічна послідовність простежується для параметрів периферійного опору судин: питомий>актуальний>нормований (0,69>0,68>0,66). Це ж стосується хвилинної і ударної роботи серця (0,90>0,83 і 0,89>0,82 відповідно), а також ударного об'єму лівого шлуночка (0,90>0,85). По-третє, симпатичні регуляторні впливи вагоміші, ніж вагальні і такі, що пов'язані із трансмембранним транспортом натрію (0,80>0,65>0,41).
Друга ГК поглинає 11,0% дисперсії і пов'язана із 18 параметрами, в тому числі суттєво - із 9. Вона характеризує інтракардіальну гемодинаміку, а також стан трансмембранного транспорту магнію. Виявлено дещо вищу інформативність середньодинамічного тиску порівняно із систолічним і діастолічним, з одного боку, та нормованих за віком величин порівняно із актуальними - з іншого. Звертає на себе увагу низька інформативність індексу Оріе, циркулярного напруження міокарду та часу вигнання.
Третя ГК пояснює 9,4% дисперсії і корелює із 13 параметрами, з них із 9 - суттєво. Вона характеризує фізичну працездатність і пов'язану з нею активність креатинфосфокінази. Показано, що запропоновані нами індекси тахікардійно-гіпертензивної реакції на навантаження за інформативністю принаймі не поступаються перед загальноприйнятими, а найвищий коефіцієнт кореляції виявився для ITCHTR на перше навантаження. Це дає підстави в майбутніх дослідженнях ширше впровадити велоергометрію із малим навантаженням (0,5 Вт/кг) з огляду на побоювання курортологів стосовно кардіологічних хворих. Цілком логічним є поява в складі даної ГК маси і площі тіла, адже параметри працездатності розраховують на 1 кг. До слова, ріст виявився у складі другої ГК.
Четверта ГК поглинає 7,0% варіабельності, суттєво корелює із 3 параметрами, а всього - із 12. При цьому 8 параметрів стосуються ліпідів, решта - уратів, магнію і хлориду плазми, тому дана ГК характеризує атерогенність плазми, з огляду на роль в його патогенезі, окрім ліпідів, уратів і електролітів. Звертає на себе увагу відсутність відмінностей в плані інформативності між актуальними і нормованими за статтю та віком показниками, а також максимальна інформативність саме ХС ЛП ДНЩ і триацилгліцеридів.
П'ята ГК пояснює 6,3% дисперсії і характеризує ЧСС та діастолічний тиск, з котрими пов'язані вік і натрійемія.
Шоста ГК вбирає в себе 5,5% варіабельності і характеризує параметри тахікардійної реакції на друге (1,5 Вт/кг) навантаження, з якими пов'язані кальційемія і калійгістія еритроцитів.
Сьома ГК (5,3% в долі варіабельності) пов'язана із загальним холестерином плазми і вмістом його в складі неатерогенних ліпопротеїдів низької щільності. Виявлення тут фосфатемії, мабуть, має стосунок до фосфоліпідів.
Нарешті восьма ГК (5,1%) стосується маси міокарду і товщини його стінок, а також напруження, яке він розвиває, при цьому циркулярне напруження виявилось значно інформативнішим від меридіонального (0,84>0,40). Логічно, що з даною ГК пов'язані параметри трансмембранного транспорту Na+, К+ і Са2+ в еритроцитах, з огляду на положення теорії функціональних блоків, зокрема АТФаз, спільних для еритроцитів, міокардіоцитів, ентероцитів, епітелію ниркових канальців тощо.
В табл. 3.12 відображені підсумки факторного аналізу параметрів іншої групи пацієнтів - з урологічною патологією.
Виявилось, що майже аналогічна доля дисперсії параметрів даної групи (64,3% проти 66,8%) може бути пояснена п'ятьма ГК. При цьому перша ГК поглинає 19,7% варіабельності, створеної параметрами, що стосуються артеріального тиску, створюваного роботою серця, з якими пов'язані кальційемія і інсулінемія.
Друга ГК (17,2% дисперсії) характеризує інтракардіальну гемодинаміку та фактори її регуляції: глюкагон, холінергічні і адренергічні впливи, Са-АТФаза, магнійемія. Знову хочеться відзначити цілковиту інформативну рівноцінність індексів Sagawa і Ружило-Поповича та їх перевагу над іншими (EF, MVCF, AS, Ap, Hm).
Третя ГК (15,1% варіабельності) характеризує центральну гемодинаміку, пов'язану із масою міокарда, а також вазопресинемією.
Четверта ГК пояснює 6,2% дисперсії і характеризує трансмембранний транспорт електролітів.
Нарешті, п'ята ГК поглинає 6,1% дисперсії і характеризує салуретичну і діуретичну функцію, яка, своєю чергою, пов'язана із вмістом електролітів в плазмі та активністю ферментів-помп, передовсім №,К-АТФази.
Таблиця 3.12
Факторні навантаження (Varimax normalized). Кластери навантажень, котрі детермінують
|
косокутні фактори для ієрархічного аналізу (урологічні хворі)
|
Отже застосування факторного аналізу дає змогу сконденсувати 2/3 інформації, яка міститься в констелляції визначуваних параметрів гемодинаміки і працездатності, а також їх вегетативно- гуморальної регуляції, у 8 чи 5 кластерів-факторів.
Лучшие книги
- Статистика лекции
- Бюджетоутворюючі податки та їх вплив на розвиток сільсого господарства у Донецькій області - Прокопенко О.А
- История европейского права - Э. Аннерс
- Трактат по политической экономии - Жан-Батист Сей
- Глобальные проблемы современности - историко-социологический анализ - Э. А. Афонин, А. М. Бандурка, А. Ю. Мартынов. mht
- Аграрні підприємства в трансформаційних умовах державного регулювання АПК - Погуляйко М.В
- Адаптація методів нечіткого моделювання до умов функіонування Сільськогосподарських підприємств - Цювко І.В
- Атакованный за призвание - Григорий Гончарук
- Активізація бюджетнох політики у забезпеченні соціально-економічного розвитку регіонів - Девків О.І
- Адміністративно-правове забезпечення права громадян світу - Ракша Н.С
LiveInternet
-
реклама