Рефераты. Застосування експертних систем у медицині

2. Використання експертних систем для розпізнавання образів у медицині


Задача розпізнавання образів полягає у визначенні, до якого класу об'єктів (образу) може бути віднесений об'єкт, що розпізнається. Під класом розуміється деяка підмножина об'єктів з близькими властивостями.

На сьогодні для розпізнавання образів використовується велика кількість методів, детальний розгляд яких виходить за межі цього посібника. Тут тільки стисло розглянемо особливості задачі розпізнавання образів у медицині, зокрема розпізнавання біомедичних сигналів.

У медицині задача розпізнавання образів близька до задачі діагностики. Наприклад, форма електрокардіограми (ЕКГ) є характеристикою того, нормально функціонує серце чи ні, і задача діагностики зводиться до розпізнавання ЕКГ здорових і хворих пацієнтів. Для того, щоб виконати розпізнавання, необхідно спочатку створити опис об'єкта, тобто виміряти деякі його характеристики. Найпростіший метод полягає у дискретизації ЕКГ, тобто у виборі значень х(t1),...,х(tn) ординат кривої ЕКГ, виміряних у рівновіддалені моменти часу t1,..,tn (рис.1.6). Крок дискретизації ∆t=ti-ti-1 вибирається згідно з теоремою Котельникова.


Рис. 1.6. Дискретизаціїкривої


Таким чином кожна крива ЕКГ виражається вектором в п-мірному просторі, а множина кривих утворює розподіл вектора X в n-мірному просторі (криві ЕКГ завжди відрізняються одна від одної, тому вектор X є випадковим). Наводиться простий двовимірний приклад двох розподілів, що відповідають нормальному і патологічному станам серця (рис. 1.7). Якщо ці два розподіли вектора X відомі з минулого досвіду, то можна встановити між ними межу g(x1,x2), яка ділить двовимірний простір на дві області. Під час розпізнавання нової кривої ЕКГ залежно від знаку функції g(x1,x2) можна прийняти рішення стосовно відповідності цієї кривої нормі або патології.

Функцію g(x1,x2) називають дискримінантною (розв'язувальною) функцією, а технічний пристрій, що визначає знак g(x1,x2), - блоком прийняття рішень. На рис. 1.8 показана структурна схема системи розпізнавання в n- мірному просторі. Потрібно відзначити, що в цьому випадку розглядається тільки розпізнавання образів у двох класах (нормальний стан та патологія), що суттєво спрощує задачу розпізнавання.


Рис. 1.7. Приклад розпізнавання нормального та патологічного станів


Рис:1 8. Структурна схема системи розпізнавання образів

Щоб спроектувати систему розпізнавання, потрібно вивчити характеристики розподілу вектора ЛГ для кожного класу і визначити відповідну дискримінантну функцію. Складність такого підходу полягає у великій розмірності івектора ознак розмірність^ що може досягати декількох тисяч. Водночас' відомо, що людина -для розпізнавання використовує невелику кількість Ознак, кожна з яких несе значну інформацію і вибирається відповідно до фізичного значення задачі.

Щоб спростити рішення розглянутої задачі потрібно вибрати найбільш інформативні ознаки.

Вибір найбільш інформативних ознак можна розглядати як відображення и.-мірного простору в простір меншої розмірності А", в процесі якого необхідно зберегти властивість роздільності розподілів, що відповідають різним класам.

У результаті отримують новий вектор ознак Y={у1,...,уk}, який є системою похідних ознак, по відношенню до вектора Х={х1,...,хп} первинних ознак. Наприклад, у простому випадку практичного аналізу ЕКГ [3,79] на одному періоді ЕКГ встановлюють певну кількість характеристичних точок (на рис. 8.9 наведені 24 характеристичні точки), що визначають моменти часу t1,...,tm    і відповідні їм ординати ζ(t1),..., ζ(tm) кривої ЕКГ, за якими можна обчислити к значень так званих графоелементів (інтервали хвиль і комплексів, амплітуди, кривизну ліній тощо), які утворюють вектор Y={у1,...,уk}. Встановлення характеристичних точок при цьому можна розглядати як своєрідне «проріджування» масиву Х={х1,...,хп},в результаті якого вектор X трансформується у вектор Ξ={t1 ζ(t1);...;tm ζ(tm)}- і лише потім вектор Ξ перетворюють у вектор Y.




Рис. 8.9. Приклад характеристичних точок ЕКГ


Отже, задача розпізнавання образів складається з двох частин: вибір інформативних ознак та формування розв'язувального правила.


Класифікація та особливості систем розпізнавання


Відомо багато підходів до класифікації систем розпізнавання образів. Використаємо класифікацію, наведену в, згідно з якою системи розпізнавання поділяються на:

прості та складні системи;

однорівневі та багаторівневі системи;

системи без навчання, системи, що навчаються і системи з самонавчанням;

детерміновані, імовірнісні, логічні та структурні (лінгвістичні) системи;

традиційні та перспективні (експертні) системи.

Прості та складні системи. Розділення на прості та складні системи проводиться залежно від того, чи мають ознаки, що використовуються для опису об'єктів, які розпізнаються, єдину чи різну фізичну природу. До простих відносяться, наприклад, системи розпізнавання ЕКГ, в яких ознаки є сукупністю відліків ЕКГ. До складних систем медичної діагностики відносять такі, де як ознаки (симптоми) можуть використовуватися результати аналізу крові, ЕКГ, температури, динаміки кров'яного тиску, ультразвукових досліджень тощо.

Однорівневі та багаторівневі системи. Цей рівень класифікації залежить від того, які ознаки використовуються для прийняггя рішення про об'єкти, що розпізнаються - первинні, вторинні тощо.

Наприклад, система розпізнавання ЕКГ, в якій як ознаки використані відліки х(t1),...,х(tn)кривої ЕКГ, є однорівневою; система, в якій ознаками служать графоелементи ЕКГ, тобто елементи вектора Y, є багаторівневою (трирівневою, якщо врахувати, що вектор ознак X перетворюють спочатку у вектор Ξ, а потім - у вектор Y).

Системи без навчання, системи, що навчаються і системи з самонавчанням. У системах без навчання первинної апріорної інформації достатньо, щоб визначити описи ознак, класів, і розв'язувальні правила. Коли ознаками є ймовірність, то описами ознак і класів є умовна густина розподілу ймовірності значень ознак х(t1),...,х(tn)для кожного класу w1,...,wn, тобто функції Р(Х/wi), і=1,...,т, а також апріорні ймовірності Р(wi), i=1,...,т появи об'єктів відповідних класів.

У системах без навчання апріорно відомі або самі функції Р(Х/wi) іР(wi), і=1,...,т або їх оцінки.

Системи, що навчаються, відрізняються тим, що для них визначені переліки ознак і класів, проте описи зв'язків між ознаками і класами відсутні або недостатні для їх використання. Такі системи характеризуються вибір«навчанням з учителем». На етапі навчання «вчитель» багато разів подає системі екземпляри навчальної вибірки об'єктів усіх класів і вказує, до яких класів вони належать. Потім на етапі «іспиту» «учитель» перевіряє якість роботи системи, надаючи їй екземпляри контрольної вибірки, що також містить об'єкти всіх класів. Процедури навчання і контролю чергуються до тих пір, поки не буде досягнута необхідна якість розпізнавання, що характеризується частотою помилкових відповідей.

Для систем із самонавчанням визначені лише переліки ознак - решта ми з апріорної інформації відсутня. На стадії навчання системи їй надають навчальну вибірку об'єктів, не вказуючи, однак, до яких класів вони належать.

Ці вказівки замінюються набором правил, відповідно до яких система розпізнавання сама виробляє розв'язувальне правило.

У процесі побудови систем, які навчаються, і систем з самонавчанням доцільно використовувати принцип зворотного зв'язку, тобто мова йде про принципову можливість донавчання системи за результатами розв'язку задачі розпізнавання.

Детерміновані, ймовірнісні, логічні та структурні (лінгвістичні) системи. В алгоритмах детермінованих систем розпізнавання використовується поняття відстані між об'єктами, що розпізнаються, та еталонами класів. У цілому для рішення задач розпізнавання образів використовуються відстані Евкліда, Хемінга або Левенштейна. Відстань Евкліда визначає міру близькості між об'єктами в просторі ознак (геометричний принцип); відстань Хемінга визначає міру близькості між двійковими векторами однакової довжини, міра Левенштейна визначає кількість елементарних операцій (вставлення, стирання та заміни), що необхідні для перетворення опису одного об'єкту в інший. В детермінованих системах найчастіше використовується відстань Евкліда. Між ознаками та класами встановлюються жорсткі функціональні залежності.

У ймовірнісних системах для побудови алгоритмів розпізнавання використовуються методи, основані на теорії статистичних рішень. Між ознаками об'єктів, що розпізнаються, і класами, до яких ці об'єкти відносяться, встановлюються ймовірнісні залежності.

В логічних системах використовуються методи розпізнавання, що ґрунтуються на дискретному аналізі та численні висловлювань. Зв'язки між ознаками та класами задаються з використанням апарату бульової алгебри.

В структурних (лінгвістичних) системах для побудови алгоритму розпізнавання використовуються спеціальні граматики та мови, що складаються з речень, кожне з яких описує конкретний об'єкт, що належить до певного класу. Задача розпізнавання в цьому випадку зводиться до перевірки належності конкретного речення до певної мови (граматики). Для перевірки ступеня близькості між лінгвістичними одиницями (наприклад, словами) найчастіше використовується відстань Левенштейна.

В медичних експертних системах діагностики найбільш поширені детермінований та ймовірнісний підходи.

Детерміновані системи ґрунтуються на реалізації таких основних методів:

метод пошуку клінічного прецеденту:

метод ідентифікації;

метод фазового простору;

метод лінійних дискримінантних функцій.

У випадку використання методу пошуку клінічного прецеденту за даними, що описують стан хворого, в медичному архіві знаходиться випадок, що збігається за показниками з ситуацією, що спостерігається. Мова може йти про повний (повний прецедент) або частковий збіг (частковий прецедент). Недолік цього методу полягає в необхідності зберігання великих архівів інформації.

Метод, ідентифікації є, по суті, розвитком методу пошуку клінічного прецеденту. В цьому випадку використовується відстань Хемінга. Сукупність симптомів хворого подається у вигляді двійкового (бінарного) вектора, в якому 1 означає наявність певного симптому, а 0 - його відсутність. Суть методу полягає у виборі мінімальної відстані Хемінга між вектором симптомів конкретного хворого та наявних еталонних векторів. Недоліком цього методу є його дискретність, тобто наявність тільки двох значень (0 або 1), що не дає змоги передати кількісні характеристики симптомів захворювання.

У методі фазового простору кожний симптом розглядають як одну з осей координат багатомірного простору з визначеною у цьому просторі метрикою, яка називається «фазовим інтервалом». Ознаками можуть бути будь-які дійсні числа, а не тільки 0 або 1. У випадку наявності великої кількості симптомів втрачається наочність, властива геометричним представленням, та ускладнюється реалізація системи.

Метод лінійних дискримінантних лінійних функцій деякою мірою дозволяє вирішити проблему, відому як «прокляття розмірності». У цьому випадку визначається сума зважених ознак, тобто багатомірний простір ознак перетворюється в одномірний. Однак тут виникає проблема визначення вагових коефіцієнтів, яка часто має суб'єктивний характер.


Традиційні та перспективні (експертні) системи розпізнавання образів


Особливість традиційних систем розпізнавання образів полягає в тому, що їх основу складають цілком визначені переліки ознак і класів. Кожний клас об'єктів досить чітко описується мовою цих ознак.

З цієї точки зору цікаво розглянути відмінності між традиційними ЕС та експертними системами розпізнавання образів.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.