Expertní systémy Neurčitost Jan Górecki Název prezentace Název projektu Rozvoj vzdělávání na Slezské univerzitě v Opavě Registrační číslo projektu CZ.02.2.69/0.0./0.0/16_015/0002400 Logolink_OP_VVV_hor_barva_cz •Neurčitost je charakteristickým rysem složitých systémů. Vlastní povaha reality způsobuje, že poznatky, které z ní získáváme, jsou neurčité či vágní. – Neurčitost csvukrs –problémy s daty; např.: •chybějící nebo nedostupná data •nespolehlivá data (např. z důvodu chyb měření) •nepřesná nebo nekonzistentní reprezentace dat Příčiny neurčitosti csvukrs –nejisté znalosti; např.: •znalost nemusí být platná ve všech případech •znalost může obsahovat vágní pojmy. – Příčiny neurčitosti csvukrs •Neurčitost bývá v ES vyjadřována obvykle numerickými parametry, které se v různých systémech nazývají různě, např. váhy, míry, stupně důvěry, faktory jistoty. Vyjádření neurčitosti csvukrs •Tyto numerické parametry se přiřazují jednotlivým tvrzením nebo pravidlům. Často nabývají hodnot z intervalu á0,1ñ nebo á–1,1ñ. – Vyjádření neurčitosti csvukrs •Většinou se neurčitost vyjadřuje pomocí jediného čísla. Postupně se však začínají prosazovat přístupy, v nichž je neurčitost vyjadřována dvojicí čísel (tato dvojice může být např.interpretována jako interval hodnot). – Vyjádření neurčitosti csvukrs •Existují také systémy, kde se pracuje s kvalitativně vyjádřenými neurčitostmi. – Vyjádření neurčitosti csvukrs •Přístupy založené na ad hoc modelech, použitých např. v: –systému MYCIN (jsou zde použity faktory jistoty), –systému PROSPECTOR (pseudobayesovské přístupy). • Přístupy ke zpracování neurčitosti csvukrs • •Přístupy založené na teoretických principech, např. na: –teorii pravděpodobnosti, –teorii fuzzy množin, –teorii fuzzy míry (sem patří např. Dempster-Shaferova teorie a teorie možnosti). – Přístupy ke zpracování neurčitosti csvukrs •Omezme se na problematiku pravidlových systémů. Při zpracování neurčitosti se zde střetáváme s následujícími problémy (problémy aproximativní inference): Problémy při zpracování neurčitosti csvukrs •Jak kombinovat neurčitá data v předpokladu pravidla? Problémy při zpracování neurčitosti csvukrs •Jak kombinovat neurčitost předpokladu pravidla a neurčitost pravidla jako celku? Problémy při zpracování neurčitosti csvukrs •Bayesovský přístup je nejstarší a nejlépe definovanou technikou pro zpracování neurčitosti. •Uvažujme znalost ve tvaru pravidla E ® H, které říká, že předpoklad (evidence) E podporuje závěr (hypothesis) H. •Neurčitost závěru H v závislosti na předpokladu E může být kvantifikována pomocí podmíněné pravděpodobnosti • P(H | E). – Bayesovský přístup csvukrs Bayesovy vzorce (1) csvukrs Bayesovy vzorce (2) csvukrs Apriorní pravděpodobnostní šance csvukrs Aposteriorní pravděpodobnostní šance: csvukrs –Pravděpodobnost lze ze šance vypočítat podle vztahu – – – – – – – – – Šance a pravděpodobnost csvukrs •Z Bayesových vzorců pro P(H | E) a P(ØH | E) plyne, že • • kde • •L se nazývá mírou postačitelnosti (velká hodnota L >> 1 říká, že předpoklad E je postačitelný k dokázání hypotézy H). – Míry postačitelnosti a nezbytnosti csvukrs •Obdobně platí kde • •je míra nezbytnosti (malá hodnota 0 < L^ << 1) znamená, že E je nezbytné pro dokázání H). – Míry postačitelnosti a nezbytnosti csvukrs •Míry postačitelnosti a nezbytnosti zadává pro každé pravidlo expert jako svoje subjektivní váhy. Pravidlo E ® H se vlastně chápe jako pravidlo •if E then H with váha L else H with váha L^ , •resp. jako dvojice pravidel • E ® H (L) a ØE ® H (L^) . – Váhy pravidel v prospectorovských systémech csvukrs •Předpokládejme, že k výroku E není přiřazena logická hodnota pravda nebo nepravda, ale je k dispozici pouze nějaké relevantní pozorování E´. Pak platí • • Vliv neurčitosti tvrzení E csvukrs •Můžeme udělat tento oprávněný předpoklad: Víme-li, že E je pravda nebo nepravda, pak pozorování E´ nepřináší žádnou další informaci o H. Potom můžeme předchozí vztah přepsat do tvaru • • Vliv neurčitosti tvrzení E csvukrs •Vztah • • představuje lineární závislost P(H | E´) na P(E | E´). • Aproximace výpočtu P(H|E´) csvukrs •Protože však expert nezávisle zadává P(H | E) a P(H |ØE) (přímo nebo prostřednictvím L a L^) a dále P(H) a P(E), je uvedená přímka přeurčena a může dojít k rozporu (zadávané údaje nemusejí být konzistentní). • Aproximace výpočtu P(H|E´) csvukrs •Proto se výše uvedený teoretický vztah nahrazuje nějakou aproximací. Obvykle se fixují tyto tři body grafu: • [0, P(H |ØE)], [P(E), P(H)] a [1, P(H | E)]. •Mezi těmito body se pak závislost interpoluje lineárními funkcemi. • Aproximace výpočtu P(H|E´) csvukrs •Uvažujme případ P(H |ØE) £ P(H) £ P(H | E). Pak můžeme P(H | E´ ) aproximovat pomocí vztahů • • • • pro 0 £ P(E | E´ ) £ P(E) a • • • • pro P(E) £ P(E | E´ ) £ 1. Příklad aproximace P(H|E´) csvukrs Příklad aproximace P(H|E´) csvukrs •Mějme pravidla E1 ® H, E2 ® H, … , En ® H. Pak se aposteriorní šance za předpokladu nezávislosti evidencí Ei vypočte takto: • • Kombinace více pravidel csvukrs •Pokud místo přesných evidencí Ei jsou k dispozici pouze pozorování Ei´ , pak se aposteriorní šance vypočte podle vztahu • • kde • Kombinace více pravidel csvukrs •Vztahy pro výpočet vah disjunkce, konjunkce a negace předpokladů přebírají prospectorovské systémy z fuzzy logiky. •Disjunkce předpokladů: • • •Konjunkce předpokladů: • • •Negace předpokladu: • Kombinace předpokladů csvukrs •Výhody: –dobré teoretické základy –dobře definovaná sémantika rozhodování •Nevýhody: –potřeba velkého množství pravděpodobnostních dat –nebezpečí neúplnosti a nekonzistence dat –předpoklad nezávislosti evidencí Ei bývá v praxi zřídka splněn –možnost ztráty informace v důsledku popisu neurčitosti jedním číslem –obtížnost vysvětlování • Výhody a nevýhody bayesovských přístupů csvukrs Děkuji za pozornost Některé snímky převzaty od: RNDr. Jiří Dvořák, CSc. dvorak@fme.vutbr.cz