IX. MEDICÍNA ZALOŽENÁ NA DŮKAZU 39 MEDICÍNA ZALOŽENA NA DŮKAZU 39.1 ÚVOD - DEFINICE EBM Evidence-based medicine (EBM) - medicína založená na důkazu je definována jako integrace nejlepšího vědeckého důkazu s klinickou odborností a pacientovými hodnotami. Nejlepší vědecký důkaz pochází obvykle z výsledků správně organizovaných a správně prováděných epidemiologických studií, často multicentrického charakteru. V těchto studiích je tak zajištěn dostatečně velký počet subjektů a tím se také zvyšuje jejich validita. Studie jsou zaměřeny na všechny otázky klinické epidemiologie (Janout, 1998), zejména na přesnost a použitelnost diagnostických testů (včetně klinického vyšetřování), účinnost a bezpečnost léčebných, rehabilitačních a preventivních postupů a hodnotu a sílu prognostických markerů. Nové důkazy z takto orientovaného klinického výzkumu jednak mění názory na dosud používané diagnostické a terapeutické postupy a také je částečně nahrazují pokud jsou přesnější účinnější a bezpečnější. Klinická odbornost předpokládá schopnost lékaře používat jeho klinické dovednosti a zkušenost k rychlému identifikování pacientova zdravotního stavu včetně stanovení diagnózy, k odhadu jaký může mít pacient prospěch z potenciálních intervencí, případně jaká rizika z nich pro pacienta vyplývají. Současně musí vzít v úvahu pacientův žebříček hodnot a jeho očekávání. Pacientovi hodnoty představují jeho osobní preference, zájmy, očekávání a priority, které musí být integrovány do klinického rozhodování jestliže má být k jeho prospěchu. Jestliže se podaří tyto tři články vhodně integrovat, pak klinik i pacient tvoří diagnostickou i terapeutickou alianci, jejíž činnost může mít optimální dopad na klinický výsledek a kvalitu života pacienta. Medicína založená na důkazu je ale mnohem víc než jen čtení publikací za účelem získání informací o nových vědeckých důkazech. Podle nejvíce citované definice je to především „vědomé, zřetelné a soudné používání nejlepších současných důkazů při rozhodování o péči o jednotlivé pacienty". Jinými slovy „medicína založená na důkazu je zlepšení tradičních dovedností kliniků v diagnostice, léčbě, prevenci a přidružených oblastech prostřednictvím systematického formulování důležitých a zodpověditelných otázek a využití matematických odhadů pravděpodobnosti a rizika" (Greenhalgh, 2003). Profesor Dave Sackett v zahajovacím úvodníku úplně prvního čísla časopisu Evidence-Based Medicine shrnul hlavní kroky ve vyvíjející se vědě medicíny založené na důkazu: • převést potřebu informací na zodpověditelné otázky (tj. formulovat problém) • vypátrat s maximální účelností nejlepší důkazy, které na tyto otázky přinesou odpovědi - které mohou pocházet z klinického vyšetření, z diagnostické laboratoře, z publikované literatury nebo z jiných zdrojů • posoudit důkazy kriticky (tj. zvážit je), a stanovit jejich platnost (blízkost pravdě) a užitečnost (klinickou použitelnost) • začlenit výsledky tohoto posouzení do klinické praxe • vyhodnotit účelnost opatření. 684 Proto medicína založená na důkazu vyžaduje nejen čtení publikací, ale čtení správných publikací ve správný čas a potom pozměnit chování (a co je často složitější, chování dalších lidí) ve světle toho, co bylo čtením publikací zjištěno. 39.2 HISTORIE VZNIKU EBM Nebylo žádným překvapením, že široká publicita dávaná tomu, čemu se nyní říká „medicína založená na důkazu", byla přivítána se smíšenými reakcemi těch, kteří se podílejí na péči o pacienty. Převážná část lékařské obce se zdá být trošku postižena jejím pojetím, které naznačuje , že veškerá lékařská praxe až donedávna byla tím, co se někdy popisuje jako lehkovážný a nezodpovědný druh lidského experimentování, založený pouze na pokusu a omylu a obvykle vedoucí k přesně takovým důsledkům. Na druhé straně politikové a ti, kteří řídí zdravotní služby, tuto představu přivítali s obrovskou radostí. Všichni měli podezření, že lékaři jsou zcela nekritičtí, a nyní to měli na papíře. Medicína založená na důkazu přišla jako dar z nebes, protože, jak ji nakonec vnímali, účelnost jí vlastní musí nevyhnutelně vést k úspoře nákladů. Avšak myšlenka kontrolovaných klinických pokusů a medicíny založené na důkazu není nová. Je zaznamenáno, že Fridrich II., císař římský a král sicilský a jeruzalémský, který žil od roku 1192 do roku 1250 n.l. a který se zajímal o účinky tělesné námahy na trávení, vzal dva rytíře a dal jim stejné jídlo. Jeden byl poslán ven na lov a druhý do postele. Po několika hodinách oba zabil a vyšetřil jejich zažívací trakt; trávení pokročilo dále v žaludku spícího rytíře. V 17. století Jan Baptista van Helmont, lékař a filozof, začal mít pochybnosti o praxi pouštění žilou. Proto navrhl to, co bylo téměř určitě prvním klinickým pokusem včetně velkého počtu účastníků, randomizace a statistické analýzy. Obnášelo to vzít 200-500 chudých lidí, rozdělit je do dvou skupin metáním losu a jedny uchránit flebotomie, zatímco ty druhé ošetřit puštěním žilou do té míry, do jaké by jeho kolegové považovali za vhodné. Počet pohřbů v každé skupině by se použil k vyhodnocení účinnosti pouštění žilou. Dějiny nezaznamenaly, proč tento skvělý experiment nikdy nebyl proveden. Pokud lze říci, že moderní vědecká medicína měla někdy počátek, tak to bylo v Paříži uprostřed 19. století, kde měla kořeny v práci a vyučování Pierra Charlese Alexandra Louise. Louis zavedl statistickou analýzu do hodnocení lékařské léčby a náhodou ukázal, že pouštění žilou je bezcenná forma léčby, ačkoli to nezměnilo chování lékařů v té době ani v letech následujících. Naproti tomu několik kliniků na obou stranách Atlantiku tvrdilo, že by se měly přijmout klinické pokusy zaměřené na klinické výsledky, avšak numericky založené experimentální designy byly jasně formulovány ve 20. letech 20. století genetikem Ronaldem Fisherem. Obor začal mít závažný vliv na klinickou praxi po druhé světové válce po seminární práci Sira Austina Bradforda Hilla a britských epidemiologů, kteří jej následovali, což byli zvláště Richard Doll a Archie Cochrane. Ale třebaže myšlenka medicíny založené na důkazu není nová, moderní následovníci jako David Sackett a jeho kolegové prokazují velkou službu klinické praxi ne pouze tím, že by tuto myšlenku popularizovali, ale tím, že klinikům důkladně objasňují představu, že to není jen akademická záležitost, ale způsob myšlení, který by měl prostoupit každou stránku lékařské praxe. I když mnoho z toho je založeno na megastudiích a metaanalýzách, měla by to také být použito k ovlivňování téměř všeho, co lékař dělá. Ostatně lékařská profese je po léta nucena examinátory z lékařských škol, aby věřila, že je jen jeden způsob vyšetřování pacienta. Také rituály u lůžka by měly být opřeny o kritické vyhodnocení zrovna tak jako operace a lékové režimy; totéž platí téměř pro každé hledisko lékařské práce. Jak se klinická praxe stává časově náročnější a čas na čtení a sebereflexi je stále vzácnější, bude pro lékaře nezbytnou dovedností schopnost účelně prostudovat lékařskou literaturu a v budoucnu si osvojit získávání znalostí o správné praxi z moderních komunikačních systémů. Myšlenkové principy medicíny založené na důkazu se dají nalézt již v dávné minulosti. V porevoluční Paříži, již zmíněný klinik Pierre Louis odmítal názory medicínských autorit (na příklad, že venesekce je áobrá k léčení cholery) a hleáal praváu v systematickém pozorování pacientů. Ještě dříve, ve starověké Číně, za vlády císaře Qianlonga, byl pro interpretaci starověkých Konfuciánských textů používán termín „průkazný výzkum". V současné době, byl pojem „Evidence Based Medicine" - medicína založená na důkazu, poprvé použit v roce 1992 skupinou pracovníků, vedenou Gordonem Guyattem z Univerzity McMaster v Kanadě. Od té doby vzrostl počet publikací o medicíně založené na důkazu exponenciálně a vznikla řada časopisů, publikujících práce tohoto typu. Následující rychlé rozšíření této nové filozofie medicíny bylo podmíněno následujícími faktory: • každodenní potřebou validních informací o diagnostických, léčebných, prognostických a preventivních metodách • nedostatečnou kvalitou tradičních zdrojů informací pro jejich zastaralost (učebnice), častou frekvencí mylných názorů (experti), neefektivnost (způsob celoživotního vzdělávání) a nebo pro jejich nadměrné množství a rozdílnou kvalitu-validitu pro klinické použití (časopisy) • nevyvážeností mezi diagnostickými schopnostmi a klinickým úsudkem lékaře na jedné straně, které se zkušeností vzrůstají a nejčerstvějšími znalostmi a nejnovějšími klinickými metodami, jejichž znalost s postupem času klesá • omezenými možnostmi lékaře, který má při své práci málo času na průběžné studium literatury a hledání důkazů pro svoje klinické rozhodování • rozvojem metod pro zjišťování důkazu a pro jeho kritické hodnocení • vydáváním systematických přehledů a jiných sumari-začních materiálů, týkajících se lékařské péče (Cochrane Collaboration) • vydáváním „evidence-based" lékařských časopisů, které publikují tak zvané sekundární publikace, tj. práce, publikované v jiných časopisech a prověřené experty, že jejich výsledky jsou jednak platné (validní) a jednak okamžitě použitelné v klinické praxi • vytvořením informačních systémů, které přinášejí nové poznatky během několika sekund • vytvořením a aplikací nových efektivních strategií pro celoživotní vzdělávání a pro zlepšení klinické praxe Zjevný odpor mezi mnoha zdravotnickými pracovníky vůči hnutí medicíny založené na důkazu je většinou reakcí na předpoklad, že lékaři (a sestry, porodní asistentky, fyzio-terapeuti a další zdravotničtí pracovníci) jsou funkčně negramotní, dokud se jim neukáže světlo, a že těch několik, kteří nejsou negramotní, záměrně ignorují publikované medicínské důkazy. Kdokoli, kdo pracuje tváří v tvář pacientům, ví, jak často je nutné hledat nové informace před klinickým rozhodnutím. Lékaři tráví čas v knihovnách od té doby, co byly knihovny zavedeny. Pacientovi nebude nasazen nový lék bez důkazu, že bude pravděpodobně fungovat kromě jiného také proto, že takové neoprávněné použití medikace je nezákonné. Je otázkou, zda všichni lékaři již léta provádí medicínu založenou na důkazu kromě situací, kdy dá se říci úmyslně klamou (využívají „placebo" účinku z dobrých lékařských důvodů) nebo když jsou nemocní, nadměrně stresovaní nebo vědomě líní? Odpověď zní „ne, neprovádí"! Je řada přehledných prací o chování lékařů, sester a ostatních zdravotníků a většina z nich dosáhla stejných závěrů: klinická rozhodování se jen vzácně zakládají na nejlepších dostupných důkazech. Odhady ze začátku 80. let naznačují, že jen okolo 10-20 % lékařských intervencí (farmakoterapie, chirurgické operace, rtg vyšetření, krevní testy a tak dále) bylo založeno na řádných vědeckých důkazech. O tato čísla se od té doby vedou spory, jelikož byla odvozena zhodnocením všech v současnosti používaných diagnostických a terapeutických procedur, takže každá procedura dostala bez ohledu na svou výpovědní hodnotu v konečné fázi stejnou váhu. Novější vyhodnocení používající tuto metodu klasifikovalo jen 21 % zdravotnických technologií jako založených na důkazech. Přehledy, které berou v úvahu intervence vybraných, po sobě jdoucích sérií pacientů, které odrážejí spíše skutečně používané technologie než prostě ty, které jsou na trhu, naznačují, že 60-90 % klinických rozhodnutí, v závislosti na odbornosti, je „založeno na důkazu". Ale tyto odhady měly svá metodologická omezení. Kromě jiného byly prováděny na specializovaných jednotkách a braly v úvahu praxi světových expertů v medicíně založené na důkazu; proto mohou být počty, k nimž se dospělo, stěží zevšeobecňovány za hranici jejich bezprostředního použití. Podívejme se na různé přístupy, jichž v reálné praxi používali zdravotníci ke svým rozhodnutím, přičemž ve všech případech jde o příklady toho, co medicína založená na důkazu není. 39.2.1 ROZHODOVÁNÍ SE NA ZÁKLADĚ VYPRÁVĚNÍ PŘÍBĚHU Profesor, který při své každodenní vizitě uvidí nového pacienta, dotáže se na jeho příznaky a otočí se k šiku juniorů náhlou -čenému kolem postele a vypráví příběh o podobném pacientovi, s nímž se setkal o 20 či 30 let dříve. „O, ano. Pamatuji si, že jsme jí dali to a to a ona po tom byla v pořádku." Vyjadřuje se cynicky, často správně, o nových lécích a technologiích a jeho klinický postřeh si s ničím nezadá. Nicméně mu zabralo 40 let, aby nashromáždil své odborné znalosti, a největší lékařská učebnice ze všech - sbírka případů mimo jeho osobní zkušenosti - mu zůstala navždy zavřena. Vyprávění takového příběhu má důležité místo v odborném studiu , ale nebezpečí rozhodování podle vyprávěného příběhu dobře ilustruje zvážení poměru riziko-prospěch u léků. Významná lékařka a odborník na EBM popisuje svoji osobní zkušenost při jejím prvním těhotenství, kdy se u ní objevilo těžké zvracení a byl ji dán lék proti nevolnosti pro-chlorperazin (Stemetil). Za chvíli dostala nekontrolovatelnou a velmi vyčerpávající nervovou křeč. Za dva dny se z této idiosynkratické reakce plně zotavila, ale od té doby tento lék už nikdy nepředepsala, i když odhadovaná prevalence neurologických reakcí na prochlorperazin je pouze jeden na několik tisíc případů. A obráceně, je lákavé nemyslet na možnost vzácných ale potenciálně závažných nežádoucích účinků známých léků - jako je trombóza u antikoncepčních pilulek, když se člověk nikdy s takovými potížemi nesetkal ani u sebe, ani u svých pacientů. 685 Klinici by nebyli lidmi, kdyby přehlíželi své osobní klinické zkušenosti, ale lepší radou pro všechny je, zakládat svá rozhodování na kolektivních zkušenostech tisíců kliniků léčících miliony pacientů, než na tom, co sami jako jednotlivci viděli a pocítili. 39.2.2 ROZHODOVÁNÍ SE NA ZÁKLADĚ VÝSTŘIŽKŮ Z TISKU Rada lékařů, zvláště v prvních letech po promoci uchovává různé články z časopisů. Pokud se zdá, že článek má co nového říci, pozmění svou klinickou praxi v souladu s jeho závěry. Jeden takový článek kdysi říkal: „všechny děti s podezřením na infekci močových cest by měly být poslány na zobrazovací vyšetření ledvin, aby se vyloučily vrozené anomálie". A tak řada lékařů začala posílat každého mladšího 16 let s močovými příznaky na speciální vyšetření. Ta rada byla v tisku a byla nová, tak musela určitě nahradit tradiční praxi - v tomto případě odesílat pouze děti mladší 10 let, které měly dvě dobře doložené infekce. Tento přístup ke klinickému rozhodovacímu procesu je stále velice běžný. Mnoho lékařů stále ospravedlňuje svůj přístup k určitému klinickému problému tím, že citují výsledky jednotlivé publikované studie, i když nedokáží říci vůbec nic o metodách použitých k získání takových výsledků! Byl ten pokus randomizovaný a kontrolovaný? Kolik pacientů a jakého stáří, pohlaví a závažnosti onemocnění bylo zahrnuto? Kolik odstoupilo ze studie a proč? Podle jakých kritérií byli pacienti vybráni k léčbě? Pokud se zdá, že zjištění studie odporují výsledkům z jiných výzkumných projektů, jaké úsilí bylo vynaloženo, aby byla prokázána jejich platnost a aby byla tato zjištění zopakována ? Byly statistické testy, které údajně prokázaly názor autorů, vhodně vybrány a správně provedeny? Lékaři (a také sestry, porodní asistentky, manažeři v medicíně, psychologové, studenti medicíny a aktivisté z řad pacientů), kteří rádi citují výsledky lékařských výzkumných studií, si mají nejprve odpovědně a se znalostí věci projít tak zvaný kontrolní seznam otázek, podle kterého mohou posoudit validitu dané studie (publikace). 39.2.3 ROZHODOVÁNÍ SE PODLE NÁZORU EXPERTŮ (MEDICÍNA ZALOŽENÁ NA VÝZNAČNÝCH LIDECH - „EMINENCE BASED MEDICÍNE') Důležitou obměnou rozhodování se podle výstřižků z tisku je použití „konfekčních" přehledů, úvodníků, společných souhlasných prohlášení a oficiálních doporučení. Firemní propagační dárky (bezplatné lékařské časopisy a jiné „informační listy" sponzorované přímo nebo nepřímo farmaceutickým průmyslem) jsou plné odjinud vytažených doporučení a zjednodušených návodů. Ale kdo říká, že rady předkládané v sadě oficiálních doporučení, aktuálním úvodníku nebo v „přehledu" s obšírnými odkazy jsou správné? Profesorka Cynthia Mulrowová, jedna ze zakladatelů vědy o systematických (kritických) přehledech ukázala, že u expertů v určitém klinickém oboru je ve skutečnosti méně pravděpodobné, že poskytnou objektivní kritický přehled všech dostupných důkazů, než u neodborníků, kteří přistupují k literatuře s nezaujatýma očima. V krajních případech může „expertem pořízený (kritický) přehled" sestávat prostě z celoživotních špatných návyků a osobních časopisových výstřižků stárnoucího klinika. 39.2.4 ROZHODOVÁNÍ SE NA ZÁKLADĚ MINIMALIZACE NÁKLADŮ Veřejnost je obvykle zděšena, když se dozví, že léčba byla u pacienta přerušena kvůli nákladům. Řídící pracovníci, politici a stále více i lékaři mohou počítat s tím, že budou pranýřováni tiskem, když dítě s mozkovým tumorem nepošlou na specializovanou jednotku někde v zahraničí, nebo když je křehké stařence odepřena neomezená (stravování a uložení) hospitalizace na jednotce intenzivní péče. Přesto v reálném světě je veškerá zdravotní péče poskytována z omezeného rozpočtu a stále více se zjišťuje, že klinická rozhodnutí musí brát v úvahu ekonomické náklady na danou intervenci. Klinická rozhodnutí učiněná čistě na základě nákladů („minimalizace nákladů" - nákup nejlevnější možnosti bez ohledu na to, jak je účinná) jsou obvykle necitelná a krutá a je správné nahlas protestovat, když se něco takového stane. Drahé intervence by ale neměly být ospravedlňovány prostě proto, že jsou nové, nebo proto, že by teoreticky měly fungovat, nebo proto, že jedinou alternativou je nedělat nic - ale jen proto, že velmi pravděpodobně zachrání život nebo významně zlepší jeho kvalitu. Jak ale lze smysluplně porovnat výhody náhrady kyčelního kloubu u 751etého člověka s prospěchem z léku snižujícího cholesterol u muže středního věku či vyšetření neplodného páru ve třetí dekádě jejich života? Tak trochu navzdory očekávání tu bohužel není žádná sada etických principů nebo analytických nástrojů, které by bylo možno použít ke sladění omezených zdrojů s neomezenými požadavky. Některé ukazatele, jako na příklad rok života o standardní (plné) kvalitě (QALY) a podobné jednotky založené na prospěchu pacienta jsou prostě výrazem snahy propůjčit trochu objektivity nelogickým ale nevyhnutelným srovnáním jablek s pomeranči v oblasti lidského utrpení. Je ještě další důvod, proč je pro některé lidi termín „medicína založená na důkazu" těžko přijatelný. Medicína založená na důkazu je o zvládání změn, nikoli o znalosti všech odpovědí ještě předtím, než se s něčím začne. Jinými slovy, není tolik o tom, co lékař přečetl v minulosti, ale o tom, jak se mu daří rozpoznávat současné i budoucí studijní potřeby, jak jim vyhovět a jak využívat své znalosti vhodně a důsledně v nových klinických situacích. Lékaři odchovaní stylem staré školy, kde neznalost je nepřijatelná, mohou obtížně přijmout, že mohou být konfrontováni s některými hledisky vědecké nejistoty, v průměru třikrát na každé dva pacienty vyšetřené zkušeným kolegou v daném oboru (a nepochybně dokonce častěji, jde-li o lékaře z terénu, s menší znalostí nej-novějších poznatků). Přístup založený na důkazech a použitý při vizitách na pokojích, může na hlavu převrátit tradiční hierarchii v medicíně, pokud sestra nebo mladý lékař používá nové důkazy, jež jsou srovnávány s tím co, předešlý týden vyučoval zkušenější kolega. 39.3 SOUČASNÁ SITUACE PŘI PROVÁDĚNÍ EBM Celé provádění praxe EBM lze rozdělit do následujících kroků: • potřebu informace o diagnóze, léčbě, prognóze apod. je třeba vyjádřit formou zodpověditelné otázky • nalézt nejlepší důkaz jako odpověď na tuto otázku • kriticky posoudit tento důkaz z hlediska jeho validity (blízkosti pravdě), jeho dopadu (rozsah efektu) a jeho použitelnosti (výhodnost v klinické praxi) 686 • integrace kritického posouzení s klinickou schopností lékaře a s pacientovou unikátní biologií, jeho prioritami, hodnotami a jinými okolnostmi • evaluace efektivity použití výše uvedeného postupu a případně jeho modifikace. Posuzujeme-li provádění praxe EBM v jednotlivých klinických situacích, můžeme najít tři způsoby: • v prvním případě se jedná o každodenní klinické situace (nestabilní angina pectoris apod.), kdy je třeba být nejen „up to date" ale spíše „up to the minuté" a s velkou dávkou jistoty o tom co se u daného pacienta provádí. V tomto případě se obvykle investuje do obou kroků, tj. do pátrání po důkazu i do jeho kritického posouzení a dále se pracuje již v tomto „kriticky posuzujícím" modulu • ve druhém případě, u stavů se kterými se lékař nesetkává tak často (otrava léky apod.), je veškerý čas obvykle věnován pátrání po důkazu, který byl již kriticky posouzen jinými odborníky (Cochrane Reviews, Best Evidence a jiné zdroje). Nesmí se ovšem zapomenout na třetí bod postupu, zda nalezený důkaz je relevantní pro daného pacienta. Jinak se ovšem dále postupuje v tomto „vyhledávacím" modulu V obou těchto modulech je obsažena jistota, že péče o pacienta je založena na principech EBM. • tato jistota však chybí v třetím případě, kdy se jedná o klinické situace velmi zřídka se vyskytující a kdy v těchto situacích jsou často slepě přebírány informace a aplikována doporučení od autorit v dané oblasti medicíny.Tento „replikativní" modul většinou nerozlišuje zda přebírané informace byly získány na základě kritického posouzení nebo pouze na základě osobní zkušenosti a osobního názoru. Někdy je možno se orientovat o validitě přebíraného názoru podle citované literatury, podle toho zda autoři jsou členy Cochrane Collaboration apod. Některá péče podle tohoto způsobu může být efektivní, některá neúčinná a některá škodlivá. V replikativním modulu však není jistota o který případ se bude jednat. Většina článků objevujících se v současných lékařských časopisech je více méně předkládána ve standardním formátu IMRAD: úvod (Introduction; proč se autoři rozhodli provést tento konkrétní výzkum), metody (Methods; jak jej provedli a jak se rozhodli analyzovat své výsledky), výsledky (Results; co zjistili) a diskuse (Discussion; co si myslí, že výsledky znamenají). Pokud se rozhodujete, jestli má cenu nějakou publikaci číst, měli byste to dělat podle designu studie z oddílu metod a ne podle poutavosti hypotézy, podle povahy či možného dopadu výsledků nebo podle spekulací v diskusi. Protože, špatná věda je špatnou vědou bez ohledu na to, zda se studie zaměřila na důležitý klinický problém, zda výsledky jsou „statisticky významné", zda se věci změnily v tom směru, jak by se to líbilo vám, a zda, pokud opravdu, nálezy slibují nezměrný prospěch pro pacienty nebo úspory ve zdravotnictví. Přísně řečeno, pokud se chystáte vyhodit nějakou publikaci, měli byste to učinit dokonce ještě předtím, než se podíváte na její výsledky. Je mnohem jednodušší nalézt mezery v práci někoho jiného, než sám provést metodologicky dokonalý kus výzkumné práce. Většina dobrých vědeckých časopisů odesílá články recenzentům, aby se vyjádřili k jejich vědecké platnosti, k tomu, nakolik jsou původní, a k jejich důležitosti, předtím než se rozhodnou je otisknout. Tento proces je znám jako recenzní praxe. Vyhodnocení metodologické kvality (kritické posuzování) je podrobně popsáno v mnoha učebnicích medicíny založené na důkazu. Byly vytvořeny strukturované návody na to, jak číst publikace pojednávající o léčbě, diagnóze, scree-ningu, prognóze, etiologii, kvalitě péče, ekonomické analýze a přehledech a tyto návody slouží jako rozhodující kontrolní seznamy pro kritické posuzování (viz dodatek 1). Při posuzování kvality publikace je třeba položit tři předběžné otázky. 39.3.1 PROČ BYLA STUDIE PROVEDENA A JAKOU HYPOTÉZU AUTOŘI TESTOVALI? Úvodní věta výzkumné práce by měla v kostce uvádět, jaké je pozadí daného výzkumu. Například „Založení tubotym-panální drenáže je běžnou procedurou u dětí a ukázalo se, že ne všechny operace jsou z klinického hlediska nezbytné". Za tímto tvrzením by měl následovat krátký přehled publikované literatury, například „Prospektivní průřezová studie Gupty a Browna o zavádění tubotympanálních drenáží ukázala, že...". Autoři běžně zapomínají zasadit svůj výzkum do souvislostí, jelikož pozadí vědeckého úkolu je jim nad slunce jasné až do chvíle, kdy se dostanou do stadia sepisování výsledků. Pokud tak již nebylo učiněno v úvodu, v části metody by měla být jasně uvedena hypotéza, již se autoři rozhodli testovat, jako „Záměrem této studie bylo určit, zda jednodenní operace hernie je pro pacienty bezpečnější a přijatelnější, než standardní procedura za hospitalizace". A opět, tento důležitý krok může být vynechán nebo, což je běžnější, pohřben někde uprostřed odstavce. Pokud je hypotéza předložena negativně (což obvykle je), jako „Přídavek metforminu k maximální dávce sulfonylurey nezlepší kontrolu diabetu 2. typu", je známa jako nulová hypotéza. Autoři studie jen vzácně skutečně věří v nulovou hypotézu, když se pouštějí do svého výzkumu. Jelikož jsou to jen lidé, jsou již obvykle rozhodnuti ukázat rozdíl mezi dvěma sledovanými soubory ve své studii. Ale způsob, jakým to dělají vědci, je říci „Předpokládejme, že žádný rozdíl není; nyní se pokusme tuto teorii vyvrátit". Tento hypoteticko--deduktivní přístup (formulace zpochybňujících hypotéz a poté přechod k jejich testování) je skutečnou podstatou vědecké metody. 39.3.2 JAKÝ TYP STUDIE BYL POUŽIT? Nejprve je třeba zjistit, zdali daná publikace popisuje primární nebo sekundární studii. Primární studie zprostředkují výzkum z první ruky, zatímco sekundární (integrující) studie se pokoušejí shrnout a vyvodit závěry ze studií primárních. Primární studie, základ většiny výzkumu publikovaného v lékařských časopisech, obvykle spadají do jedné ze tří kategorií. • Experimenty, při nichž se nějaký manévr provádí na zvířatech nebo dobrovolnících za umělých a kontrolovaných podmínek. • Klinické pokusy, při nichž intervence, jako je farmako-terapie, se nabídne skupině pacientů, kteří jsou pak dále sledováni, aby se vidělo, co se s nimi bude dít. • Průzkumy, při nichž se něco měří ve skupině pacientů, zdravotníků nebo některých dalších vybraných skupin osob. Sekundární výzkum tvoří: • přehledy které je možno dělit na: - (nesystematické) přehledy, které shrnují primární studie 687 - systematické přehledy, které toto dělají podle přísné a předem definované metodologie - meta-analýzy, které v sobě spojují číselné údaje z více než jedné studie • oficiální doporučení, které vyvozují závěry z primárních studií a jsou o tom, jak by klinici měli postupovat • rozhodovací analýzy, které používají výsledky primárních studií k tvorbě rozhodovacích schémat pravděpodobnosti, které pakvyužívají zdravotníci i pacienti při rozhodování o klinických otázkách nebo o přidělování zdrojů • ekonomické analýzy, které vycházejí z výsledků primárních studií a mají říci, zdali postup určité činnosti je dobrým využitím zdrojů. 39.3.3 BYL POUŽITÝ DESIGN VHODNÝ VZHLEDEM K OBLASTI PROVÁDĚNÉHO VÝZKUMU? Byla randomizovaná kontrolovaná studie tou nejlepší metodou k testování dané hypotézy a pokud ona studie nebyla randomizovaným kontrolovaným pokusem, měla jím být? Jakou oblast výzkumu studie pokrývá? Byl proveden správný typ studie pro danou oblast výzkumu? Randomizované kontrolované studie V randomizované kontrolované studii (RCT = randomized conrol trial) jsou její účastníci náhodně přidělováni procesem odpovídajícím házení mince buď do skupiny k intervenci (jako je farmakoterapie) nebo do kontrolní skupiny (jako je podání placeba). Obě skupiny se sledují po určené časové období a analyzují se v pojmech specifických výsledků definovaných na počátku studie (například úmrtí, srdeční záchvat, hladina cholesterolu v séru atd.). Protože jsou tyto skupiny v průměru totožné až na intervenci, jakékoli rozdíly ve výsledku lze teoreticky přisoudit intervenci. Avšak ve skutečnosti ne každá RCT je přesná. Některé publikace předkládající studie porovnávající intervenční a kontrolní skupinu ve skutečnosti vůbec nejsou randomizované. Jejich označení je jiné kontrolované klinické studie, což je pojem užívaný k popisu srovnávacích studií, v nichž byly subjekty přiděleny do intervenční a kontrolní skupiny nenáhodným způsobem. Tato situace může například vzniknout tam, kde náhodné přidělování není možné, praktické nebo etické. Některé studie se počítají za kompromis mezi pravými randomizovanými a nerandomizovanými studiemi. V takových studiích se randomizace (náhodné přidělování účastníků studie do jedné ze dvou skupin) neděje doopravdy namátkově (například použitím postupně číslovaných zapečetěných obálek, které mají uvnitř počítačem vytvořená náhodná čísla), ale nějakou metodou připouštějící to, že klinik ví, ve které skupině pacient bude, ještě předtím, než učiní konečné rozhodnutí o randomizaci pacienta. To dovoluje, aby se vloudily jemné systematické chyby, jelikož může být více (či méně) pravděpodobné, že klinik zahrne určitého pacienta do studie, pokud doufá, že pacient dostane účinnou léčbu. Zejména pacienti s těžším onemocněním mohou být podvědomě vyloučeni ze skupiny, která dostává placebo. Příklady nepřijatelných metod zahrnují randomizaci podle poslední číslice v datu narození (sudá čísla do skupiny A atp.), házení mince, postupné přidělování (pacient A do skupiny 1, pacient B do skupiny 2 atp.) a podle datumu návštěvy kliniky (všichni pacienti z tohoto týdne do skupiny 1 a všichni, kteří přijdou příští týden, do skupiny 2). Následují příklady klinických otázek, na něž by nejlepší odpověď přinesla randomizovaná kontrolovaná studie: • Je tento lék lepší na určité onemocnění než placebo nebo jiný lék? • Je nový chirurgický postup lepší než současná oblíbená praxe? • Je lepší leták nebo ústní rada, chceme-li pomoci pacientovi při jeho informované volbě léčebných možností v určité situaci? • Ovlivní přechod z margarínu bohatého na nasycené tuky na margarín bohatý na tuky s více nenasycenými vazbami významně hladinu sérového cholesterolu? Říká se, že RCT jsou zlatým standardem v lékařském výzkumu. Je to pravda, ale jen pro určité typy klinických otázek . Otázky, které se nejlépe hodí pro design RCT, jsou všechny ohledně intervencí a týkají se hlavně léčby nebo prevence. Mělo by se však pamatovat na to, že i když zkoumáme léčebné intervence , existuje řada důležitých nevýhod spojených s randomizovanými studiemi. Pamatujte také na to, že výsledky RCT mohou mít omezenou použitelnost v důsledku vylučovacích kritérií (pravidel toho, kdo nemůže být zahrnut do studie), systematické chyby při zahrnutí do studie (výběr subjektů ze skupiny, která nereprezentuje všechny se sledovaným stavem , odmítnutí určitých skupin pacientů aby byli zařazeni do studie , analýzy pouze předem definovaných „objektivních" ukazatelů, což může vyloučit důležitá kvalitativní hlediska intervence a publikační systematické chyby (tj. výběrové uveřejnění pozitivních výsledků). Dále, RCT mohou být dobře nebo špatně provedeny a jak již jsou jednou publikovány, jejich výsledky mohou být překrouceny přehnaně nadšenou vědeckou obcí nebo dychtivostí veřejnosti po novém zázračném léku. Zatímco všechny tyto problémy se mohou vyskytnout i u jiných designů studií, jsou obzvláště aktuální tehdy, pokud je nějaká RCT předkládána jako čistá po metodologické stránce. Navíc je mnoho situací, v nichž RCT jsou buď po-stradatelné, nepraktické nebo nevhodné. RCT jsou postradatelně • Když byla objevena jasně úspěšná intervence u jinak fatální zdravotní situace. • Pokud předchozí RCT nebo meta-analýza daly konečný výsledek (buď pozitivní nebo negativní ). Někteří lidé mohou argumentovat , že je skutečně neetické žádat pacienty, aby se nechali randomizovat pro klinickou studii, aniž by byla nejprve provedena systematická rešerše literatury za účelem zjištění, je-li vůbec třeba takovou studii provádět. RCT jsou nepraktické • Tam, kde by bylo neetické usilovat o souhlas k randomizaci. • Tam, kde je počet pacientů potřebný na to, aby se ukázal významný rozdíl mezi skupinami, nevýhodně vysoký RCT jsou nevhodné • Tam, kde studie sleduje prognózu nemoci. Pro takovou analýzu je vhodnou cestou k nejlepším důkazům longitu-dinální studie s řádně sestavenou počáteční kohortou • Tam, kde studie sleduje platnost diagnostického nebo screeningového testu. Pro takovou analýzu je správnou cestou k důkazům průřezová studie u pacientů s klinickým podezřením na odpovídající poruchu • Tam, kde předmětem studie je „kvalita péče" a kde kri- 688 téria „úspěchu" ještě nebyla stanovena. Například RCT srovnávající farmakologické a chirurgické metody potratu může hodnotit „úspěch" v takových pojmech jako počet pacientek, u nichž se dosáhlo kompletní evakuace dělohy, velikost krvácení a úroveň bolesti. Avšak pacientky mohou trvat na tom, že jsou důležitá jiná hlediska dané procedury, jako možnost vědět dopředu, jak dlouho bude výkon trvat, to, aby neviděly nebo necítily odchod potraceného embrya, a tak dále. Pro takovou analýzu je odpovídající cestou k dobrým důkazům nějaká kvalitativní výzkumná metoda. Všechny tyto položky podrobně diskutuje klinická epidemiologie, která připomíná, že ohrnování nosu nad neran-domizovanou studií může ukazovat na nedostatek vědecké moudrosti a ne, jak mnozí lidé běžně předpokládají, intelektuální důkladnost. Kohortové studie V kohortové studii jsou dvě nebo více skupin osob, vybrány na základě odlišností v expozici určitému činiteli (jako je očkování, lék nebo toxická látka z prostředí) a jsou pak sledovány, aby bylo vidět, u kolika z nich v každé skupině se vyvine určité onemocnění či jiný následek. Období sledování v kohortové studii se obecně počítá na roky (a někdy desetiletí), jelikož to je doba, jakou zabere vývoj mnohých nemocí, zvláště rakoviny. Zatímco RCT obvykle studují pacienty, většina kohortových studií se zaměřuje na zdravé osoby, u kterých se onemocnění může nebo nemusí vyvinout. Zvláštní typ kohortové studie je možno použít ke stanovení prognózy nemoci (tj. co se pravděpodobně stane s člověkem, který má uvedenou nemoc). Sestaví se skupina pacientů, u nichž bylo diagnostikováno, že mají časné stadium nemoci, nebo mají pozitivní screeningový test (počáteční kohorta), a potom se sledují při opakovaných příležitostech, aby se zjistila incidence (nové případy za rok) a časový průběh různých následků. Světově nejproslulejší kohortovou studii, která svým dvěma původním autorům vysloužila rytířský stav, provedli Sir Austen Bradford Hill, Sir Richard Doll a později Richard Peto. U 40 000 britských lékařů rozdělených do čtyř kohort (nekuřáci a dále slabí, střední a silní kuřáci) sledovali jak celkovou mortalitu (úmrtí z jakékoli příčiny) tak mortalitu podle jednotlivých příčin (úmrtí na určitou nemoc). Publikování jejich předběžných výsledků po 10 letech v roce 1964 ukázalo podstatný rozdíl jak v celkové mortalitě tak v mortalitě na rakovinu plic u kuřáků se vztahem „dáv-ka-odpověď" (tj. čím víc kouříte, tím větší máte šanci dostat rakovinu plic). Také se prokázalo, že vztah mezi kouřením a poškozením zdraví je spíše příčinný než náhodný. 201eté a 401eté výsledky této závažné studie (která dosáhla působivého sledování 94% těch, kteří byli vzati do studie v roce 1951 a o nichž nebylo známo, že zemřeli) názorně předvedly nebezpečnost kouření i sílu důkazů, které lze získat z řádně vedené kohortové studie. Klinické otázky, které by měly být předmětem kohortové studie, jsou například následující: • „Způsobuje" orální antikoncepce rakovinu prsu? (slovo „způsobuje" je potenciálně zavádějící termín skrývající v sobě nebezpečí. Jak řekl John Guillebaud ve své vynikající knize The Pili, pokud by 1000 žen zítra začalo s orální antikoncepcí, některé z nich by dostaly rakovinu prsu. Ale některé z nich by ji dostaly i tak. Otázka, kterou se pokoušejí epidemiologové zodpovědět prostřednictvím kohortových studií, je „Jaké je přídatné riziko rozvoje rakoviny prsu u ženy, v důsledku orální antikoncepce ve srovnání s jejím „základním" rizikem, jež lze přisoudit její vlastní hormonální rovnováze, rodinné anamnéze, výživě, alkoholu a tak dále?" • Způsobuje kouření rakovinu plic? • Zlepšuje se časem vysoký krevní tlak? • Co se stane s dítětem, které se narodilo velice předčasně, pokud jde o následný tělesný vývoj a dosažené vzdělání? Studie případů a kontrol Ve studii případů a kontrol jsou pacienti s určitou nemocí nebo stavem (případy) „spárováni" s kontrolami (pacienty s nějakou jinou nemocí, všeobecnou populací, sousedy nebo příbuznými). Poté se sbírají údaje (například zpětným prohledáváním chorobopisu nebo dotazováním se na jejich osobní anamnézu) o minulé expozici možnému etiologické-mu agens dané nemoci. Podobně jako kohortové studie se studie případů a kontrol obecně zabývají spíše etiologií nemoci (tj. co ji způsobuje) než její léčbou. V hierarchii důkazů stojí níže, ale tento design je obvykle jedinou možností při studiu vzácných stavů. Důležitým zdrojem potíží (a možné systematické chyby) je u studie případů a kontrol přesná definice toho, kdo se počítá za „případ", jelikož jeden špatně označený subjekt může podstatně ovlivnit výsledky. Navíc studie případů a kontrol nemůže prokázat kauzalitu ; jinými slovy vztah (asociace) mezi A a B ve studii případů a kontrol neprokazuje, že A je příčinou B. Klinické otázky vhodné pro studii případů a kontrol jsou například následující: • Zvyšuje poloha na břiše ve spánku riziko úmrtí kojence ve spánku (syndrom náhlého úmrtí kojenců, SIDS)? • Způsobuje očkování proti černému kašli poškození mozku? • Způsobují nadzemní elektrické kabely leukémii? Průřezové studie Pravděpodobně jsme byli již všichni požádáni o účast v nějaké průřezové studii, i když to byla jen paní na ulici, která se nás tázala, které značce zubní pasty dáváme přednost. Průřezové studie vedené epidemiology mají zcela nezbytně stejné rysy: s reprezentativním výběrem osob (nebo pacientů) se vedou rozhovory, vyšetřují se nebo se jinak studují za účelem získání odpovědí na nějakou specifickou klinickou otázku. U průřezových studií se data sbírají v jednom časovém okamžiku, ale mohou se zpětně vztahovat na zdravotní otázky v minulosti, jako například studium zdravotní dokumentace pacientů, aby bylo vidět, jak často jim byl měřen krevní tlak v posledních pěti letech. Klinické otázky, které by měly být zodpověděny průřezovou studií, jsou například následující: • Jaká je „normální" výška 31etého dítěte? (Toto, podobně jako jiné otázky o normálních rozmezích, lze zodpovědět jednoduše měřením výšky u dostatečného počtu zdravých 31etých dětí. Takové měření ale nepřinese odpověď na přidruženou klinickou otázku „Kdy by se mělo neobvykle malé dítě vyšetřovat na přítomnost nemoci?", jelikož, jako téměř u všech biologických měření, se fyziologické (normální) překrývá s patologickým (abnormálním). • Co si psychiatrické sestry myslí o hodnotě elektrokonvul-zívní terapie (ECT) v léčbě těžké deprese? • Je pravda, že „polovina všech případů diabetu je nedia-gnostikována"? (Toto je příklad obecnější otázky „Jaká je prevalence (podíl lidí s určitým stavem) dané nemoci v této společnosti?" Jediným způsobem, jak najít odpověď, je provést definitivní diagnostický test u reprezentativního vzorku populace.) 689 Kazuistiky Kazuistika popisuje historii vzniku onemocnění u jednotlivého pacienta v podobě příběhu („Paní B je 541etá sekretářka, u níž se objevila bolest na hrudi v červnu 2000...")- Popisy jednotlivých případů se často mohou sdružit a pak tvoří sérii případů, v níž se popisuje historie vzniku zdravotních potíží u více než jednoho pacienta s konkrétním onemocněním, aby byly ukázány na příklad výsledky léčby nebo v současnosti nejčastěji, nežádoucí reakce na léčbu. Ačkoli je tento typ výzkumu tradičně považován za poměrně slabý vědecký důkaz, dá se kazuistikou sdělit hodně informací, které by se v klinické studii ztratily. Navíc kazuistiky jsou okamžitě pochopitelné pro praktické lékaře a laickou veřejnost. Je-li to nutné, mohou být sepsány a uveřejněny za několik dní, což jim dává jistou převahu nad meta-analýzami (které se chystají na svět celé roky) a klinickými studiemi (několik měsíců). Určitě existuje v rámci lékařského stavu silná nátlaková skupina volající po znovu-uvedení skromné kazuistiky do role užitečného a platného příspěvku lékařské vědě. Mezi klinické situace, v nichž je kazuistika nebo série případů vhodným typem studie, patří na příklad následující: • Lékař si všimne, že dvě děti narozené v jeho nemocnici nemají končetiny (fokomelie). Obě matky braly v raném těhotenství nový lék (thalidomid). Lékař chce co nejrychleji upozornit své kolegy po celém světě na možnost postižení v souvislosti s lékem. (Každý, kdo si myslí, že kazuistiky nemají žádné vědecké oprávnění, by si měl vzpomenout na tento příklad.) • Pacient, který užíval dva různé léky, terfenadin (na sennou rýmu) a itrakonazol (na mykózu), bez jakýchkoli nežádoucích účinků v minulosti, je nyní užívá oba současně a rozvíjí se u něj život ohrožující porucha srdečního rytmu. Jeho ošetřující lékaři mají podezření, že jde o interakci těchto dvou léků. Tradiční hierarchie důkazů Různé typy primárních studií, pokud jde o rozhodnutí o klinických intervencích („hierarchie důkazů"), mají následující pořadí od nejlepší až po nejméně validní. • Systematické přehledy a meta-analýzy • Randomizované kontrolované studie s validními výsledky (tj. intervaly spolehlivosti, jež se nepřekrývají s prahem klinicky významného účinku) • Randomizované kontrolované studie s méně validními výsledky (tj. výstup ze studie naznačuje klinicky významný účinek, ale intervaly spolehlivosti se překrývají s prahem pro tento účinek) • Kohortové studie • Studie případů a kontrol • Průřezové studie • Kazuistiky Je zcela na místě, že vrchol hierarchie je vyhrazen pro sekundární výzkumné práce, v nichž jsou obsaženy všechny primární studie na určité téma, které byly kriticky posouzeny podle přísných kritérií. Ale ani zastánci nejtvrdší linie medicíny založené na důkazu by neumístili nepořádnou meta--analýzu či randomizovanou kontrolovanou studii s vážnými metodologickými trhlinami nad velkou, dobře uspořádanou kohortovou studii. Mnoho důležitých a platných studií na poli kvalitativního výzkumu vůbec v této konkrétní hierarchii důkazů nefiguruje. Jinými slovy, vyhodnocení příspěvku určité studie lékařské vědě vyžaduje značně více úsilí, než abychom si ji pouze na základě jejího designu zaškrtli na výše uvedené sedmibodové stupnici. 690 39.4 PŘÍNOS EBM PRO LÉKAŘE A PRO PACIENTA V souvislosti s novou filozofií medicíny založené na důkazu se nabízí otázka, zda kliničtí lékaři mohou z časových i jiných důvodů skutečně tento nový přístup aplikovat ve své klinické praxi.Studie u praktických lékařů ve Spojeném království ukázala, že většina lékařů věnovala alespoň část svého času nalezení nejlepšího důkazu v tzv. „vyhledávacím modulu" tím, že používala sumarizující informace od jiných autorů (72%) nebo EBM směrnice a protokoly (84%). Na druhé straně asi jenom 20% z nich umělo kriticky zhodnotit význam intervalů spolehlivosti. Konečně jenom 5% bylo přesvědčeno, že získáním těchto nových znalostí a dovedností EBM je tou správnou cestou k přechodu od medicíny založené na zkušenosti a názoru k medicíně založené na důkazu. Další otázkou je, zda klinický lékař i když je přesvědčen o významu a nezbytnosti postupů EBM, je schopen ve své časově náročné klinické praxi získat potřebný důkaz dostatečně včas. Na několika málo příkladech se ukázalo že ano. Když velmi vytížená ambulance lůžkového oddělení (180 a více příjmů za měsíc) používala elektronické sumarizace důkazu, které byly již kriticky zhodnoceny zkušenými členy týmu (CATs = critically appraised topics = kriticky zhodnocená témata), nebo sumarizace z časopisu Best Evidence, ukázalo se, že k okamžitému vyhodnocení tohoto materiálu pro konkrétního pacienta stačí 10-25 sekund. Navíc z hlediska mladších členů ošetřujícího týmu změnily tyto důkazy ve 25% jejich diagnostické a terapeutické názory a u dalších 23% jim přidaly další vědomosti. Konečně třetí otázkou zůstává, zda lékař, i když je schopen získat potřebný důkaz pro své rozhodování, jej může aplikovat pro „evidence-based" péči o své pacienty. Z auditu na pracovištích, která praktikovala jak vyhledávací tak i kritický modul vyplynulo, že 82% rozhodnutí bylo „evidence--based"(53% na základě výsledků klinických pokusů nebo systematických přehledů a 29% na základě přesvědčivých ale neexperimentálních důkazů). Podobné výsledky byly získány z auditů na psychiatrických, chirurgických, dětských i interních odděleních. Kromě přínosu EBM pro lékaře je také důležité, zda tyto nové postupy přináší zlepšení výsledků lékařské péče pro pacienta. Zatím žádná studie neodpověděla na tyto otázky, protože nebyly dosud překonány problémy jako je velikost vzorku, působení bias, zaslepení a dlouhodobé sledování, což by vědecká studie na toto téma vyžadovala. Navíc jsou zde i významné etické otázky při rozdělování pacientů do skupiny používající důkaz, nebo do skupiny kontrolní. Na druhé straně řada populačních studií, zaměřených na vyhodnocení následků ukázala, že pacienti, kteří byli léčeni na základě „důkazu", měli lepší výsledky. Jeden z pozitivních příkladů je nižší mortalita u pacientů po infarktu myokardu, kterým byla ordinována léčba aspirinem nebo betablokátory, dalším příkladem může být snížení mortality na akutní ce-rebrovaskulární příhodu o více než 20% tam, kde pracoviště častěji aplikovalo Warfarin a byla v provozu speciální cereb-rovaskulární jednotka intenzivní péče. Naopak negativním příkladem může být třikrát častější akutní cerebrovaskulární příhoda nebo smrt v nejbližších měsících u pacientů operovaných na karotidách, pokud nesplňovali „evidence-based" operační kritéria. 39.5 LIMITACE EBM Ověřování koncepce a provádění EBM klinickými pracovníky i teoretiky přineslo jak pozitivní tak i negativní reakce. Diskuse o těchto problémech připomněla , že existují 3 obecné limitující faktory ve vědecké práci ať už v základním nebo aplikovaném výzkumu a také v medicíně - nedostatek souvislých a pevných vědeckých důkazů, problémy při aplikaci jakéhokoliv důkazů do péče o jednotlivého pacienta a překonávání barier při snaze o provádění lékařské praxe na vysoké vědecké úrovni. Současně byly identifikovány 3 limitující faktory, které jsou unikátní pro provádění EBM. Předně potřeba nabytí nových dovedností při vyhledávání a kritickém hodnocení důkazů může být odrazující, i když lékařská péče založená na principech EBM může být úspěšně prováděna i při zvládnutí pouze vyhledávacích technik a používání už předem kriticky zhodnocených materiálů. Za druhé - časově zaneprázdnění klinici mají jen omezený časový prostor pro zvládnutí a aplikaci těchto nových dovedností a navíc zdroje požadované pro stálou dostupnost důkazů jsou v řadě zdravotnických zařízení nedostatečné. A konečně důkaz, že EBM skutečně funguje často přichází pomalu a pozdě. Na druhé straně diskuse o významu EBM odhalily také řadu „pseudolimitujících" faktorů, které většinou vznikly z nepochopení vlastního principu EBM. Prověření definice a jednotlivých kroků EBM rychle odmítlo kritiku, že EBM pouze očerňuje klinickou zkušenost lékařů, omezuje se pouze na klinický výzkum, ignoruje pacientovi hodnoty a preference a vytváří systém přístupu „kuchařky" k medicíně. Navíc EBM není v žádném případě přístup, který by zlevnil lékařskou praxi, protože prováděním EBM péče, za účelem zlepšení kvality života pacientů, náklady spíše stoupají a „hněv" zdravotnických manažerů a ekonomů také. Kromě toho řada praktických lékařů spontánně přiznala používání vyhledávacího modulu ve své praxi a tím jednoznačně vyvrátila tvrzení, že EBM je postupem, který je vhodný jen pro špičku vyvolených. Na řadě příkladů byla vyvrácena i domněnka, že EBM vede k „terapeutickému nihilismu" v případech, kde nejsou k dispozici výsledky klinického pokusu v daném problému. Kritikové medicíny založené na důkazu by ji mohli definovat jako „stále módnější tendence skupiny mladých, sebejistých a vysoce matematicky zdatných lékařských vědeckých pracovníků, snižovat práci zkušených kliniků pomocí kombinace epidemiologického žargonu a statistických kejklí" nebo „argument, obvykle předkládaný s téměř evangelizačním zápalem, že by žádný lékař, sestra, spotřebitel zdravotních služeb ani politik neměl vůbec nic podniknout ve vztahu ke zdraví, pokud a dokud se výsledky několika velkých a drahých výzkumných studií neobjeví v tisku a nejsou schváleny výborem expertů". Jiní staví své výhrady ještě silněji: „zdá se, že medicína založená na důkazu nahrazuje původní nálezy subjektivně vybranými, arbitrárne shrnutými, přepranými a ovlivněnými závěry neurčené platnosti či úplnosti. Provozují ji lidé neznámých schopností, zkušeností a dovedností, kteří používají metody, jejichž neprůhlednost brání vyhodnocení původních údajů". Tyto názory však byly již na základě opakované pozitivní zkušenosti s EBM vyvráceny. Přesto přirozeně, jako u každého jiného postupu zde existují výše popsané limitace, které ovšem nijak nesnižují základní význam EBM pro provádění lékařské praxe ve všech oborech medicíny. 691 40 ZÁKLADNI SOUČÁSTI EBM 40.1 SPRÁVNA FORMULACE KLINICKÉ OTÁZKY Prakticky ve všech případech, kdy pacient přichází k lékaři, vzniká potřeba nové informace, k některým otázkám diagnostiky, terapie i prognostické úvahy. Tyto informace jsou ve formě existujícího externího důkazu, který je třeba najít. Pro mnoho kliniků představuje formulace správné klinické otázky a pak vyhledávání odpovědi ve formě validního důkazu takový problém, že se i vzhledem k časové tísni k tomu nikdy neodhodlají. 40.1.1 FORMULACE PROBLÉMU Když by na příklad studenti medicíny byli požádáni, aby napsali pojednání o vysokém krevním tlaku, vyprodukují často dlouhé, učebnicové a v zásadě správné výpovědi o tom, co je vysoký krevní tlak, co je jeho příčinou a jaké jsou léčebné možnosti. Toho dne, kdy svá pojednání odevzdávají, ví většina z nich o vysokém krevním tlaku více než již praktikující lékař. Je jim jasné, že vysoký krevní tlak je nejběžnější jednotlivou příčinou mozkové mrtvice a že odhalení a léčba vysokého krevního tlaku u každého sníží incidenci mozkové mrtvice téměř o polovinu. Většina z nich si je vědoma toho, že mozková mrtvice, ač devastující, když k ní dojde, je spíše vzácnou příhodou a že léky na krevní tlak mají vedlejší účinky jako je únavnost, závratě, impotence a situace, kdy člověk „nedoběhne", je-li daleko k toaletě. Ale když je jim položena praktická otázka jako „U paní Novákové došlo k závratím při užívání těchto léků na krevní tlak a ona chce ukončit veškerou medikaci; co byste jí poradili?", jsou zmateni. Cítí s paní Novákovou v jejích nesnázích, ale nedokáží vytáhnout ze svých stránek hustě psaného textu to jediné co paní Nováková potřebuje vědět. Zkušení lékaři (a mnohé sestry) by si mohli myslet, že dokáží zodpovědět otázku paní Novákové na základě vlastních osobních zkušeností a několik z nich může mít pravdu. A i kdyby měli v tomto případě pravdu, potřebovali by všezahrnující systém na převedení změti informací o pacientovi (soubor chorobných příznaků, fyzikální známky, výsledky testů a znalost toho, co se minule přihodilo tomuto nebo podobnému pacientovi), pacientových strachů a hodnot a dalších věcí, jež mohou mít ve vztahu k dané situaci význam (tušení, napůl zapamatovaný článek, názor staršího a moudřejšího kolegy nebo náhodou objevený odstavec při listování učebnicí) na krátký souhrn toho, o jaký problém jde a jaké specifické doplňující informace jsou potřeba, aby mohl být tento problém vyřešen. Sackett a spol. nedávno publikovali návod na položení dobré klinické otázky (Sackett, 1991): • Nejprve přesně definujte, o kom otázka je (tj. ptejte se „Jak bych popsal skupinu pacientů podobnou této?"). • Potom definujte, jaký manévr zvažujete u tohoto pacienta nebo populace (například farmakoterapii) a, je-li to nutné, manévr pro porovnání (například placebo nebo běžnou standardní léčbu). • Nakonec definujte žádoucí (nebo nežádoucí) výsledek (například snížení mortality, lepší kvalitu života, celkovou úsporu nákladů na zdravotní služby a tak dále). Druhý krok se ve skutečnosti nemusí týkat farmakotera-pie, chirurgické operace nebo jiné intervence. Tím „manévrem" může například být expozice domnělému karcinogénu nebo rozpoznání určitého náhradního cílového ukazatele v krevním testu nebo v jiném vyšetření. (Náhradní cílový ukazatel je něco, co předpovídá, nebo se říká, že předpovídá, pozdější vývoj nebo progresi onemocnění).Ve skutečnosti je velmi málo testů, které spolehlivě fungují jako křišťálová koule pro pacientovu budoucnost, pokud jde o zdraví (tvrzení „Lékař se podíval na výsledky testů a řekl mi, že mám šest měsíců života" obvykle odráží buď špatnou paměť nebo nezodpovědný lékařův přístup!). V obou těchto případech bude „výsledkem" vývoj rakoviny (nebo jiného onemocnění) o několik let později. Avšak u mnoha klinických problémů s jednotlivými pacienty sestává onen „manévr" ze specifické intervence zahájené zdravotníkem. Tedy, v případě paní Novákové by mohla otázka vypadat asi takto: „U 681eté pacientky s esenciální hypertenzí, žádným dalším onemocněním a nevýznamnou anamnézou, převáží výhody pokračování léčby hydrochlorothiazidem (především snížené riziko mozkové mrtvice) nad obtížemi?". Za povšimnutí stojí, že při formulaci této specifické otázky bylo již stanoveno, že paní Nováková nikdy neměla srdeční záchvat, mozkovou mrtvici nebo časné varovné známky jako přechodnou paralýzu nebo ztrátu zraku. Pokud by měla, riziko následné mozkové mrtvice u ní by bylo mnohem vyšší a bylo by třeba pozměnit rovnici riziko-prospěch, aby tyto skutečnosti odrážela. Pro zodpovězení položené otázky, je třeba určit nejen riziko mozkové mrtvice u neléčené hypertenze, ale také pravděpodobný pokles rizika, který je možno očekávat u far-makoterapie. To je ve skutečnosti parafráze obecnější otázky („Převáží v tomto případě prospěch z léčby nad riziky?"), která však měla být položena na prvním místě předtím, než byl paní Novákové předepsán hydrochlorothiazid, a kterou by si ovšem měli klást všichni lékaři pokaždé, když sahají po bloku s recepty. U paní Novákové není nezbytnou alternativou k pokračování léčby tímto lékem neužívat vůbec žádný lék, protože mohou být jiné léky se stejným účinkem, ale s méně významnými vedlejšími účinky nebo nefarmakologická intervence , jako je cvičení, omezení soli, nebo akupunktura. Ne všechny z těchto přístupů by paní Novákové pomohly nebo byly pro ni přijatelné, ale bylo by docela vhodné pátrat po důkazech zdali by jí mohly pomoci. Odpovědi na některé z těchto otázek by se jistě našly v lékařské literatuře a kapitola 2.2 popisuje, jak hledat odpovídající publikace, jakmile už byl problém formulován. Ale než bude započato vyhledávání důkazu, je dobré věnovat ještě jednomu aspektu významnou pozornost v případě pacientky s vysokým krevním tlakem. Aby bylo možno stanovit její osobní priority (jak hodnotí 10% pokles rizika mozkové mrtvice během pěti let ve srovnání s neschopností jít dnes bez doprovodu nakupovat?), je třeba jít přímo za paní Novákovou a ne za specialistou přes vysoký krevní tlak či do databáze Medline! V raných dnech medicíny založené na důkazu bylo značné nadšení pro používání schémat v rozhodovacích procesech lékařů. Aby ale byla i pacientova perspektiva zahrnuta do léčebné volby založené na důkazu, to se v praxi často ukazovalo jako nemožné, protože zkušenosti pacientů jsou složité příběhy, které odmítají být omezeny na schéma s rozhodováními typu ano/ne. Možná nejsilnější kritikou medicíny založené na důkazu je, že potenciálně vypouští pacientovu vlastní perspektivu při jeho nemoci ve prospěch průměrného účinku na vzorek populace nebo různé průměr- 692 né ukazatele vypočítané lékařskými statistiky. V několika minulých letech dosáhlo hnutí medicíny založené na důkazu rychlého pokroku v rozvoji praktičtější metodologie pro začlenění perspektivy pacienta do klinického rozhodování, v zavedení politiky opírání se o důkazy a v designu a provádění výzkumných pokusů. Správnou formulaci klinických otázek je možno prezentovat na následujícím příkladu: Na interní oddělení byl přijat 77letý muž s dusností a teplotou. Onemocněl před 4 dny s příznaky mírné teploty, rýmy, mrazením, bolestmi ve svalech a s neproduktivním kašlem. Den před přijetím se objevila dusnost po námaze, hnisavé sputum, bolest na boku hrudníku v inspiriu a třesavka. Jeho celkový zdravotní stav je docela dobrý. Již 12 let má esenciální hypertenzi, dobře kompenzovanou diuretickou léčbou. Nekouří a doma se sám o sebe postará. Při vyšetření byl počet dechů 28, puls 108 a teplota 39.2 °C. Měl lehkou cya-nózu, hrudník se rozevíral symetricky a neměl prodloužené expirium. Byla zjištěna leukocytóza a hyponatremie. Jako přijímací diagnóza byla určena pneumonie s hypo-xemií, byl naplánován rtg plic, vyšetření sputa a ordinován kyslík a antbiotika. Při vizitě byli požádáni lékaři o otázky k tomuto případu. První otázka, která se nabízí je: „jaké mikrobiální agens způsobuje pneumonii?" Tato otázka patří mezi tzv. základní otázky, které mají obvykle dvě komponenty - kořen (základ) otázky .. .kdo, co, kde, kdy, jak proč - porucha (nemoc), aspekty poruchy Příklad: „co způsobuje cyanózu? " Tyto základní otázky mohou pokrývat celou škálu biologických, psychologických a sociologických aspektů lidského zdraví a nemoci. Další otázky od zkušenějších lékařů by mohly vypadat asi takto: • „jsou u pacientů se suspektní pneumonii některé příznaky dostatečně průkazné, aby samy o sobě potvrdily nebo vyloučily pneumonii a nebo je rtg plic nezbytným vyšetřením pro určení diagnózy?" • „je u pacientů s pneumonii pravděpodobnost Legionelové infekce dostatečně velká k tomu, aby byly do počátečního léčebného spektra oprávněně zahrnuta i antibiotika proti této infekci?" • „mohou u pacientů s pneumonii klinické příznaky dostatečně předpovídat průběh a výsledek nemoci, aby nerizi-koví pacienti mohli být bezpečně léčeni doma?" Tyto otázky požadují specifické znalosti o diagnostice, léčbě a prognóze u pacientů s pneumonii, které by mohly být nazývány jako nástavbové znalosti. A otázky, které se na tyto znalosti ptají můžeme také nazývat nástavbové a mají obvykle čtyři komponenty: • pacient a/nebo problém • intervence (velmi široce definovaná zahrnující expozici, léčbu, diagnostický test, prognostický faktor, pacientovo vnímaní apod.) • srovnání intervencí (pokud to je relevantní) • klinický výsledek Příklad: „může u starších pacientů se srdečním selháním v důsledku izolované diastolické dysfunkce přidání digoxinu ke standardní terapii ACE inhibitory a diuretiky poskytnout dostatečnou redukci morbidity a/nebo mortality, aby to vyvážilo jeho nežádoucí vedlejší účinky ? " Stejně jako základní otázky, také tyto nástavbové otázky zahrnují široké spektrum biologických a ostatních aspektů zdraví a nemoci. Potřeba základních a nástavbových otázek podle klinické zkušenosti Obr. 1 nástavbové otázky základní otázky A B C klinická zkušenost Klinik potřebuje jak základní tak i nástavbové znalosti v poměru, který se s časem mění v závislosti na zkušenosti s daným klinickým problémem (obrázek 1 ). Jestliže zkušenost je na úrovni bodu A jako u studenta medicíny, tak většina otázek bude mít charakter otázek na základní znalosti. Jak narůstá klinická zkušenost - bod B - bude vzrůstat poměr otázek nástavbových a nabytím dalších zkušeností - bod C - bude většina otázek nástavbového charakteru. Z obrázku je zřetelné, že nikdo není úplný „zelenáč", aby se nemohl poučit i z nástavbové otázky a na druhé straně nikdo není tak zkušený aby nemohl potřebovat i základní znalosti. 40.2 KDE HLEDAT NEJLEPŠÍ DŮKAZY Již před více než 50 lety řekl dr. Sydney Burwell, děkan Harvardské lékařské fakulty svým studentům: „Polovina toho, co se dnes učíte, nebude za 10 let již pravda, ale problém je v tom, že nevím, která polovina to bude". A v dnešní době je tento problém možná ještě aktuálnější vzhledem k rychlému vývoji znalostí v jednotlivých lékařských oborech. Jedním z řešení tohoto problému rychlého stárnutí vědomostí je „učení se otázkou". To znamená, jestliže existuje nějaká klinická otázka u které není jistota správné a nejlepší odpovědi je třeba se naučit efektivnímu hledání této nejlepší odpovědi v dostupných výstupech lékařské vědy (termín nejlepší odpověď je částečně rizikový, protože někdo může oprávněně namítat, že to co platilo jako nejlepší odpověď vloni, již letos neplatí). Proces učení se otázkou závisí na schopnosti rychlého a efektivního nalezení „nejlepšího důkazu" na daný klinický problém. Zda tento proces bude úspěšný záleží na tom, jak je otázka položená, jaké informační zdroje se používají a na zkušenosti s vyhledáváním nejlepšího důkazu v těchto zdrojích. V této oblasti jsou hodně zkušení knihovníci a jiní odborníci v lékařské informatice, od kterých lze získat cenné informace. Kde tedy hledat nejlepší důkaz? • spalte všechny tradiční učebnice i když se v nich dá nalézt něco užitečného (např. o patofyziologii klinického problému, ale už asi nic moc přínosného o příčinách, diagnostice, léčbě, prognóze a prevenci dané nemoci) 693 • mohou být ale i moderní netradiční učebnice, většinou elektronického charakteru, které však musí být pravidelně a často revidovány (alespoň jednou za rok) a měly by obsahovat řadu odkazů na literaturu, aby se čtenář mohl podívat do originálních zdrojů na detaily (některé moderní učebnice splňují tyto požadavky např. Clinical Evidence, Evidence-Based on Call, Evidence-based Cardiology aj.) • investujte do databází, obsahující potřebné důkazy • v dnešní době již existuje řada elektronických databází, které i když se většinou nesoustřeďují na jednu klinickou oblast, mohou poskytnout potřebné důkazy (Evidence-based Medicine Reviews, Cochrane Database of Systematic Reviews, Best Evidence, Cancerlit, Aidsline, MEDLINE a jiné) • přestaňte používat předplatné pro vaše oblíbené časopisy, protože jsou dnes lepší zdroje platných informací • investujte do „evidence-based" časopisů ve vašem oboru, které mimo jiné přinášejí strukturovaná abstrakta nejlep-ších'studií (někdy se používá termín „sekundární pubika-ce") • dále existují počítačové podpůrné systémy pro klinická rozhodování Jak hledat důkaz pro řešení problémů u daného pacienta? Je třeba se zaměřit na 3 problémy: • položit správně formulovanou otázku (viz kapitola 2.1) • na nejlepší odpověď, kterou jste v současnosti schopni poskytnout • na nejlepší zdroje důkazů, které budete konzultovat při vyhledávání nejlepší odpovědi Příklad: Pan Vomáčka je 56letý účetní, mírně obézní, s diabetem 2 typu, který byl u něho zjištěn před 11 lety. Kouří25 let a snaží se přestat. Zatím u něho nebyly zjištěný žádné komplikace diabetu. Hladina cukru je dobře kontrolována perorálními přípravky, ale má mírně zvýšený krevní tlak, v průměru 158194 mmHg. Je navržena léčba na snížení krevního tlaku. Během posledních 2 let nebyl schopen snížit svoji váhu. Preferuje přírodní přípravky a nechce užívat další předepsanou léčbu. Je přístupný přesvědčování, ale chce vidět důkazy, že snížením krevního tlaku pomocí léčby se pacientům jako je on tj. s diabetem a s hypertenzí více prospěje než uškodí. Jako účetní by rád slyšel určitou kvantifikaci prospěchu, kterou může očekávat z další léčby, kterou mu chcete předepsat. Nyní zkuste sami cvičně odpovědět na 3 výše uvedené problémy. Dále jste zjistili od jeho manželky, že užívá vitamin E a beta-karoten pro snížení rizika srdečního onemocnění, na doporučení své manželky, která informace získala z internetu. Zkuste opět cvičně odpovědět na 3 výše uvedené problémy. Vaše odpověď by mohla znít asi takto: Správně formulovaná otázka: „může u 561etého muže s diabetem 2 typu a s neléčenou hypertenzí medikamentózni kontrola krevního tlaku snížit následnou morbiditu a mortalitu?" Rozhodnutí, kde hledat důkaz - můžeme začít na příklad s Evidence-Based Medicine Reviews a zadáme-li heslo „diabetes mellitus a hypertenze", dostaneme více než 100 odkazů, jestliže přidáme „randomizovaný klinický pokus", sníží se počet odkazů na zvládnutelných 19. Z nich získáme informaci: „antihypertenzivní léčba sníží mortalitu u osob s diabetem, s cílovým krevním tlakem 130/85, doporuče- ným experty". Tento abstrakt však nepodává kvantitativní informaci o prospěchu léčby. V MEDLINE můžeme na toto téma nalézt více než 10000 odkazů a kombinujeme-li naše vyhledávací požadavky, dostaneme se k počtu 63 kontrolovaných studií na toto téma. A na příklad United Kingdom Prospective Diabetes Study ukázala, že intenzivní kontrola krevního tlaku ve srovnání s mírně hypertenzivními pacienty s diabetem 2 typu vedla ke snížení relativního rizika (RR) u 24% pokud cílovým stavem (end point) je diabetes, u 32% pokud jde o úmrtí na diabet, u 44% pokud jde o cerebro-vaskulární příhodu a 37% u mikrovaskulárních komplikací diabetu. Aplikace důkazu: Pokud jste se přesvědčili, že nalezený důkaz je validní a použitelný u pana Vomáčky, pak je třeba s ním tyto poznatky diskutovat a nakonec pan Vomáčka bude souhlasit s navrženou léčbou hypertenze. Ukazovat někomu cestu džunglí, jež se nazývá lékařská literatura, není jednoduchý úkol. Můžete správně číst publikaci podle všech pravidel, ale pokud čtete tu nesprávnou, tak už můžete rovnou dělat něco úplně jiného. V regálech knihovny je obrovské množství lékařských článků a každý měsíc vychází na celém světě okolo 5000 lékařských časopisů a počet různých časopisů, které dnes existují, jen aby shrnuly články v těch ostatních, pravděpodobně přesahuje 250. Jen u 10-15% materiálu, který se dnes objeví v tisku, se následně prokáže trvalá vědecká hodnota. Množství výzkumných studií ukazuje, že klinici si často nejsou vědomi rozsahu lékařské literatury a toho, jak se k ní dostat. Dr. David Jewell ve své vynikající knize Critical reading for primáry care připomíná, že jsou tři úrovně čtení. 1. Listování, kdy se zběžně probíráme knihami a časopisy a pátráme po něčem, co by nás mohlo zaujmout. 2. Čtení pro informace, kdy v literatuře hledáme odpovědi na specifické otázky, obvykle ve vztahu k problému, s nímž jsme se setkali v reálném životě. 3. Čtení pro výzkum, kdy se snažíme získat vyčerpávající pohled na existující stav vědění, neznalosti a nejistoty v definované oblasti. V praxi mnozí z nás většinu svých informací získávají z listování. Nadměrně užívat pravidel kritického posuzování by znamenalo zabít radost z příležitostného čtení. Avšak Jewell nás upozorňuje, abychom řídili své kroky mezi povolnou důvěřivostí vůči všemu a přehnaně náročným inte-lektualizmem formálně kritického posuzování. Databáze MEDLINE Pokud jen tak listujete, můžete číst, co se vám zlíbí, a v libovolném pořadí. Pokud čtete kvůli informacím (cílené vyhledávání) nebo z důvodu výzkumu (systematický přehled), promrháte čas a unikne vám mnoho hodnotných článků, jestliže jen tak náhodně hledáte. Mnohé lékařské články jsou indexovány v obrovské databázi Medline, k níž je téměř univerzální přístup v lékařských a vědeckých knihovnách v rozvinutých zemích. Když pátráte po systematickém přehledu (kontrolované kvality) všech důkazů k určitému námětu, pravděpodobně byste měli začít s databází Cochrane (Cochrane Database of Systematic Reviews) spíše než s Medline, která užívá velice podobných vyhledávacích principů. Pokud však nejste obeznámeni ani s jednou z nich, bude asi snadnější osvojit si Medline. Medline sestavuje knihovna National Library of Medicíne v USA a indexuje (vede ve svém rejstříku) přes 4000 časopisů publikovaných ve více než 70 zemích. Informace v Medline jsou k dispozici ve třech podobách. 694 • Tištěná (Index Medicus, příručka ve formě rejstříku každoročně doplňovaná o novinky, z níž se tvoří elektronická verze). • On-line (celá databáze je od roku 1966 do nynějška ve výkonném centrálním počítači a přístupná elektronickou cestou, například přes Internet). • CD-ROM (celá databáze na 10 až 18 CD v závislosti na výrobci). Databáze Medline je vždy stejná, ať ji prodává jakákoli společnost, ale příkazy, jež potřebujete napsat, abyste se k ní dostali, se liší podle programu na CD-ROM. Komerční poskytovatelé Medline on-line a/nebo na CD-ROM zahrnují Ovid Technologies (OVID), Silver Platter Information Ltd (WinSPIRS), Aries Systems lne (Knowledge Finder) a PubMed. Nejlepší způsob, jak se naučit používat Medline, je sejít se s proškoleným knihovníkem, informatikem nebo jiným zkušeným uživatelem. Nemáte-li odpor k technice, můžete pochytit základy za necelou hodinu. Pamatujte, že články lze najít dvěma způsoby: • Podle kteréhokoli slova v seznamu databáze včetně slov v názvu publikace, abstraktu, podle jména autora a instituce, která výzkum provedla (nepřehlédněte: abstrakt je krátký souhrn toho, o čem je článek, a najdete jej jak v databázi, tak na začátku vytištěného článku). • Podle autorizovaného tematicky uspořádaného seznamu medicínských názvů, známého jako MeSH termíny (pojmy) neboli kategorizované termíny medicínských subjektů. Pro znázornění, jak pracuje Medline, byly zpracovány některé běžné úkoly, jež je třeba zvládnout při vyhledávání. K vytvoření následujících scénářů byl použit program OVID. Vloženy jsou poznámky o programech WinSPIRS (což je systém přednostně užívaný mnoha univerzitami) a PubMed (jenž je bezplatně dostupný na Internetu, přichází s již hotovými vyhledávacími filtry, které můžete vložit stiskem tlačítka, a připojuje vyhledávání PreMedline, databáze toho, co má být brzy publikováno, a nově publikovaných článků). Všechny tyto systémy (Ovid, WinSPIRS a PubMed) jsou určeny k použití s Booleovskou logikou, tj. vkládání určitých slov (jako „hypertension", „therapy" a tak dále) spojených operátory (jako „and", „or" a „not"). Knowledge Finder je odlišný program s Medline, který je nabízen jako systém s „neostrou logikou" (angl. „fuzzy logic"); jinými slovy je zaměřen na zvládnutí celých otázek jako „Jaká je nejlepší léčba hypertenze?" a říká se, že se hodí spíše pro hodně nenáročného uživatele (tj. někoho s malým nebo žádným výcvikem). Pojetí neostré logiky Knowledge Finderu bylo shledáno jako rychlé a účinné a doporučeno jako investice pro vaši organizaci, pokud očekáváte, že hodně neškolených lidí bude provádět své vlastní vyhledávání. Praktická cvičení vložená do této kapitoly jsou rovnocenně proveditelná se všemi typy programů s Medline. Úkol 1: Pokoušíte se najít určitou publikaci, níž víte, že existuje Řešení: Prohledávejte databázi pomocí přípony pole (název, autor, časopis, instituce atd.) nebo pomocí slov v textu. To by nemělo trvat dlouho. Nepotřebujete vyčerpávající hledání tématu. Jděte do té části databáze, jež zahrnuje přibližný rok uveřejnění publikace (obvykle posledních pět let). Výběr tohoto je jednou z prvních věcí, o kterou vás systém požádá, abyste učinili na hlavní vyhledávací obrazovce Medline; pokud již jste v hlavní nabídce Medline, vyberte „database" (Alt-B). Pokud znáte název publikace (nebo přibližný název) a snad i časopis, ve kterém vyšla, můžete použít vyhledávací klíč pro název a časopis nebo (to je rychlejší) přípony oblastí .ti a .jn. Tabulka 2.1 ukazuje některé užitečné přípony užívané OVIDem, z nichž většina již vysvětluje sama sebe. Ale všimněte si, že přípona .ui představuje jedinečné číslo, které můžete použít k identifikaci určité položky v Medline. Pokud najdete článek, který si možná budete chtít vyvolat znovu, je často rychlejší napsat tento jedinečný identifikátor než autora, název, časopis a tak dále. Pokoušíte se třeba najít publikaci něco jako „A survey of cervical cancer screening in people with learning disability", 0 níž si pamatujete, že jste ji viděli v BMJ před pár lety. Ujistěte se, že jste NEzaškrtli rámeček „Map term to subject heading" a potom na počítači zadejte následující. 1 cervical cancer.ti To vám nabídne přibližně 750 možných článků v sestavě 1. Nyní napište: 2 survey.ti Tím dostanete přibližně 4500 možných článků v sestavě 2. Nyní napište: 3 learning disability.ti Dostanete přibližně 100 možných článků v sestavě 3. Nyní napište: 4 BMJ.jn Tímto dostanete několik tisíc článků v sestavě 4, tj. všechny články uvedené v této části databáze Medline pro roky, jež jste vybrali z BMJ. Nyní zkombinujte tyto sestavy tak, že napíšete: 5 1 and 2 and 3 and 4 To vám nabídne cokoli s „cervical cancer" a „survey" a „learning disability" v názvu a zároveň co bylo uveřejněno v BMJ: jediný článek v pěti krocích. Všimněte si, že v OVIDu můžete také kombinovat sestavy použitím tlačítka „combine" nahoře na obrazovce. To vše jste bývali mohli udělat v jednom kroku využitím následujícího příkazu (zkuste jej nyní): 6 (cervical cancer AND survey AND learning disabili-ty).ti and BMJ.jn Tento krok znázorňuje použití boolovského operátoru „and", který vám nabídne články společné oběma sestavám. Použití operátoru „or" jednoduše spojí dohromady obě sestavy. Všimněte si, že v OVIDu byste neměli obecně používat zkratky názvů časopisů, avšak jiné programové balíčky mohou užívat standardních zkratek. Dvěma důležitými výjimkami z tohoto pravidla v OVIDu jsou Journal of the American Medical Association (JAMA) a British Medical Journal, který změnil svůj oficiální název na BMJ v roce 1988. K vyhledávání článků z BMJ od roku 1988 do nynějška musíte použít BMJ; články do roku 1987 včetně musíte hledat jak pod British Medical Journal, tak pod British Medical Journal clinical research ed. Dalším důležitým bodem je, že vyhledávání podle slova v názvu odhalí pouze přesně dané slovo; například toto vyhledávání pomine článek, jehož název je o „learning disabilities" a ne „disability". K zvládnutí tohoto problému potřebujete použít náhradní znak za libovolné znaky (viz dále v tomto oddíle). Často neznáte název publikace, ale víte, kdo ji napsal. Nebo na vás mohl udělat dojem článek, který jste četli (nebo přednáška, již jste slyšeli) od určitého autora a chcete vědět, co ještě publikoval. Odstraňte vaše předchozí vyhledávání výběrem „edit" z nabídkové lišty nahoře na hlavní vyhledávací obrazovce a následnou volbou „delete all". Pokusme se najít publikace profesora Sira Michaela Marmota za posledních pět let. Syntaxe je následující. Napište: 695 1 marmot-m.au Dostanete všechny články v této části databáze, v kterých M. Marmot figuruje jako autor nebo spoluautor - přibližně 35 publikací. Ale jako u mnoha autorů, Michael není jediným M. Marmotem v lékařské literatuře a - další potíž - má prostřední iniciálu, kterou ve svých publikacích používá nedůsledně. Pokud již jeho prostřední iniciálu neznáte, musíte použít pravostranné rozšíření resp. zkrácení, abyste ji zjistili. Zadejte: 2 marmot-m$.au Takto získáte okolo 60 článků, jež zahrnují předchozích 35, jež jste našli pod M. Marmotem, plus články od MA. Marmota, MD. Marmota a dalších 25 článků od - našli jsme jej - MG. Marmota! Povšimněte si, že v OVIDu znak dolaru je náhradním znakem za libovolné znaky znamenajícím „jakékoli písmeno nebo písmena". U vyhledávacího programu od Silver Platter je odpovídajícím znakem hvězdička (*). Můžete použít náhradní znak při zkrácení slova, abyste hledali slovní základ v rámci vyhledávání pomocí slova v textu; například syntaxe electric$.tw (v OVIDu) odhalí články s „electric", „electricity", „electrical" a tak podobně v názvu nebo abstraktu. Též jste mohli použít následující jednořádkový příkaz: 3 (marmot-m or marmot-mg).au Dostanete celkem okolo 60 článků, které nyní potřebujete ručně prolistovat, abyste vyloučili jakéhokoli M. Marmota jiného než profesora Sira Michaela! Užitečné také může také být vyhledávání podle instituce. To vám poskytne všechny publikace, které vznikly v určité výzkumné instituci. Například napište: 4 (withington hospital and manchester).in a najdete tak všechny publikace, kde se „Withington Hospital, Manchester" vyskytuje v poli „institution" (buď jako hlavní adresa, kde výzkum proběhl, nebo jako jedna ze spoluautorských institucí). Pokud si nemůžete vzpomenout na název článku, který chcete, ale znáte nějaké přesné klíčové slova z abstraktu, mohlo by být rychlejší hledat pod slovem v textu než pod MeSH termínem (které jsou vysvětleny v oddíle 2.4). Přípony oblastí, jež potřebujete, jsou .ti (název), .ab (abstrakt) a .tw (slovo v textu = buď v názvu nebo v abstraktu). Řekněme, že jste se pokoušeli vyhledat úvodník z jednoho z lékařských časopisů (nemůžete si vzpomenout z kterého) z roku 1999 o medicíně založené na důkazu. Vymažte vaše předešlé vyhledávání a zadejte: 1 evidence based medicine.tw and 1999.yr Dostanete dohromady okolo 100 článků. Nyní byste mohli ručně listovat abstrakty, abyste identifikovali ten hledaný. Nebo můžete zdokonalit vaše vyhledávání pomocí typu publikace, jak níže vidíte. Napište: 2 limit 1 to editorial Ve skutečnosti jste mohli toto vše udělat v jednom kroku s následujícím příkazem: 3 evidence based medicine.tw and 1999.yr and edito-rial.pt kde .tw znamená „slovo v textu" (v názvu nebo abstraktu), .yr znamená „rok uveřejnění" a .pt znamená „typ publikace". (Mohli jste rovněž použít tlačítko „limit set" zde nahoře na obrazovce a potom vybrat typ publikace jako „editorial".) Ale všimněte si, že tato metoda vytáhne pouze články s přesným řetězcem „evidence based medicine" jakožto slovem v textu. Pomine například články, jež hovoří o „evidence based health care" místo o medicíně založené na důkazech. V takové situaci potřebujeme hledat pod MeSH termíny, jak je níže vysvětleno, a/nebo pokrýt všechny možné obměny slova v textu (včetně různých způsobů pravopisu každého slova). Cvičení 1 1. Pokuste se vyhledat následující články s použitím co nejmenšího počtu příkazů. a) Systematický přehled publikovaného zhotovený Craigem a kolegy o měření teploty u dětí v axille v porovnání s rektem uveřejněný ve významném časopise v angličtině přibližně v roce 2000. (Nezapomeňte, že systém OVID potřebuje iniciálu autorova jména.) b) Publikace od týmu profesora Marshe z Oxfordu ohledně vlivu fenobarbitalu na četnost záchvatů. (Všimněte si, že nepotřebujete úplnou adresu instituce, abyste hledali pod touto oblastí.) c) Publikace popisující úmrtnost z různých příčin u účastníků studie HOPE (Heart Outcomes Prevention Evaluation) od Salima Yusufa a kolegů, uveřejněná buď v New England Journal of Medicine nebo v Journal of the American Medical Association (nezapomeňte, že Medline indexuje ten první pod jeho úplným názvem a ted druhý jako JAMA). d) Dva články uveřejněné v roce 1995 v American Journal of Medical Genetics ohledně dědičnosti schizofrenie u izraelských subjektů. Podívejte se, zda je nedokážete najít jediným příkazem s použitím přípon oblastí. 2. Vysledujte sérii článků na pokračování uveřejněnou v Journal of the American Medical Association od roku 1992 do nynějška, nazvanou „Users' guides to the medical literatuře". 3. Kolik dokážete najít článků od profesora Davida Sacketta, který jako profesor Marmot používá nedůsledně svou prostřední iniciálu? 4. Zjistěte, kolik bylo uveřejněno článků od Sandry Goldbeck-Wood v BMJ v roce 1999. Pamatujte, že abyste v OVIDu omezili vaše vyhledávání na určitý rok, použijte tlačítko „limit set" nahoře na obrazovce a potom vyberte „publication year" nebo, jiná možnost, použijte příponu pole .yr (např. 1994.yr). Úkol 2: Chcete zodpovědět velmi specifickou klinickou otázku Řešení: Vytvořte cílené (specifické) vyhledávání kombinací dvou nebo více obsáhlých (senzitivních) vyhledávání. Matka mladé dívky s mentální anorexií, jejíž menstruační cykly ustaly, požádala o hormonální léky k zastavení řídnutí kostí. Zdálo se to jako rozumný požadavek, ačkoli tu byly etické problémy ke zvážení. Ale je nějaký důkaz, že podání hormonu za těchto okolností opravdu předejde dlouhodobému úbytku kostní hmoty? Je třeba ověřit tento námět s použitím Medline. Abyste tuto otázku zodpověděli, potřebujete hledat velmi obsáhle pod „anorexia nervosa", „osteoporosis" a „oral contraceptives". Nejprve vymažte z obrazovky předešlá vyhledávání. Pak se ujistěte, že je zatrženo „Map text to subject heading". Teď napište: 1 anorexia nervosa Nenapsali jste příponu pole (jako .tw), tak i když zapomenete zatrhnout rámeček „Map text to subject heading", systém OVID to automaticky udělá, tj. pokusí se najít shodu mezi vaším požadavkem a jednou ze svých standardních kategorií medicínských témat (zkráceně MeSH a hovorově známých jako „mesh termíny"). Chvilku počkejte a měli byste na obrazovce spatřit dvě volby. První je „anorexia nervosa" jakožto MeSH termín a jsou vám nabídnuty dvě doplňkové volby: „Explode" a „Focus". Pro tuto chvíli ignorujte rámeček „explode" (je vysvětlen dále v tomto oddíle) a vezměte v úvahu rámeček „focus". Chcete pouze články, jež jsou skutečně o mentální anorexii, nebo chcete jakýkoli článek, který se o mentální anorexii jen mimochodem 696 zmiňuje? Řekněme, že se opravdu chceme omezit na hlavní předmět (angl. „focus"). Potom nám obrazovka nabídne volbu podkategorií, ale my si jich teď nebudeme všímat. Vyberte „Include all subheadings" („včetně všech podkategorií"). Mohli jsme dosáhnout téhož použitím následujícího jednořádkového příkazu. Napište: 2 *anorexia nervosa/ kde * ukazuje, že termín je hlavním předmětem článku, a / představuje MeSH termín. V této sadě byste měli mít kolem 750 článků. Druhou volbou, jež vám byla nabídnuta, bylo vyhledávání podle slova v textu („textword search") pro termín „anorexia nervosa" v názvu nebo abstraktu. Jinými slovy kdykoli požádáte OVID, aby termín zmapoval, nabídne vám také provést vyhledávání v názvu nebo abstraktu, tj. najde vám články (řekněme) se slovy „anorexia nervosa" v názvu nebo abstraktu, dokonce i když článek nebyl indexován pod touto MeSH kategorií. Tento rámeček byste také měli zatrhnout. Syntaxe, kterou spatříte na obrazovce, jakmile byl termín zmapován, je: 1 anorexia nervosa.mp [title, abstract, registry num-ber word, or MeSH] Všimněte si, že ne všechny programové balíčky s Medli-ne automaticky zmapují vaše doporučení na MeSH termíny. U vyhledávacího programu od Silver Platter například potřebujete vstoupit do vaší předmětové skupiny (angl. heading) a kliknout na tlačítko „suggest". V tomto případě vám obrazovka nabídne buď „eating disorders" nebo „anorexia nervosa" a požádá vás, abyste vybrali ten významově nejbližší. Zvolte „anorexia nervosa" (mezerník ke zvýraznění textu, pak stiskněte „return"). Podobně abyste získali články o osteoporóze (což je v angličtině také MeSH termín), použijte následující jednořádkový příkaz: 2 osteoporosis/ Měli byste získat kolem 3000 článků. Povšimněte si, že v OVIDu, pokud víte, že téma, který chcete, je oficiálním MeSH termínem, můžete zkrátit proces mapování napsáním lomítka (/) za slovem. To může značně ušetřit čas. Rovněž si všimněte, že jsme zde nepoužili hvězdičku, protože osteoporóza nemusí být hlavním tématem článku, který hledáme. Nakonec vložte termín „oral contraceptives" (bez hvězdičky a bez lomítka), abyste viděli, co je zde MeSH termínem. MeSH termín je „contraceptives, oral" (pokud jste to věděli, mohli jste použít syntaxi contraceptives,oral/, ale nedělejte to z důvodu, který vám hned vysvětlím). 3 oral contraceptives OVID zmapuje váš dotaz na „contraceptives,oral" a zeptá se vás, zdali chcete omezit vaši sestavu na hlavní předmět (angl. focus; pravděpodobně ne, tak tento rámeček nezatrh-něte) a zdali chcete rozvinout termín (tj. najít všechny jeho specifičtější varianty; angl. explode). MeSH termíny jsou jako větve stromu, například s „asthma", jež se dále dělí na „asthma in children", „occupational asthma" a tak dále. Tvůrci rejstříku Medline jsou instruováni tak, aby indexovali položky použitím tak specifických MeSH termínů, jako to jen jde. Pokud jen žádáte články na „asthma", uniknou vám všechna konečná rozvětvení, pokud termín „nerozvinete". (Avšak všimněte si, že takovéto vyhledávání variant daného termínu je možné jen dolů po stromové struktuře MeSH, nikoli vzhůru.) Pokud nezatrhnete rámeček „explode" pro „contraceptives,oral", vaše sestava bude pravděpodobně obsahovat okolo 700 článků, zatímco rozvinutý termín jich zahrne přibližně 5000! Znáte-li MeSH termín, je rychlou cestou k jeho rozvinutí: 3 exp contraceptives, oral/ Pokud tyto tři sestavy zkombinujete, buď použitím jejich čísel 1 and 2 and 3 nebo napsáním jednořádkového příkazu: 4 *anorexia nervosa/ and osteoporosis/ and exp contraceptives, oral/ prohledáte přes 6000 článků a získáte sadu pouze tří odkazů - dopis, původní výzkumnou studii a důležitý přehledný článek (Pokud je nenajdete, zkontrolujte si pečlivě syntaxi vašeho vyhledávání, pak zkuste nechat proběhnout stejné vyhledávání databází za předchozích pět let použitím tlačítka „database" nahoře na obrazovce.) Cvičení 2 Pokuste se najít sadu méně než pěti článků týkajících se některé z následujících otázek či klinických problémů. 1. Lze vysokou incidenci ischemické nemoci srdeční u určitých asijských etnických skupin přičíst rozdílům v hladinách inzulínu? 2. Hypotéza spojující vitamín C s léčbou nachlazení má zjevně něco společného s jeho úlohou jakožto antioxidantu. Je nějaký (klinický nebo teoretický) důkaz, který tuto hypotézu podporuje? 3. Jaká by měla být péče u tyreotoxikózy v těhotenství? Ujistěte se, že provádíte vyhledávání MeSH termínů pro každé téma použitím hvězdičky, abyste se omezili na hlavní oblast, a použitím lomítka k označení toho, o čem víte, že je to MeSH termín. (Pokud vás daná databáze zklame, nechte znovu proběhnout vyhledávání v předchozích databázích výběrem tlačítka „database".) Úkol 3: Chcete rychle získat všeobecné informace o dobře definovaném tématu Řešení: Použijte podkategorie a/nebo volbu „limit set". Tohle je jeden z nejběžnějších důvodů, proč v reálném životě přistupujeme k Medline. Nemáme na mysli určitou publikaci ani velmi specifickou otázku a ani se nesnažíme o vyčerpávající přehled literatury. Chceme jen vědět, řekněme, jaká jsou nejnovější doporučení expertů ohledně far-makoterapie astmatu, nebo zdali bylo napsáno něco nového o vakcínách proti malárii. Jednou metodou, jak toho dosáhnout, je hledat s použitím MeSH termínů a potom, pokud objevíme velký počet článků, ale jen za této situace, použijte podkategorie (angl. subheadings) rejstříku. Podkategorie představují jakési jemné ladění indexovacího systému Medline a třídí články podle určitých MeSH subjektů na etiologii, prevenci, terapii a tak dále. Seznam těch nejužitečnějších je v tabulce 2.2 (nemusíte se je učit zpaměti, jelikož mapovací proces OVIDu vám podkategorie automaticky nabídne k zatržení, ale můžete zkrátit proces mapování a ušetřit čas, pokud náhodou potřebnou podkategorii znáte). Všimněte si, že podkategorie /th v tabulce 2.2 se týká nefarmakologické terapie nemoci, zatímco lát se používá pro farmakoterapii. Podkategorie /tu se používá výhradně pro léky a znamená „terapeutické použití něčeho". Podkategorie /px se používá u nepsychiatrických nemocí jako v tomto příkladě - diabetes/px = psychologie diabetu. Ne všechny podkategorie v indexovacím systému se používají pro každý subjekt. K nalezení podkategorií MeSH termínu jako je asthma napište: 1 sh asthma Tento příkaz vám řekne, které podkategorie se používají v indexovacím systému pro tento MeSH termín. Nabídne vám množství položek k volbě včetně diagnózy, ekonomiky, etnológie a tak dále. Měli byste vybrat lát (farmakoterapie). Mohli jste napsat jednořádkový příkaz: 697 2 *asthma/dt kde * znamená hlavní předmět článku, / znamená MeSH termín a dt znamená farmakoterapii. Toto vám nabídne okolo 2000 článků, abyste si z nich vybrali. Nyní potřebujete omezit sadu (angl. limit set) článků, a tak začněte s často užívanými volbami k jejímu omezení, jejichž seznam je v podobě zatrhávacích rámečků pod tabulkou na vaší obrazovce („human", „reviews" a tak dále). Pokud si skutečně chcete zkopírovat celý článek ještě dnes, vyberte „local holdings" (vlastnictví dokumentů). To omezí vaši sadu časopisů na ty, jež jsou majetkem určité knihovny, jejímž prostřednictvím máte přístup k Medline. Pokud se připojujete k Medline v knihovně BMA pomocí počítačového modemu, „local holdings" znamená časopisy v majetku knihovny BMA, nikoli knihovny, z níž se připojujete! Povšimněte si, že volby jako „local holdings" sníží počet vašich článků nesystematicky; pravděpodobně je mnoho vynikajících a důležitých článků uveřejněných v časopisech, které vaše místní knihovna neodebírá. Pokud máte po výběru vhodných možností z často užívaných rámečků „limit set" stále příliš mnoho článků, vyberte nyní tlačítko „limit set" nahoře na obrazovce. Nyní si musíte vybrat dodatečné volby ke zmenšení sady článků na množství, které můžete pohodlně prolistovat. Skutečně netrvá dlouho prolistovat na obrazovce kolem 50 článků. Je lepší to udělat, než se spoléhat na program, že vám z celého balíku vydá to nejlepší. Jinými slovy neužívejte nadměrně příkazy „limit set", které najdete v přehledu 2.3. Pokud jste si jisti, že chcete přehledný článek, vyberte tuto možnost. Můžete získat nejnovější přehled publikovaného výběrem nejprve „review articles" a potom „latest update". Avšak to úplně nejnovější nemusí být tím nejlepším přehledem napsaným v posledním roce, tak může být lepší vybrat „publication year" jako běžný rok a probrat se jím. Pamatujte si, že bude zahrnut pouze systematický přehled, bude obsahovat podrobnosti hledaného a bude výsledkem důkladného prohledávání odpovídající literatury . Volba „AIM journals" představuje všechny časopisy v seznamu AbridgedIndex Medicus, tj. v „hlavním proudu" lékařských časopisů. Nebo pokud chcete články týkající se spíše ošetřovatelské než lékařské péče, můžete omezit sadu na „Nursing journals". To je často lepší způsob omezení širokého nastavení, než požadovat jen to, co je ve vlastnictví místní knihovny. Pokud vás nezajímá nic, co není v angličtině (i když abstrakt v angličtině může být), vyberte tuto možnost a opět mějte na mysli, že je to nesystematický (skutečně zavádějící) způsob, jak vyloučit články z vaší sady. Všimněte si, že místo použití funkční klávesy „limit set" můžete využít přímý jednořádkový příkaz jako: 3 limit 2 to local holdings 4 limit 3 to human Cvičení 3 Pokuste se najít jednotlivou publikaci (prolistováním větší sady článků), která by vám dala odpověď na následující otázky: 1. Je někdy vůbec indikována hormonální substituční terapie u žen, které měly v minulosti karcinom prsu? 2. Severoamerická literatura často zmiňuje „health mainte-nance organisations". Co to je? 3. Představte si, že jste novinářem v oblasti medicíny, který byl požádán, aby napsal článek o screeningu karcinomu prostaty. Chcete jako svůj zdroj dva docela krátké přehledné články z lékařské literatury patřící k hlavnímu proudu. 4. Vede sledování násilí v televizi k násilnému chování u adolescentů? Úkol 4: Výsledkem Vašeho vyhledávání bylo mnoho bezvýznamných článků Řešení: Jak při vašem vyhledávání postupujete dále, dolaďujte je ve světle výsledků, které prozatím máte. Často vyhledávání objeví tucty článků, které jsou vzhledem k vaší otázce nepodstatné. Zde může pomoci booleovský operátor „not". Bylo provedeno vyhledávání, pro identifikaci článků o náhradních cílových ukazatelích v klinickém farmakologickém výzkumu. Bylo hledánov Medline pomocí MeSH termínů, ale též podle slov v textu, aby byly zachyceny články, které unikly indexovacímu systému MeSH . Bohužel toto vyhledávání objevilo stovky článků, nesouvisejících s tématem, všechny o náhradním mateřství. Syntaxe k vyloučení nežádoucích článků je následující: 1 (surrogate not mother$).tw Rozhodnutí použít operátor „not" je dobrým příkladem toho, jak můžete (a měli byste) postupně zdokonalovat a zjemňovat vaše vyhledávání, což je mnohem plynulejší než ihned připravit formálně perfektní vyhledávání. Jiným způsobem, jak se zbavit nepodstatných článků, je zúžit vaše vyhledávání podle slova v textu na sousední slova (angl. ad-jacent words). Například termín „home help" obsahuje velice běžná slova spojená ve specifickém kontextu. Propojte je následovně: 2 home adj help.tw kde adj znamená „adjacent" (sousední). Podobně „com-munity adj care", „Macmillan adj nurse". Můžete dokonce specifikovat počet slov tvořících mezeru mezi dvěma propojenými slovy jako v tomto příkladě: 3 community adj2 care.tw což by vyhledalo „community mental health care" a rovněž „community child care" a „community care". Cvičení 4 Najděte články o profesionálním astmatu (angl. occupa-tional asthma) způsobeném cukrem. Lék chlorochin se velmi běžně užívá k léčbě malárie (falciparum malária). Zjistěte, jaká jsou jeho další použití. (Tip: použijte podkategorii /tu znamenající „terapeutické použití něčeho" a pamatujte, že odkazy na malárii jsou často pod jejím latinským názvem Plasmodium falciparum. Měli byste ovšem omezit široké vyhledávání na přehledné články, pokud čtete spíše kvůli rychle získaným informacím než z důvodu sekundárního výzkumu). Úkol 5: Vaše vyhledávání vám nedává vůbec žádné články nebo ne tolik, kolik jste očekávali Řešení: Za prvé, neužívejte nadměrně podkategorie nebo možnosti „limit set". Za druhé, hledejte jak pod slovy v textu, tak pod MeSH termíny. Za třetí, obeznamte se s příkazem „explode" a rutinně jej používejte. Pokud vámi pečlivě sestavené vyhledávání nese málo nebo žádné ovoce, je možné, že v databázi nejsou žádné články k vašemu tématu. Pravděpodobnější ale je, že vám unikly. Mnoho důležitých článků se propásne ne proto, že jsme sestrojili děravou vyhledávací strategii, ale proto, že jsme se příliš spoléhali na děravý indexovací systém. Také MeSH termíny mohou být chybně označeny nebo nemusí být označeny vůbec. Proto byste měli hledat jak pod slovy v textu, tak podle MeSH. Ostatně je obtížné napsat článek o psychologii diabetu, aniž byste zmínili slova „diabetes", „diabetic", „psychology" nebo „psychological", a tak zkrá- 698 cené slovní kmeny diabet$.tw a psychol$.tw doplní vyhledávání pod MeSH termínem „diabetes mellitus" a podkate-gorií /px (psychologie). Smažte předchozí z obrazovky a potom uvažujte o tomto příkladu. Pokud byste chtěli zodpovědět otázku: jaká je úloha aspirinu v prevenci a léčbě infarktu myokardu?, mohli byste napsat jednořádkový příkaz: 1 (myocardial infarction/pc or myocardial infarction/ dt) and aspirin/tu což vám poskytne všechny články ze seznamu této části databáze Medline, která zahrnuje terapeutické použití aspirinu a prevenci nebo léčbu infarktu myokardu - asi tak 190 článků, ale žádnou okamžitou odpověď na vaši otázku. Mohli byste lépe upustit od podkategorií a omezit sadu článků následovně: 1 myocardial infarction/ and aspirin/ 2 limit 1 to AIM journals 3 limit 2 to review articles což je strategie, jež vám nabídne okolo 25 přehledných článků včetně minimálně jednoho velice užitečného, který byl vaším prvním vyhledáváním vynechán. Nyní k této strategii přidejme jeden řetězec navíc. Vymažte dosavadní zadání a postupujte následovně: 1 (myocardial infarction and aspirin).mp 2 limit 1 to AIM journals 3 limit 2 to review articles Přípona .mp (viz oddíl 2.4) vám automaticky nabídne vyhledávání podle slova v textu názvu nebo abstraktu a měla by vám poskytnout přes 50 článků, z nichž většina vypadá, že se vaší otázky určitě týkají, a některé z nich byly vynechány, když jste hledali pouze MeSH termíny. Abyste předešli neúplnému vyhledávání, je jinou důležitou strategií využití silného příkazu „explode". Tuto funkci byste měli rutinně používat, pokud nemáte dobrý důvod k opaku. Zkuste následující vyhledávání jako příklad. Pokoušíme se dostat dobrý přehledný článek o gonokokové artritidě (vzácném typu akutní artritídy způsobeném gonokokem). Vymažte předchozí z obrazovky a napište MeSH termín: 1 *arthritis/ Dostanete kolem 1300 článků, kde artritída je jejich hlavním předmětem. Nyní pátrejte po článcích o artritidě, ve kterých je slovo „gonococcal" zmíněno v názvu nebo abstraktu. Napište: 2 gonococcal.tw 31 and 2 Toto významně zúží vaše vyhledávání na jeden nebo dva články, z nichž ani jeden nenabízí vyčerpávající přehled daného tématu. A kolik jste jich nenašli? Odpověď je několik, protože MeSH termín „arthritis" se dělí na několik větví včetně „arthritis, infectious". Zkuste vše znovu (bez vymazání prvního vyhledávání), ale tentokrát zvolte rozvinutí termínu „arthritis" (angl. explode) předtím, než začnete, a potom omezte vaši sadu (angl. limit set) na přehledné články: 4 exp arthritis/ 5 2 and 4 6 limit 5 to review articles Nyní máte asi pět článků včetně vynikajícího přehledu, který byl předtím při vyhledávání bez rozvinutí termínu vynechán. Můžete to předvést napsáním: 7 6 not 3 což vám ukáže, o co více se toho našlo při vyhledávání termínu s jeho rozvinutím (funkce „explode") oproti vyhledávání bez jeho rozvinutí. Pokud byste náhodou také uvažovali o vyhledávání pod slovem v textu, syntaxe pro identifikaci článků o problémech u mužů by byla (male not female).tw a (men not women).tw, jelikož ženské termíny v sobě formálně obsahují ty mužské! Úkol 6: Nevíte, kde začít hledat Řešení: Použijte volbu „permuted index". Vezměme si pojem „stress". Hodně se vyskytuje, ale vyhledávání konkrétních typů stresu by bylo pracné a vyhledávání pojmu „stress" jako slova v textu by bylo příliš necílené. Potřebujeme vědět, kde v MeSH indexu různé typy stresu leží, a když to zjistíme, můžeme si vybrat ten druh stresu, na který se chceme podívat. K tomu použijeme příkaz ptx („permuted index", což znamená „permutovaný rejstřík"). Napište: 1 ptx stress Obrazovka ukáže mnoho možností včetně posttrauma-tických stresových poruch, stresových fraktur, oxidativního stresu, stresové inkontinence a tak dále. ptx je užitečný příkaz, když se termín, který zkoumáte, může nacházet v několika tematických oblastech. Pokud váš pojem je jednotlivým MeSH termínem, užijte příkazu tree (strom). Například: 2 tree epilepsy vám ukáže, kde v rejstříku MeSH je umístěna epilepsie (jako větev stromu „brain diseases"), jež se sama větví na generalizovanou epilepsii, parciální epilepsii, posttraumatic-kou epilepsii a tak dále. Cvičení 5 1. Najděte, kde se může slovo „nursing" objevit jako součást MeSH termínu. 2. Použijte příkaz tree k rozvinutí stromové struktury MeSH termínu „diabetes mellitus". Úkol 7: Váš pokus omezit sadu vede ke ztrátě důležitých článků, ale nevyloučí ty o nízké metodologické kvalitě Řešení: Aplikujte nějaký filtr kvality založený na důkazech. Co uděláte, když vám vaše úzce cílené vyhledávání stále poskytuje několik set článků, z nichž si máte vybrat, a jestliže se zdá, že použití podkategorií nebo funkcí omezení sady ztrácí hodnotné (a důležité) publikace? Nejprve byste měli uvážit možnost, že vaše vyhledávání nebylo zase tak cílené, jak jste si mysleli. Ale pokud je nemůžete už dále vylepšit, měli byste zkusit vložit řetězec pro kvalitativní třídění určený k omezení vaší sady článků na terapeutické intervence, etiologii, diagnostické procedury nebo epidemiologii. Nebo můžete použít vyhledávací řetězce k identifikaci typu publikace, jako je randomizovaná kontrolovaná studie, systematický přehled nebo meta-analýza. Tyto filtry kvality založené na důkazech jsou velmi složité vyhledávací strategie vyvinuté a tříbené některými z nejzkušenějších expertů na lékařskou informatiku. Jsou vyvíjeny další maximálně senzitivní vyhledávací strategie, které identifikují kohortové studie, studie případů a kontrol a tak dále a brzy budou k dispozici od UK Cochrane Centre, Summertown Pavilion, Middle Way, Oxford 0X2 7LG, email general@cochrane.co.uk. 40.3 ZHODNOCENÍ METODOLOGICKÉ KVALITY PUBLIKACE Při posuzování zda nalezená publikace je kvalitní, je třeba zvažovat pět otázek, které by měly tvořit základ pro rozhodnutí, zda publikaci „hodit do koše", odložit její posouzení nebo ji použít k ovlivnění praxe: 699 • Byla studie původní? • Koho se studie týkala? • Byl použit správný design ? • Zabránilo se systematické chybě (tj. byla studie dostatečně „kontrolovaná")? • Byla dost velká a trvala dost dlouho na to, aby přinesla věrohodné výsledky? Byla studie původní? Teoreticky nemá smysl testovat vědeckou otázku, která již byla nějakým způsobem ověřena někým jiným. Ale ve skutečnosti pouze nepatrná část lékařského výzkumu přijde s něčím zcela novým a stejně nepatrná část opakuje přesně kroky předchozích badatelů. Velká většina výzkumných studií nám řekne (pokud jsou metodologicky v pořádku), že určitá hypotéza je pravděpodobně o trošku správnější nebo naopak méně správná, než byla před naším zapojením do výzkumu daného problému. Proto může být dokonale platné provést studii, která je na první pohled „nepůvodní". Vlastně celá věda meta-analýzy závisí na existenci několika studií v literatuře, které se zabývaly stejnou otázkou a přistupovaly k ní stejným způsobem. Praktická otázka ohledně nové výzkumné práce není „Udělal již někdo předtím podobnou studii?", ale „Je tento nový výzkum v nějakém ohledu přínosem pro literaturu?" Především z následujících hledisek: • je tato studie větší, trvala déle nebo je jinak důkladnější než ta nebo ty předchozí? • jsou metody této studie v něčem přesnější (zvláště, zabý-vají-li se nějakým kritizovaným metodologickým problémem dřívějších studií)? • přispějí číselné výsledky této studie významně k meta--analýzám předchozích studií? • liší se nějak studovaná populace (například brala studie, oproti těm předchozím, v úvahu různé etnické skupiny, věk nebo pohlaví)? • má studovaná klinická otázka potřebnou důležitost a je v myslích veřejnosti nebo lidí s klíčovou rozhodovací pravomocí dostatečná nejistota, aby nové důkazy plynoucí ze studie byly „politicky" žádoucími, i když to není z vědeckého hlediska nezbytné? Koho se studie týkala? Výzkum, týkající se pacientů někoho jiného ještě nemusí být směrodatným pro praxi jiného lékaře. V takovém případě nejde o pouhou xenofóbii ale hlavní důvody, proč se účastníci nějaké klinické studie mohli lišit od pacientů žijících v „reálných podmínkách", jsou následující: • byli buď více nebo méně nemocní, než jiní pacienti • byli z jiných etnických skupin nebo měli jiný životní styl • bylo jim věnováno během studie více (nebo jiné) pozornosti, než by mohlo být v běžné klinické praxi • oproti pacientům z reálného života neměli žádnou jinou poruchu kromě studovaného problému • nikdo z nich nekouřil, nepil alkohol a neužíval orální antikoncepci Proto je nezbytné položit si před úplným převzetím výsledků jakékoli studie následující otázky: • Jak byly osoby získávány do studie? Kdybyste chtěli provést dotazníkovou studii o názorech pacientů na pohotovostní službu, mohli byste se dotazovat tak, že byste do místních novin dali inzerát. Avšak tato metoda by byla dobrým příkladem systematické chyby náboru , jelikož výběr, který byste získali, by byl pozměněn ve prospěch osob, které byly vysoce motivovány a rády četly noviny.Správně byste měli dát dotazník každému uživateli (nebo jednomu z 10 uživatelů), který přišel určitého dne na pohotovostní službu. • Kdo byl do studie zahrnut? Mnohé studie ve Spojeném království rutinně vylučují pacienty s dalším onemocněním, ty, kteří nemluví anglicky, užívají nějakou jinou medikaci a negramotné. Tento přístup může být vědecky „čistý", ale jelikož se výsledky klinických studií budou používat k řízení praxe u širších skupin pacientů, není to vše nutně logické. Výsledky farmakokinetických studií s novými léky na 231etých zdravých mužských dobrovolnících zjevně nebudou použitelné u průměrné starší ženy! Tuto otázku nedávno zdůraznili i sami pacienti, formou požadavků o rozšíření kritérií pro zahrnutí do studií o lécích na AIDS. • Kdo byl ze studie vyloučen? Například randomizovaná klinická studie může být omezena na pacienty se střední nebo těžkou formou nemoci jako je srdeční selhání, což je přístup, který může vést k falešným závěrům ohledně léčby lehkého srdečního selhání. To má důležité praktické důsledky, když se výsledky klinické studie provedené na nemocničních pacientech používají v primární péči, kde je spektrum nemocí obecně méně závažné. • Byly osoby studovány v „přirozených" životních podmínkách? Například byly přijaty do nemocnice čistě na pozorování? Obdržely zdlouhavá a podrobná vysvětlení stran možného prospěchu z intervence? Dostaly telefonní číslo na klíčového výzkumného pracovníka? Poskytla společnost sponzorující výzkum nové vybavení, které normálnímu klinikovi nebude dostupné? Tyto skutečnosti by ovšem samy o sobě nezrušily platnost studie, ale mohly by vrhnout stín pochybností na použitelnost jejích výsledků v běžné klinické praxi. Bylo uspořádání studie rozumné? Ačkoli design výzkumné studie je obvykle komplikovaný, pro „kritické posuzování", základního uspořádání klinické studie je možno použít především dvou otázek: 0 jaké specifické intervenci se uvažovalo a s čím byla porovnávána? Toto je jedna z nejzákladnějších otázek při posuzování jakékoli publikace. Je lákavé přijmout publikovaná tvrzení 1 s jejich uvedenou hodnotou, ale autoři často nesprávně popisují (obvykle spíše podvědomě než záměrně) to, co skutečně dělali, a nadhodnocují originalitu své práce a její možnou důležitost. Jaký následek byl měřen a jak? Když má někdo nevyléčitelné onemocnění, o němž farmaceutická společnost prohlašuje, že proti němu vyrobila nový účinný lék, pacient se obvzkle zajímá zda mu takový lék prodlouží život (a možná také, zdali by ten život stál za to za jeho konkrétních podmínek a při vedlejších účincích me-dikace). Příliš ho nezajímá hladina nějakého neviditelného enzymu v krvi, o němž výrobce ujišťuje, že je to spolehlivý ukazatel šance na přežití. Měření symptomatických (například bolest), funkčních (například pohyblivost), psychologických (například úzkost) nebo sociálních (například nepohodlí) účinků intervence je spojeno ještě s větším množstvím problémů. Metodologie, uplatnění a vyhodnocení takových „měkkých" parametrů následků je velmi komplikované. Obecně by se ale měly vždy v publikaci hledat důkazy, že měřený následek byl objektivně prokázán , že někdo již předtím prověřil, že stupnice 700 úzkosti, bolesti atd. , použitá ve studii měří to co prohlašuje že měří, a že změny v tomto parametru následku dostatečně odrážejí změny ve stavu pacienta. Protože to, co je důležité v očích lékaře, nemusí být tak vysoce ceněno pacientem a naopak. Zabránilo se systematické chybě nebo byla snížena na nejmenší míru? Systematická chyba je definována jako cokoli, co chybně ovlivňuje závěry a zkresluje porovnání skupin. Ať již je design randomizovaná kontrolovaná studie, nerandomizovaná srovnávací studie , kohortová studie nebo studie případů a kontrol, cílem by mělo být vytvořit srovnávané skupiny tak, že jsou si navzájem co nejpodobnější kromě zkoumaného konkrétního faktoru . Pokud je to možné, měly by být stejným způsobem vybírány, mít stejné kontakty na řešitele a být stejně často vyhodnocovány za použití stejných parametrů výsledků. Různé designy studie si žádají různé kroky k omezení systematické chyby. Randomizované kontrolované studie (RCT) V RCT se (teoreticky) vyhneme systematické chybě výběrem účastníků z určité populace a jejich náhodným přidělením do různých skupin. Nerandomizované kontrolované klinické studie Příklad takové studie můře být když jedna skupina pacientů ( nemocniční ambulantní pacienti s astmatem) byla intervenována na příklad edukačním letákem, zatímco jiná skupina (třeba pacienti s astmatem navštěvující ordinace praktických lékařů) byla vystavena jiné intervenci (skupinové edukační schůzce). Takový postup vykazuje nejvíce zřejmou systematickou chybu, tj. porovnávání dvou skupin, které vykazují podstatné rozdíly dokonce ještě před zahájením intervence. Obecné pravidlo je, že pokud publikace je nerandomizo-vanou kontrolovanou klinickou studií, je třeba určit, zdali základní rozdíly mezi intervenovanou a kontrolní skupinou jsou tak velké, že by zrušily platnost jakýchkoli rozdílů přisuzovaných účinku intervence. A tak to téměř vždy je . Autoři takového článku někdy sami uvedou důležité vlastnosti každé skupiny (jako průměrný věk, poměr zastoupení pohlaví, ukazatele tíže onemocnění a tak dále) do tabulky, aby bylo možno tyto rozdíly porovnat. Kohortové studie Výběr srovnatelné kontrolní skupiny je jednou z nejobtíž-nějších částí designu observační studie (kohortové studie nebo studie případů a kontrol). Malému počtu kohortových studií, pokud vůbec nějakým, se například podaří vybrat dvě skupiny osob shodného věku, pohlaví, socioekonomického postavení, provázejícího onemocnění atd. jen s jediným rozdílem v expozici studovanému faktoru . V praxi se většina „kontrolování" v kohortových studiích děje až ve fázi analýzy, kdy se provádějí složité statistické úpravy pro základní rozdíly v klíčových proměnných. Pokud se to neudělá dostatečně, budou statistické testy pravděpodobnosti a intervaly spolehlivosti nebezpečně zavádějící. Tento problém názorně ukazují různé kohortové studie týkající se rizika a přínosu alkoholu, které shodně předvádějí křivku „tvaru J" ve vztahu mezi příjmem alkoholu a úmrtností. Nejlepší výsledek (ve smyslu předčasného úmrtí) je v kohortě tvořené mírnými konzumenty. Zdá se, že u těch, kdo se sami přiznali k abstinenci, je významně pravděpodobnější, že zemřou mladší, než u průměrné osoby, která pije tři až čtyři dávky alkoholického nápoje denně. Ale může se předpokládat, že abstinenti jsou v průměru totožní s mírnými konzumenty vyjma množství alkoholu, které vypijí? Jistě, že ne! Je známo, že populace abstinentů zahrnuje osoby, kterým bylo nařízeno přestat s alkoholem ze zdravotních důvodů (angl. „sick quitters"), osoby, které se ze zdravotních či jiných důvodů zbavily nežádoucích položek ve výživě a ve způsobu života, osoby z určitých náboženských a etnických skupin, které by byly v jiných kohortách nedostatečně zastoupeni (hlavně muslimové a adventisté sedmého dne) a osoby, které „pijí jako duha", ale zapírají to. Přesto závěr, i když se při analýze bere patřičný ohled na možné zavádějící faktory u osob, které se prohlašují za abstinenty, zůstává, že zvýšené riziko předčasné smrti u těchto osob je platné. Studie případů a kontrol Ve studiích případů a kontrol v nichž se retrospektivně analyzují jednotlivci s určitou nemocí a bez ní, aby byly určeny hypoteticképříčiny, proces, který je nejnáchylnější k systematické chybě, není vyhodnocení následků, ale určení „případů" a kdy se jedinec stává případem. Dobrým příkladem řečeného je to, co nastalo před několika lety, kdy byly podávány žaloby na výrobce očkovací látky proti dávivému kašli, která údajně způsobila neurologické postižení u řady dětí. Aby byla zodpovězena otázka „Způsobilo očkování poškození mozku?", byla provedena studie případů a kontrol, ve které byl „případ" definován jako do té doby zdravé dítě, u kterého se projevily záchvaty nebo jiné známky podezřelé z poškození mozku během týdne po očkování. Kontrolou bylo dítě stejného věku a pohlaví ze stejného imunizačnŕho registru, které bylo také očkováno a u kterého se v některé fázi mohly nebo nemusely rozvinout obdobné příznaky. Nový výskyt známek poškození mozku u zjevně normálních dětí je extrémně vzácný, ale dochází k němu a je možné , že souvislost s nedávnou imunizací mohla být náhodná. Dále, zvýšená úzkost veřejnosti v souvislosti s onou záležitostí mohla ovlivnit vzpomínky rodičů a zdravotníků, takže děti, které měly neurologické příznaky již předtím nebo se vyskytly za nějakou dobu po podání tohoto očkování, mohly být chybně klasifikovány jako případy. Soudce v tomto soudním případu rozhodl, že špatná klasifikace tří takových dětí jako „případy" místo kontroly vedla k trojnásobnému nadhodnocení škody, kterou lze připsat očkování proti dávivému kašli. Ačkoli bylo toto rozhodnutí následně napadeno, princip zůstává - že označení za „případ" ve studii případů a kontrol musí být učiněno přesně a objektivně, máme-li se vyhnout systematické chybě. Bylo vyhodnocení „slepé"? I největší snaha dosáhnout vytvoření srovnatelné kontrolní skupiny bude zmařena, pokud lidé vyhodnocující následek (například ti, kdo posuzují, zdali někdo má stále klinicky srdeční selhání, nebo hodnotí, jestli je rtg nález od minulého vyšetření „lepší") vědí, do které skupiny byl posuzovaný pacient přidělen. Kapitola „The clinical examination" v knize Sacketta a kolegů Clinical epidemiology - a basic science for clinical medicíne nabízí přesvědčivé důkazy, že při vyšetřování pacientů lékaři zjišťují to, co očekávají a v co doufají, že zjistí. Je vskutku vzácné, aby dva schopní klinikové dosáhli shody v míře větší, než by byla očekávána jako náhodná, u více než dvou případů ze tří pro jakékoli dané hledisko fyzikálního vyšetření nebo interpretaci kteréhokoli diagnostického testu. Úroveň shody mezi dvěma pozorovateli větší než náhodnou lze vyjádřit matematicky jako k (kappa) skóre, kde skóre 1.0 značí dokonalou shodu. 701 Ti, kdo hodnotí výsledky, by měli být „zaslepení" vůči přidělení pacientů do skupin. Pokud by lékař například věděl, že pacient byl randomizován do skupiny s lékem na snížení krevního tlaku a ne do skupiny placeba, bylo by pravděpodobné, že by mohl překontrolovat odečet tlaku, který by byl překvapivě vysoký. Toto je příklad systematické chyby provedení (performance bias). Vynikající příklad kontroly systematické chyby dostatečným „zaslepením" byl uveřejněn v časopisu Lancet před několika lety. Majeed a kolegové provedli RCT, jež ukázala v rozporu se zjištěními několika předchozích studií, že doba potřebná na uzdravení (dny v nemocnici, dny pracovní neschopnosti a čas do znovunabytí plné aktivity) po laparoskopickém odstranění žlučníku (přístupem „chirurgie klíčové dírky") nebyla kratší než u tradiční operace na otevřeném břiše. Nesoulad mezi touto studií a předchozími studiemi mohl být dán puntičkárskou snahou Majeeda a kolegů o snížení systematické chyby. Pacienti byli randomizováni až teprve po úvodu do celkové anestézie. Ani pacienti ani ošetřující personál nevěděli, která operace byla provedena, jelikož všichni pacienti opouštěli operační sál stejně obvázáni (včetně krevních skvrn!). Tyto nálezy vyzývají autory předchozích studií, aby se sami sebe zeptali, zdali šlo spíše o systematickou chybu očekávání než o rychlejší úzdravu, což pobídlo lékaře k časnějšímu propuštění pacientů ze skupiny operovaných laparoskopicky. Byla věnována pozornost předběžným statistickým otázkám? Většina nestatistiků má sklon v článcích v části metody vyhlížet jen tři čísla: • velikost vzorku • délku období sledování • úplnost období sledování. Velikost vzorku Před zahájením klinické studie je třeba stanovit výpočet velikosti vzorku („síly" testu, tedy schopnosti vyvrátit nulovou hypotézu). Vzorek by měl být dost velký, aby měl vysokou pravděpodobnost prokázat žádoucí účinek, pokud existuje, jako statisticky významný, a naopak získat dostatečnou jistotu, že neexistuje žádný prospěch, pokud jej studie nezjistila. K výpočtu velikosti vzorku si musí klinik určit dvě otázky: • jaká míra rozdílu mezi dvěma skupinami bude považována za klinicky významný účinek. To nemusí být to samé jako statisticky významný účinek. Mohli byste podávat nový lék snižující krevní tlak o přibližně 10 mmHg a účinkem by byl statisticky významný pokles vzniku iktu (statisticky významný znamená, že pravděpodobnost náhodného poklesu incidence je menší než 1 z 20). Pokud by však lidé, kteří by měli tento lék užívat, měli jen mírně zvýšený krevní tlak a neměli žádný větší rizikový faktor pro iktus (tj. byli relativně mladí, nebyli diabetici, měli normální hladinu cholesterolu a tak dále), příslušnou úrovní rozdílu by bylo pouze předejití přibližně jednomu iktu z 850 léčených pacientů - tedy klinický rozdíl v riziku, který by mnohým pacientům nestál za užívání léku. • jaká je střední hodnota a směrodatná odchylka (v angl. literatuře zkratka SD, v české literatuře s;) proměnné představující hlavní následek. • Pokud je následkem spíše nějaká událost (jako hysterekto-mie) než veličina (jako krevní tlak), je požadovaným údajem podíl lidí s touto událostí v populaci, a odhad toho, co by mohlo v tomto podílu tvořit klinicky významnou změnu. Jakmile jsou již tato data určena, lze snadno spočítat minimální velikost vzorku použitím standardního vzorce, nomo-gramů nebo tabulek, které je možno získat z publikovaných prací, učebnic, nebo nejčastěji z komerčních statistických softwarů. Takto je možno ještě před zahájením studie vypočítat, jak veliký vzorek bude potřeba, aby byla zajištěna střední, vysoká nebo velmi vysoká pravděpodobnost zjištění skutečného rozdílu mezi skupinami. Pravděpodobnost odhalení skutečného rozdílu je známa jako síla studie a je obvykle stanovena mezi 80 % a 90 %. Proto když čtete práci popisující RCT, měli byste hledat větu, která zní nějak takto (je převzata z práce Majeeda a kolegů o cholecystektomii): „Pro 90% pravděpodobnost zjištění rozdílu u hospitalizace na jednu noc za použití Mannova-Whitneyho U-testu bylo třeba 100 pacientů v každé skupině (za předpokladu SD 0 hodnotě 2 nocí). Z toho plyne síla studie větší než 90 % pro detekci rozdílu 15 minut v délkách operace za předpokladu SD o hodnotě 20 minut." Pokud publikace, kterou čtete, neuvádí výpočet velikosti vzorku a zdá se na jejím základě, že mezi intervenční a kontrolní skupinou není rozdíl, měli byste zjistit (nebo získat přímo od autorů) informace podle výše uvedených dvou odstavců a provést výpočet sami. Studie s příliš nízkou hodnotou síly studie jsou v lékařské literatuře všudypřítomné, obvykle proto, že se autorům nepodařilo získat pro studii tolik subjektů, kolik si představovali. Takové studie typicky vedou k chybě 2. typu beta, což je chybný závěr, že intervence je neúčinná. Naopak vzácnější chyba 1. typu (alfa) je závěr, že rozdíl je významný, když ve skutečnosti je dán chybou výběru. Délka období sledování 1 když je velikost vzorku dostatečná, studie musí pokračovat dostatečně dlouhou dobu, aby se vliv intervence odrazil v proměnné představující následek. Pokud by se autoři zaměřili na vliv nového analgetika na stupeň pooperační bolesti, jejich studii by stačilo 48hodinové období sledování. Na druhé straně, pokud by jim šlo o vliv nutričního doplňku podávaného v předškolním věku na výslednou tělesnou výšku v dospělosti, období sledování by se počítalo na desetiletí. I když intervence ukáže významný rozdíl mezi skupinami po, řekněme, šesti měsících, tento rozdíl nemusí být trvalý . Jak je známo na příklad ze snah o redukci obezity, dramatické výsledky se mohou objevit po dvou či třech týdnech, ale pokud se období sledování prodlouží na rok nebo déle, řada osob nabere většinu své váhy zpět. Úplnost období sledování Bylo opakovaně ukázáno, že u osob, které odstoupily („odpadly") ze studie, je méně pravděpodobné, že užívaly lék tak, jak měly nařízeno, je pravděpodobnější, že nedocházely na průběžné kontroly a je více pravděpodobné, že se u nich projevily vedlejší účinky medikace, než u těch, které neodstoupily. Lidé, kteří nevyplní dotazník, mohou daný problém vnímat jinak (a pravděpodobně slaběji) než ti, kteří jej obratem zašlou zpět. U lidí v programu redukce váhy je pravděpodobnější, že se budou nadále vracet, pokud skutečně hmotnost ztrácejí. Důvody, proč pacienti odstoupí z klinické studie, mohou být následující: • nesprávné zařazení pacienta do studie (tj. během studie se zjistí, že pacient v první řadě neměl být randomizován, protože nesplňoval kritéria pro zařazení do studie). • podezření na nežádoucí reakce na testovaný lék. Nikdy by se neměla brát v úvahu četnost „nežádoucích reakcí" v in- 702 tervenční skupině bez jejího srovnání s četností v placebo skupině. Inertní tabletky jsou často důvodem, že lidé ze studie odstoupí. • ztráta motivace pacienta („Už ty tablety nechci brát"). • vyřazení klinikem z klinických důvodů (například souběžné onemocnění, těhotenství). • ukončení období sledování (například pacient se odstěhu-je). • úmrtí. Samozřejmě, že pacienti, kteří zemřou, nedocházejí dále na ambulantní návštěvy. Takže pokud se s tím nepočítá, mohou být chybně klasifikováni jako ti, kteří „odpadli". To je jeden z důvodů, proč studie s nízkým podílem těch, kteří dokončí období sledování (řekněme menším než 70 %), se obecně považují za neplatné. Pokud se neberou v úvahu osoby které odstoupily z klinické studie, výsledky jsou obvykle vychýleny ve prospěch intervence. Je proto standardní praxí analyzovat výsledky srovnávacích studií na základě záměru léčit (intention to treat). To znamená, že všechny údaje o pacientech původně přidělených do intervenované části studie včetně těch, kteří odstoupili před dokončením studie, těch, kdo neužívali tablety, a dokonce těch, kteří se následně z jakéhokoli důvodu dostali do kontrolní skupiny, by měly být analyzovány spolu s údaji o pacientech, kteří dodrželi celý protokol. Stejně tak ti, kteří odstoupili z placebové části studie, by měli být analyzováni spolu s těmi, kteří poctivě užívali placebo. Naopak analýza účinnosti má vysvětlit účinky intervence samotné, a je proto zaměřena na léčbu, kterou pacient skutečně dostal. Ale i když jsou osoby, na nichž se analýza účinnosti provádí součástí RCT, pro účely této analýzy ve skutečnosti vytvářejí kohortovou studii. Shrnutí Po kritickém posouzení metodologické kvality publikace, by každý měl být schopen říci několika větami, jaký druh studie byl proveden, u kolika osob, odkud osoby pocházely, jaká léčba či jiná intervence jim byla nabídnuta, jak dlouhé bylo období sledování (nebo, pokud šlo o přehledovou studii, jaká byla četnost odpovědí) a co bylo použito jako měřítko následku. V této fázi by se také mělo určit, jaké statistické testy, pokud vůbec nějaké, byly použity k analýze výsledků. Pokud jsou tyto věci jasné, je snadnější porozumět výsledkům studie, hodnotit jejich význam a, je-li to na místě, i je případně odmítnout. Příkladem takového sumarizačního popisu studie je na příklad: • práce popisuje nezaslepený randomizovaný pokus, který se zaměřil na terapii, u 267 ambulantních pacientů ve věku mezi 58 a 93 roky, u nichž byl porovnáván čtyřvrs-tvý kompresívní obvaz se standardními jednovrstvými obvazy v léčbě nekomplikovaných vředů při chronické žilní nedostatečnosti dolních končetin. Období sledování bylo šest měsíců. Procento zhojení vředu bylo měřeno od výchozího stavu jako plocha nákresu rány pořízeného (obvodní) sestrou a následně spočítáno počítačovým snímacím zařízením. Výsledky byly analyzovány za použití Wilcoxonova testu pro párové hodnoty. • práce je dotazníková přehledová studie u 963 praktických lékařů náhodně vybraných v celém Spojeném království, v níž byli dotázáni na rok jejich promoce na lékařské fakultě a na úroveň diastolického tlaku, při které by začali léčit esenciální hypertenzi. Možnosti odpovědí na strukturovaném dotazníku byly „90-99 mmHg", „100-109 mmHg" a „110 mmHg a více". Výsledky byly analyzovány za použití x2 (chí kvadrát) testu v kontingenční tabulce 3x2, aby bylo vidět, zda práh pro léčbu hypertenze je ve vztahu k tomu, zdali lékař promoval před rokem 1975 nebo po něm. • práce je kazuistika jediného pacienta s podezřením na smrtelnou lékovou reakci na Sleepol, nově distribuované hypnotikum. Pomůckou pro metodologické hodnocení jsou také t.zv. „kontrolní seznamy", které obsahují přehled otázek, na které je potřeba se při hodnocení metodologické kvality publikace zaměřit. 703 41 DIAGNÓZA 41.1 VALIDITA DIAGNOSTICKÝCH TESTŮ Při kritickém posuzování diagnostického testu je třeba najít odpověď na tři následující otázky: 1 -je validní důkaz o přesnosti dg.testu? 2 -rozlišuje test pacienty kteří mají a nemají specifickou poruchu? 3 -je možno aplikovat tento validní a významný test u speci- fického pacienta? Jestliže najdeme publikaci o dg.testu - je možno jí kriticky zhodnotit položením následujících otázek: Validita • bylo provedeno nezávislé, zaslepené srovnání s referenčním (zlatým) standardem? ...absolvovali pacienti oboje vyšetření (tj.diagnostic-ký.test na příklad vyšetření krve a současně i standard - biopsie, pitva) ... zaslepení (na příklad patolog hodnotí bipsii a nezná výsledek dg.testu) • často může být problém se standardem (nemusí být přesný) např. v psychiatrii, ale i u jiných standardů (shoda expertů u bipsii jen v 50%) • výsledek testu je označen jako normální nebo abnormální • 6 definic co je považováno za normální: 6 definic co je považováno za normální 1. Gaussovo rozložení: průměr ± 2 standardní odchylky - to může být považováno za normální rozložení pro všechny testy a výsledky, které mají takové rozložení 2. Percentily: v rozmezí řekněme 5-95% - mají stejný základní defekt jako Gaussovo rozložení 3. Kulturně přijatelné: normální je to, co je preferováno a přijímáno společností = medicínská kritéria stojí v pozadí 4. Podle rizikového faktoru: pokud nepřináší zvýšené riziko onemocnění (ale není jisté, jestli změna rizikového faktoru přinese také změnu rizika jako takového)? 5. Diagnostická: rozmezí výsledků mimo hranice, kde výskyt nemoci je vysoce pravděpodobný - toto kriterium je používáni i v rámci diskuse o EBM!!! 6. Therapeutická: rrozmezí výsledků mimo hranice, kdy léčba přináší více prospěchu než poškození = to je třeba mít na mysli při kritickém posuzování zejména nových léčebných postupů v rámci EBM!!! Dále je třeba posoudit následující okolnosti: • byl dg.test hodnocen na patřičném spektru pacientů (jako v klinické praxi)? • na celém spektru průběhu nemoci (iniciální stádium, pozdní stádium, léčení i neléčení pacienti atd.) • u ostatních nemocí často zaměňovaných? • byl použit referenční standard bez ohledu na výsledky diagnostického testu? (u negativních výsledků je tendence nepoužívat, zvláště je-li invazivní, rizikový) • byl diagnostický test ověřován na další, nezávislé skupině pacientů? Jestliže v publikaci chybí jedna nebo více z těchto podmínek, je to problém validity! Jinak pokračujeme v kritickém hodnocení následující otázky tj. zda test rozlišuje pacienty, kteří mají a nebo nemají specifickou poruchu. Významnost Významnost testu pro rozlišení zda pacient má nebo nemá danou specifickou poruchu je možno posuzovat podle sen-zitivity a specificity testu. Tyto ukazatele představují starší koncepci posuzování a nemají patřičnou přesnost. Novější, modernější a zároveň přesnější a účinnější koncepci představuje ukazatel „likelihood ratio" Pozornost je při použití tohoto ukazatele zaměřena na schopnost testu změnit náš názor, který jsme měli před provedením testu (pre-test probability) a který budeme zastávat po provedení testu (post-testprobability). Při vyhodnocení potom platí, že diagnostický test, který vyvolá velkou změnu z pre-test na post-test probability je významný a v klinické praxi bude pravděpodobně užitečný. Příklad: u pacienta s anémií je pravděpodobnost, že má anémii z nedostatku F e 50% (50:50). Zvažujeme použití diagnostického testu na sérový ferritin. Našli jsme několik systemat.přehledů použití tohoto testu ve srovnání s ref.standardem (barvení kostní dřeně na Fe). Výsledky tohoto systematického přehledu ukazuje tabulka 1. Sérový ferritin jako diagnostický test pro anémii z deficitu železa Tab. 1 Anémie z deficitu železa Celkem přítomna nepřítomna Sérový ferritin Pozitivní (< 65 mmol/1) 731 a 270 b 1001 Negativní (> 65 mmol/1) 78 c 1500 d 1578 Celkem 809 1770 2579 Výsledek našeho pacienta byl 60mmol/l. Jak můžeme tento výsledek vyhodnotit? - spadá buď do políčka „a" nebo do „b" na tabulce Z toho vyplývá, že 90% pacientů s deficitem Fe (731/809 x 100) má sérový ferritin ve stejném rozmezí jako náš pacient (to představuje ukazatel, který se nazývá senzitivita). Dále 85% pacientů, kteří nemají anémii z deficitu železa (1500/1770 x 100) mají také hodnotu sérového ferritinu negativní (ukazatel, který se nazývá specificita). Současně je zřejmé, že jen 15% pacientů s jinými příčinami anémie (270/1770 x 100) má výsledek ve stejném rozmezí jako náš pacient. Takže výsledek našeho pacienta je 6 x pravděpodobnější (90%/15%) u anémie z deficitu železa než u jiné příčiny anémie (to je ukazatel, který se nazývá likelihood ratio pro pozitivní test (LR+ = senzitivita/1-specificita) Pravděpodobnost deficitu železa 50:50 (stanovená odhadem na začátku vyšetřování) = pre-test odds 1:1. Jestliže tuto násobíme LR+ (1x6=6) pakpost-test odds je 6:1 ve prospěch anémie z deficitu Fe. Myslíme-li spíše v pojmech pravděpodobnosti než „odds" pak post-test odds 6:1 konvertujeme na post-test probability = 6/6+1 = 86% Pre-test odds vycházející z publikované tabulky = 31%/ 69% = 0.45, pak post-test odds = 0.45 x 6 = 2.7 a post-test probability = 2.7/3.7 = 73% a to je stejné jako pozitivní prediktivní hodnota. 704 Použití senzitivity a specificity je trochu jiné než se obvykle myslí: - je-li vysoká senzitivita testu pak negativní výsledek spolehlivě vylučuje dg. ( SnNout) - je-li vysoká specificita testu pak pozitivní výsledek spolehlivě potvrzuje dg. ( SpPin ) Multilevel likelihood ratio I když podle starších kritérií vypadá stanovení sérového fer-ritinu dobře (senzitivita 90% a specificita 85%), novější vyjádření přesnosti pomocí likelihood ratio má větší vypovídací cenu a ukazuje, že starší způsob může být i zavádějící tím, že zohledňuje pouze pozitivní nebo negativní výsledek testu. Výsledky většiny testů však mohou být rozděleny do více úrovní jak je ukázáno na tabulce 2. Pětistupňová škála výsledků diagnostického testu Tab. 2 Výsledek dg. testu Sérový feritin mmol/1 Cílová porucha -Deficit železa Likelihood Diagno- Přítomna Nepřítomna ratio stický důsledek Počet % Počet % Silně pozitivní <15 474 59 (474/809) 20 1.1 (20/1770) 52 Potvrzuje dg. Mírně pozitivní 15-34 175 22 (175/809) 79 4.5 (79/1770) 4.8 Středně vysoký Neutrální 35-64 82 10 (82/809) 171 10 (171/1770) 1 Neurčitý Mírně neg. 65-94 30 3.7 (30/809) 168 9.5 (168/1770) 0.39 Středně nízký Silně neg. >94 48 5.9 (48/809) 1332 75 (1332/1770) 0.08 ■Vylučuje dg- Celkem 809 100.0 1770 100.0 X X • z tabulky je vidět kolik informací o přesnosti ferritinové-ho testu se ztrácí, pokud se hodnotí • pouze pozitivní nebo negativní výsledek • LR pro vysoce pozitivní výsledek je působivé = 52, takže jeden takový výsledek testu určuje diagnózu. V takovém případě můžeme povařovat diagnózu za jistou (SpPin) u 59%(474/809) pacientů s anémií z deficitu Fe i přes nepůsobivou senzitivitu (59%). • LR 10 a více pokud je aplikováno na pre-test probability 33% a více (33%/67% = pre-test odds • of 0.5) vytváří post-test probability 5/6 = 83% a více • druhá extrémní hodnota(negativní) může vyloučit anemii z nedostatku železa (SnNout) u 75%(1332/1770) pacientů, i přes nepůsobivou specificitu 75% • LR 0.1 a menší, pokud je aplikováno na pre-test probability 33% (pre-test odds 0.5) vytváří post-test probability 0.05/1.05 =5% a menší • dvě střední hodnoty(středně pozitivní a negativní) mohou posunout 50% pravděpodobnost (pre-test odds 1:1) na užitečnou ale ne vždy diagnostickou post-test probability 4.8/5.8 =83%, 0.39/1.39=28% • neurčitá hodnota uprostřed, obsahující asi 10% obou typů pacientů, je neinformativní s LR = 1 Dopad různých LR na pre-test probability ukazuje tabulka 3: Pětistupňová škála výsledků diagnostického testu a vliv na post-test probability v závislosti na pre-test probability Tab. 3 Likelihood ratio Post-test probabillity cílové poruchy pro různé hodnoty pre-test probability Pre-test 5% Pre-test 10% Pre-test Pre-test 20% 30% Pre-test Pre-test 50% 70% Silně pozitivní 10 34% 53% 71 % 81 % 91 % 96% Středně pozitivní 3 14% 25% 43% 56% 75% 88% Neutrální 1 5% 10% 20% 30% 50% 70% Středně negativní 0.3 1.5 % 3.2 % 7% 11 % 23% 41 % Silně negativní 0.1 0.5 % 1% 2.5 % 4% 9% 19% Pokud se opět vrátíme zpět k našemu pacientovi s pre--test probability pro deficit Fe 50:50 a s výsledkem sérového ferritinu 60 mmol/1 je překvapením, že pacientovy výsledky spadají do neurčitého LR 1 a pacientův výsledek testu, který se zdál velmi užitečný vzhledem k jeho původnímu hodnocení senzitivity a specificity, ve skutečnosti nevede k diagnóze. V tomto případě je tedy třeba použít jiný test (ref.standard?) aby se problém diagnózy vyřešil. Mnoho současných diagnostických testů uvádí multilevel LR a pokud uvádí pouze senzitivitu a specificitu, lze LR z těchto hodnot vypočítat. Použitelnost Při zvažování jestli je validní a významný diagnostický test použitelný pro našeho pacienta se specifickou pre-test probability je třeba zvážit následující otázky: • je diagnostický test dostupný a přesný v našem prostředí? je-li na trhu, zda je zajištěno aby byl prováděn a interpretován kompetentně a reprodukovatelně • diagnostický test se může chovat jinak u různých skupin pacientů (v časném nebo pozdním stádiu nemoci) a to je další důvod proč je výhodné používat LR, které je méně ovlivněno těmito důvody • některé dg.testy založené na příznacích ztrácejí diagnostickou sílu při změně pacientů z primární do sekundární nebo terciární péče (klesá specificita-falešná pozitivita) Další otázkou je, zda se může udělat klinicky rozumný odhad pre-test probability pro našeho pacienta? Podle čeho odhadujeme: • klinická zkušenost - u předchozích pacientů .. to může být ovlivněno vzpomenutím na posledního pacienta, nej-dramatičtější událostí a pod. • regionální statistiky prevalence - kvalita statistik • databáze kliniků - spíše „hudba budoucnosti" ale i tak otázka diagnostických kritérií, jasné definice příznaků atd. • publikace podle které jsme posuzovali validitu a význam diagnostického testu - skladba pacientů v publikaci • studie určující tento problém - nejlepší. Také se můžeme ptát zda ovlivní post-test probability naší péči o pacienta? • zda na základě těchto výsledků překonáme určitý diagnostický práh a můžeme přestat s dalším vyšetřováním! • je-li dg test negativní nebo vytváří LR kolem 0.1 můžeme 705 suspektní diagnózu opustit je-li dg test pozitivní nebo vytváří vysoké LR, diagnóza je stanovena práh diagnostického testu může být překročen oběma směry ( viz obrázek 2), pouze když nás nechá diagnostický test uprostřed těchto prahů, pak vyšetřujeme jinými testy Využití kritického hodnocení Kritická hodnocení různých klinických problémů, prováděná specialisty v oboru EBM se potom prezentují ve formě standardizovaných jednostránkových shrnutí důkazů - „cri-tically appraised topic" CAT, které se potom mohou stát velmi významnou pomůckou, která popisuje klinický postup a pomáhá lékaři při jeho rozhodování. Práh pro vyšetřování a léčení Obr 2 Jako příklad je uveden CAT pro ferritin: nevyšetřovat neléčit vyšetřovat a léčit na základě výsledků šetření nevyšetřovat zahájit léčbu + + 0 10 20 + + + + 30 40 50 60 + + + 70 80 90 100 B Prevalence (pre-test probability) cílové poruchy Nemusíme však překročit prahy i při použití více diagnostických testů - a zde se opět uplatňují výhody LR • protože post-test odds prvního dg testu je pre-test odds pro druhý dg test, můžeme násobit průběžný produkt LR vytvořeným z následujícího testu příklad: přijde do ordinace 45 letý muž a jeho pre-test probability stenózy (>75%) jedné nebo více koronárních arterií je okolo 6%, v anamnéze udá netypickou bolest na hrudníku (jsou přítomny pouze dva ze tří příznaků substernálních hrudních potíží vyvolaných námahou s úlevou po méně než 10 minutách klidu = vytváří LR okolo 13), jeho zátěžové EKG odhalí 2. 2mm trvalou depresi ST =vytváří LR okolo 11a jeho post-test probability koronárni sklerózy je jeho pre--test probability (převedená na pre-test odds) násobená LR z anamnézy (13) a zátěžového EKG (11), z toho je post-test odds, převedené opět na post-test probability (vydělením post-test odds +1) t.zn.: (0.06/0.94) x 13 x 11 = 9.13/10.13 = 90% Konečný výsledek je přesný pokud jsou diagnostické testy které kombinujeme „nezávislé" (pravděpodobnost určitého výsledku u druhého testu je stejná pro všechny výsledky prvního testu a to u většiny testů které používáme v sekvenci pro určení jedné diagnózy není pravda) Proto chceme na konci této sekvence post-test probability nad prahem kdy začínáme s léčbou, než se podle ní začneme řídit. To je další příklad kdy LR pomohou z nejasné diagnostické úvahy udělat jednoznačnou. Neměli bychom však zapomínat na informovanost pacienta o všech těchto diagnostických úvahách, které všechny do jisté míry narušují jeho soukromí, mohou být bolestivé nebo nebezpečné a pacient má právo být informovaný a pak může být i spolupracujícím partnerem. Poslední otázkou je zda výsledky (a důsledky) stanovení těchto ukazatelů pomohou pacientovi dosáhnout terapeutic-kéh cíle (při zvážení terapeutických možností). CAT - ferritin v diagnostice deficitu železa v dospělosti Klinický řádek: sérový ferritin může být velmi užitečný v diagnostice anémie z deficitu železa v dospělosti Klinický scénář: u 751eté učitelky v důchodu byla při zdravotní prohlídce zjištěna hodnota haemoglobinu 10 s MC V 80, negativní anamnéza i fyzikální vyšetření a žádná medikace, terá by mohla způsobit útlum krvetvorby nebo krvácení. Odhad pravděpodobnosti, že má nedostatek železa byl 1:2 nebo 50%. Klinická otázka (složená ze tří částí): pomůže stanovení sérového ferritinu u starší ženy bez klinických příznaků, s mírnou anemií, určit zda její zásoby železa v kostní dřeni jsou nižší? Vyhledávací termíny: „ferritin" v Best Evidence = 6 citací včetně jedné velké studie a přehledu. Hodnotil: Sackett v CEBM, Oxford, pátek 9.7.1999 Studie: Nezávislá ? Zaslepená? Standard aplikován bez ohledu na výsledky? Patřičné spektrum pacientů? Cílová porucha a „zlatý standard" Ano Ano Ano Není možno posoudit kostní dřeň, barvení na železo Pacienti: pacienti postupně přicházející na ambulance nebo nemocniční oddělení. Vyloučeni pacienti s transfúzí. Diagnostický test: sérový ferritin stanovený RIA Důkaz: Přítomný Nepřítomný Výsledek testu Počet Proporce Počet Proporce Likelihood ratio < 15 474 0.59 20 0.01 51.85 15-34 175 0.22 79 0.04 4.85 35-64 82 0.10 171 0.11 1.05 65-94 30 0.04 168 0.09 0.39 >95 48 0.06 1332 0.75 0.08 Komentář: 1. U starších pacientů s asymptomatickou anemií je třeba ještě použít CAT pro anemii u starších pacientů, pro určení výtěžnosti vyšetření horní a dolní čisti zažívacího traktu. 2. Rada laboratoří vydává výsledky vyšetření ferritinu za velmi dlouhou dobu. Expirace: leden 2001 Literatura: => Guyatt G H et al.: Laboratory diagnosis of iron deficiency anemia: an overview, J.Gen.Intern.Med. 1992; 7: 45-53 => Paterson C et al.: Iron deficiency in the elderly: the diagnostic process, Can.Med.Ass.J. 1991; 144: 435-440 706 41.2 PŘÍKLADY NA VYUŽITÍ HODNOCENÍ DIAGNOSTICKÝCH TESTŮ Deset mužů na lavici obžalovaných Deset mužů čeká soudní přelíčení kvůli vraždě. Pouze tři z nich skutečně spáchali vraždu, ostatních sedm je zcela nevinných. Porota každého vyslechne a shledá šest z nich vinných z vraždy. Dva z odsouzených jsou skutečně vrazi. Čtyři muži jsou nespravedlivě uvězněni. Jeden vrah je volný. Tuto informaci lze vyjádřit jako tzv. čtyřpolní tabulku (tj. kontingenční tabulka 2x2). Pravda Vinen Nevinen Výrok poroty Vinen 2 4 Nevinen 1 3 Všimněte si, že „pravda" (tj. zdali se ti muži skutečně dopustili vraždy) je vyjádřena pod nadpisky nahoře vodorovně seřazenými a výrok poroty (který může nebo nemusí odrážet pravdu) je vyjádřen vedle nadpisků umístěných svisle vlevo. Tato čísla odrážejí řadu vlastností [schopnostijtéto konkrétní poroty: • Porota správně rozpozná dva z každých tří skutečných vrahů. • Správně zprostí obžaloby tři z každých sedmi nevinných lidí. • Pokud tato porota shledá nějakou osobu vinnou, je stále šance jen jedna ze tří, že tato je skutečně vrahem. • Pokud tato porota shledá nějakou osobu nevinnou, má ona šanci tři ze čtyř, že je skutečně nevinná. • V pěti případech z každých 10 porota vynáší spravedlivý rozsudek. Těchto pět vlastností tvoří, v pořadí, jak jsou uvedeny, senzitivitu, specificitu, pozitivní prediktivní hodnotu, negativní prediktivní hodnotu a správnost fungování této poroty. Těchto pět vlastností se dá aplikovat na diagnostické (nebo screeningové) testy, když se porovnají se „skutečnou" diagnózou nebo zlatým standardem. Jak už bylo řečeno, je zde ještě šestá, poněkud složitější (ale velice užitečná) vlastnost diagnostického testu - "likelihood ratio". V popsaném případě likelihood ratio pozitivního rozsudku poroty je 1.17 a v případě negativního rozsudku je 0.78. Z těchto hodnot je zřejmé, že v tomto případě práce poroty nebyla příliš kvalitní. Ověření validity diagnostického testu vzhledem ke zlatému standardu: Čistič oken řekl svému lékaři, že v poslední době pociťuje žízeň, a požádal ho o vyšetření na cukrovku, která pronásleduje jeho rodinu. Sestra v ordinaci vyšetřila jeho vzorek moči ponořením specielního detekčního proužku. Proužek zůstal zelený, což zjevně znamenalo, že v jeho moči není žádný cukr (glukóza). To znamenalo, jak řekla sestra, že nemá cukrovku. S obtížemi se pak tomuto čističi oken vysvětluje, že výsledek testu neopravňuje k takovému závěru o nic víc, než že by rozsudek vinen z někoho nutně dělal vraha. Definice diabetu podle Světové zdravotnické organizace je hladina glukózy v krvi nad 7 mmol/1 nalačno nebo nad 11.1 mmol/1 dvě hodiny po orální zátěži 100 g glukózy (glu-kózový toleranční test). Těchto hodnot musí být dosaženo při dvou oddělených vyšetřeních, pokud osoba nemá žádné příznaky, nebo jen jednou, pokud má typické příznaky diabetu (žízeň, polyurii a tak dále). Tato přísná kritéria lze nazvat zlatým standardem pro diagnostiku diabetu. Jinými slovy, pokud jsou splněna kritéria WHO, je možno nazvat pacienta diabetikem. Totéž nelze říci o orientační metodě namáčení diagnostického proužku do příležitostného vzorku moči. Na jedné straně může být doopravdy diabetik, ale má vysoký renální práh; to znamená, že jeho ledviny zadržují glukózu mnohem více než u většiny lidí, a tak by hladina glukózy v jeho krvi musela být mnohem vyšší než u většiny lidí, aby se u něho nějaká glukóza objevila v moči. Na druhé straně může být jinak normální jedinec s nízkým renálním prahem, a tak u něho glukóza uniká do moči, i když jí v jeho krvi není nadbytek. Ve skutečnosti je diabetes často sdružen s negativním testem na glukózu v moči. Avšak použití močového proužku má mnoho výhod oproti glukózovému tolerančnímu testu z plné krve, pokud se použije jako screeningový test, zda vyšetřovaní jedinci nemají diabetes. Test je levný, vyhovující, snadno proveditelný a hodnotitelný, přijatelný pro pacienty a poskytuje okamžitý výsledek typu ano/ne. V reálném životě mohou lidé, jako na příklad čistič oken, odmítnout glukózový toleranční test. I kdyby byl připraven jej podstoupit, jeho praktický lékař by mohl usoudit, že jeho příznaky si nezaslouží náklady na toto poměrně složité vyšetření. Z toho je zřejmé, že i když nemůže močový test s jistotou říci, zda někdo je diabetik, má určité praktické výhody oproti zlatému standardu. A to je také důvod, proč je používán! Abychom objektivně posoudili, jak užitečný je močový test na glukózu pro diagnostiku diabetu, museli bychom vybrat vzorek lidí (řekněme 1000) a u každého z nich provést dva testy: močový test (screeningový) a standardní glukózový toleranční test (zlatý standard). Poté bychom viděli u každé osoby jednotlivě, zdali výsledek screeningového testu odpovídá výsledku zlatého standardu. Takový proces je znám jako studie ověřující platnost testu (angl. validation study). Výsledky takové studie můžeme opět vyjádřit ve formě čtyřpolní tabulky: Glukózový toleranční test pozitivní negativní celkem Glukóza 1 pozitivní 6 (a) 7 (b) 13 v moči negativní 21 (c) 966 (d) 987 celkem 27 973 1000 • Můžeme tedy spočítat důležité vlastnosti močového testu na průkaz diabetu. • Senzitivita = a/(a+c) = 6/27 = 22.2 % • Specifická = d/(b+d) = 966/973 = 99.3 % • Pozitivní prediktivní hodnota = a/(a+b) = 6/13 = 46.2 % • Negativní prediktivní hodnota = d/(c+d) = 966/987 = 97.9 % • Správnost = (a+d)/(a+b+c+d) = 972/1000 = 97.2 % • Likelihood ratio pozitivního testu = senzitivita/ (1 - specificita) = 22.2/0.7 = 32 • Likelihood ratio negativního testu = (1 - senzitivita)/ specificita = 77.8/99.3 = 0.78 Na těchto číslech je vidět, proč u čističe oken nebyla po vyšetření moče jistota, že nemá diabetes. Pozitivní močo- 707 vý glukózový test má jen 22 % senzitivitu, což znamená, že test nezachytí téměř čtyři pětiny skutečných diabetiků. V přítomnosti klasických příznaků a pozitivní rodinné anamnézy je výchozí riziko čističe oken (pretestová neboli apriorní pravděpodobnost), že je nemocný, vysoké, a po jednotlivém negativním močovém testu je sníženo jen asi na čtyři pětiny původní hodnoty (likelihood ratio negativního testu = 0.78). Vzhledem k jeho příznakům je zřejmé, že tento muž potřebuje podstoupit definitivnější test na diabetes. Pokud by však močový glukózový test byl pozitivní, čistič oken by měl dobré důvody ke znepokojení, protože i když test není příliš senzitivní (tj. není dobrý na zachycení lidí s nemocí), je výrazně specifický (to znamená, že je dobrý pro vyloučení lidí bez nemoci). V praxi se často u testů zaměňuje hledisko senzitivity/ specificity s hlediskem pozitivní/negativní prediktivní hodnoty. Běžně platí, že senzitivita a specificita vypovídají o testu povšechně, zatímco prediktivní hodnota vypovídá 0 tom, co výsledek určitého testu znamená pro konkrétního pacienta. Proto senzitivitu a specificitu obecně používají spíše epidemiologové a specialisté na veřejné zdraví, jejichž každodenní práce zahrnuje rozhodování ohledně populací. Screeningový mammogram (rentgen prsu) může mít 80% senzitivitu a 90% specificitu pro odhalení karcinomu prsu, což znamená, že test zachytí až 80 % karcinomů a vyloučí 90 % žen bez rakoviny. Ale když přijde pacientka za svým lékařem pro výsledek svého mammogramu, bude chtít odpověď (je-li test pozitivní) „Jaké je riziko, že mám rakovinu?" nebo (je-li výsledek negativní) „Jaká je pravděpodobnost, že mohu zapomenout na možnost rakoviny?". Mnoho pacientek (a příliš mnoho zdravotníků) předpokládá, že negativní prediktivní hodnota testu je 100 %, tj. pokud je test „normální", myslí si, že není žádné riziko přítomnosti nemoci - a v případě pozitivní prediktivní hodnoty je tomu naopak. Deset otázek, které je třeba si položit ohledně publikace, která tvrdí, že ověřuje platnost diagnostického nebo screeningového testu Otázka 1 Může být tento test důležitý pro mou praxi? Je to otázka „tak co?", kterou se Sackett a kolegové ptají na užitečnost testu. I kdyby test byl 100% platný, správný a spolehlivý, pomohl by mi? Zjistil by léčitelné onemocnění? Pokud ano, mohu si jej já (nebo mí pacienti či daňový poplatník) dovolit? Souhlasili by s ním moji pacienti? Změnil by dostatečně pravděpodobnost ostatních možných diagnóz tak, aby to pozměnilo můj léčebný plán? Pokud všechny odpovědi na tyto otázky jsou „ne", jste schopni onu publikaci zamítnout, aniž byste četli dále za abstrakt nebo úvod. Otázka 2 Byl test porovnán se skutečným zlatým standardem? Nejprve se musíte zeptat, zdali test byl vůbec s něčím porovnán! Občas jsou napsány práce (a v minulosti byly 1 publikovány), v nichž nebylo uděláno nic kromě provedení nového testu u několika tuctů subjektů. Takový výkon může poskytnout řadu možných výsledků testu, ale určitě nepotvrzuje, že „pozitivní" výsledky ukazují na to, že cílová porucha (hledané onemocnění) je přítomna, a že „negativní" výsledky znamenají, že není. Pro mnohé stavy neexistuje takový diagnostický test, který by byl zlatým standardem a který by s určitostí řekl, zda nemoc je nebo není přítomna. Nepřekvapí, že jsou to právě ty stavy, pro které se hledají nové testy nejaktivněji! Proto by autoři takové publikace měli vyvinout kombinaci kritérií, vůči nimž by měl být nový test vyhodnocen, a vysvětlit oprávněnost jejich použití. Jednou specifickou věcí, kterou je třeba zkontrolovat, je, že test, jehož platnost se zde ověřuje (nebo jeho varianta), se nepoužívá k tomu, aby přispěl k charakteristice zlatého standardu. Otázka 3 Zahrnula tato studie, ověřující validitu testu, vhodné spektrum subjektů? Kdybyste ověřovali platnost nového testu na cholesterol u 100 zdravých mediků mužského pohlaví, nebyli byste schopni říci, jak by test fungoval u žen, dětí, starších lidí, u osob s nemocí, které výrazně zvyšují hladinu cholesterolu, nebo dokonce u těch, kteří nikdy nebyli na lékařské fakultě! Ačkoli jen málo lidí by bylo tak prostých , aby si vybrali takhle jednostranný vzorek pro svou studii, jež má ověřovat platnost testu, jedna práce zjistila, že jen 27 % publikovaných studií výslovně charakterizovalo spektrum testovaných subjektů ve smyslu věku, pohlaví, příznaků a/nebo tíže nemoci a specifických vstupních kritérií. Popis palety účastníků i spektra nemocí, které by se měly do studie zahrnout, je nezbytný, pokud by se hodnoty různých vlastností testů měly používat i pro jiné situace. Určitý diagnostický test může být senzitivnější u žen než u mužů nebo u starších osob než u mladších. Z těchto důvodů, jak požadují Sackett a kolegové, osoby, na nichž se ověřuje jakýkoli test, by měly zahrnovat jak osoby s lehkým tak i s těžkým onemocněním, léčené a neléčené a osoby s různými běžně zaměnitelnými diagnózami. Zatímco jsou senzitivita a specificita testu zdánlivě konstantní, ať je prevalence nemoci jakákoli, jsou pozitivní a negativní prediktivní hodnota silně závislé na prevalenci. To je důvod, proč jsou praktičtí lékaři, často oprávněně skeptičtí ohledně užitečnosti testů vyvinutých výlučně na populaci v sekundární péči (fakultní nemocnice a pod.), kde jsou onemocnění obvykle těžší), a proč dobrý diagnostický test (obecně používaný, má-li pacient příznaky podezřelé z příslušné nemoci) není nutně dobrým screeningovým testem (obecně užívaným u lidí bez příznaků a pocházejících z populace s mnohem nižší prevalencí nemoci). Otázka 4 Předešlo se systematické chybě provedení? To je snadné zkontrolovat. Jednoduše to znamená, „byl každý, kdo byl vyšetřován novým diagnostickým testem, rovněž vyšetřován zlatým standardem a naopak?". Studie, kde se zlatý standard provádí pouze u osob s pozitivním výsledkem testu, jehož platnost se ověřuje, jsou zatíženy systematickou chybou. Existuje navíc ještě řada dalších jemnějších hledisek systematické chyby provedení, která ale přesahují rámec této publikace. Otázka 5 Předešlo se systematické chybě očekávání? K systematické chybě očekávání dojde, když jsou patolog a jiní, kteří interpretují diagnostické vzorky, podvědomě ovlivněni znalostí určitých stránek případu; například vědí o přítomnosti bolesti na hrudi, když hodnotí EKG. V souvislosti s ověřováním platnosti diagnostického testu vzhledem ke zlatému standardu jde o otázku: „Věděli lidé, kteří hodnotí jeden z testů, jaký byl výsledek druhého testu u každé jednotlivé osoby?" Všechna vyhodnocení by měla být správně„zaslepená" - to je, že osoba interpretující test by neměla vědět ani náznak toho, jaký výsledek se u jednotlivého případu očekává. Otázka 6 Bylo ukázáno, že test je reprodukovatelný v rámci vyšetřujícího i mezi vyšetřujícími? Pokud tentýž vyšetřující provádí tentýž test dvakrát u osoby, jejíž vlastnosti se nezměnily, vyjdou u části případů odlišné 708 výsledky. Všechny testy vykazují do určité míry tuto vlastnost, ale test s reprodukovatelností 99 % je jasně v jiné poloze než ten s reprodukovatelností 50 %. Ke špatné reprodukovatelností diagnostického testu může přispívat řada činitelů: technická přesnost vybavení, rozdíly mezi vyšetřujícími (například při srovnávání barvy s referenčním diagramem), aritmetické chyby a tak dále. Bude-li stejný výsledek k interpretaci, dva lidé se shodnou jen u části případů, což se obecně vyjadřuje jako k skóre. Pokud příslušný test dává číselné výsledky (jako je hladina cholesterolu v krvi v mmol/1), shoda mezi vyšetřujícími nebude problémem. Ale pokud test zahrnuje prohlížení skiagramů (jako je příklad mammogramu) nebo dotazování se lidí na to, jak pijí, je důležité potvrdit, že reprodukovatel-nost mezi vyšetřujícími je na přijatelné úrovni. Otázka 7 Jaké jsou vlastnosti testu odvozené ze studie ověřující jeho [platnostjvaliditu? Všechny uvedené standardy mohou být dodrženy, ale test může být stále bezcenný, protože sám není validní, tj. jeho senzitivita, specificita a další rozhodující vlastnosti jsou příliš nízké. To je možná případ použití glukózy v moči jako screeningového testu na diabetes. Ostatně pokud má nějaký test četnost falešně negativních výsledků téměř 80 %, pravděpodobně spíše uvede klinika v omyl, než by napomohl diagnostice cílové poruchy. Ohledně validity screeningového testu není nic absolutně určeno, jelikož to, co se považuje za přijatelné, závisí na stavu, o jehož záchyt se jedná. Asi není pochyb o testu na barvoslepost, který má 95% senzitivitu a 80% specificitu, ale na barvoslepost nikdo nikdy nezemřel. Guthrieho screenin-gový test na kongenitální hypotyreózu, prováděný u všech novorozenců v některých zemích brzy po porodu, má více než 99% senzitivitu, ale pozitivní prediktivní hodnotu jen 6 % (jinými slovy, zachytí téměř všechny děti s tímto stavem za cenu vysoké četnosti falešně pozitivních výsledků), ale to je dobře . Je mnohem důležitější zachytit každé jednotlivé dítě s tímto léčitelným stavem, u něhož by se jinak vyvinulo těžké mentální postižení, než ušetřit stovky rodičů poměrně malého stresu z opakování krevních testů u jejich dětí. Otázka 8 Byly stanoveny intervaly spolehlivosti pro senzitivitu, specificitu a další vlastnosti testu? Interval spolehlivosti, který může být spočítán pro skutečně každou sadu číselných výsledků, vyjadřuje možné rozpětí výsledků, uvnitř něhož bude ležet skutečná hodnota. Vratíme-li se k příkladu soudní poroty , pokud by shledali nevinným pouze o jednoho vraha navíc, senzitivita jejich rozsudku by spadla ze 67 % na 33 % a pozitivní prediktivní hodnota rozsudku ze 33 % na 20 %. Senzitivita vzhledem k rozhodnutí u jednotlivého případu je tak výrazně nízká (a zcela nepřijatelná), protože byla ověřována platnost práce poroty jen na 10 případech. Intervaly spolehlivosti pro vlastnosti této poroty jsou tak široké, že by je asi počítačový program odmítl spočítat! Čím větší velikost vzorku, tím užší interval spolehlivosti, a tak je zvláště důležité pátrat po intervalech spolehlivosti, pokud publikace, kterou čtete, pojednává o studii s poměrně malým vzorkem. Otázka 9 Bylo z těchto výsledků odvozeno rozumné „normální rozmezí"? Pokud test poskytuje spojité výsledky - tj. pokud dává spíše číselné hodnoty než výsledky typu ano/ne - někdo bude muset říci, při jaké hodnotě bude výsledek testu považován za abnormální. Mnozí z nás už byli v této situaci s měřením vlastního krevního tlaku. Chceme vědět, jestli jsou naše výsledky „v pohodě" nebo ne, ale lékařův výsledek je „142/92". Jestliže hodnota 140/90 byla stanovena jako hraniční bod pro vysoký krevní tlak, byli bychom umístěni do „abnormální" kategorie, i když riziko potíží plynoucí z našeho krevního tlaku se velmi málo liší od rizika osoby s krevním tlakem 138/88. Docela rozumně mnozí praktičtí lékaři říkají svým pacientům: „Váš krevní tlak není zcela v pořádku, ale nespadá do nebezpečné oblasti. Přijďte za tři měsíce na kontrolu". Nicméně v některé fázi musí lékař rozhodnout, že tento krevní tlak potřebuje medikamentózni léčbu , ale tamten ne. Určení relativně a absolutně nebezpečných oblastí pro spojitou fyziologickou nebo patologickou proměnnou je složitá věda, která by měla brát v úvahu skutečnou pravděpodobnost nepříznivého následku, kterému by měla zamýšlená léčba předcházet. Takový proces je značně objektivnější při použití likelihood ratio. Otázka 10 Byl tento test dán do souvislosti dalších možných diagnostických testů v diagnostické posloupnosti u daného stavu? Všeobecně se léčí vysoký krevní tlak jednoduše na základě samotného měření krevního tlaku (ačkoli se spíše spoléhá na řadu měření, než na jednotlivou hodnotu). Porovnejte to s posloupností, kterou používáme k diagnóze stenózy („sklerózy") věnčitých tepen. Nejprve vybereme pacienty s typickou anamnézou námahové anginy (bolesti na hrudi při námaze). Potom obvykle natočíme klidové EKG, zátěžové EKG a v některých případech provedeme izotopové vyšetření srdce, abychom našli oblasti chudé na kyslík. Většina pacientů přichází ke koronarografii (definitivnímu vyšetření na stenózu věnčitých tepen) poté, co již měli abnormální výsledek těchto předběžných testů. Pokud byste vzali 100 lidí z ulice a přímo je poslali na koronarografii, mohl by test ukázat zcela odlišné pozitivní a negativní prediktivní hodnoty (a dokonce různou senzitivitu a specificitu), než u nemocnější populace, na které se původně ověřovala jeho platnost. To znamená, že různé aspekty validity koronarografie jako diagnostického testu nemají význam, nejsou-li tato čísla vyjádřena ve smyslu toho, jak přispívají k celkovému diagnostickému procesu. Poznámka k likelihood ratio: Předchozí otázka 9 popsala potíže s definicí normálního rozmezí pro spojitou proměnnou. Za takových okolností může mít přednost vyjádřit výsledek testu ne jako „normální" nebo „abnormální", ale v pojmech skutečné pravděpodobnosti, že pacient má cílové onemocnění, pokud výsledek testu dosáhne určité úrovně. Vezměme si za příklad použití měření prostatického specifického antigénu (PSA) pro screening karcinomu prostaty. Většina mužů bude mít v krvi nějaký stanovitelný PSA (řekněme 0.5 ng/ml) a většina z těch, kteří mají pokročilý karcinom prostaty, bude mít hodně vysoké hladiny PSA (často nad 20 ng/ml). Ale hladinu PSA, řekněme, 7.4 ng/ml lze nalézt jak u dokonale normálního muže, tak u někoho s časným karcinomem. Prostě neexistuje jasny hraniční bod mezi normálním a abnormálním. Můžeme však použít výsledky studie ověřující platnost PSA testu vůči zlatému standardu pro diagnostiku karcinomu prostaty (řekněme biopsii), abychom sestavili celou řadu čtyřpolních tabulek. Každá tabulka by používala různou definici abnormálního výsledku PSA, aby byli pacienti roztříděni na „normální" a „abnormální". Podle těchto tabulek bychom mohli vytvořit různé likelihood ratio sdružené s hladinou PSA, která je vyšší, než jsou jednotlivé hraniční body. Kdybychom se potom setkali s výsledkem PSA v „šedé zóně", byli bychom alespoň schopni říci, že „tento test ne- 709 prokázal, že pacient má karcinom prostaty, ale vyplývá z něj x krát vyšší [nebo nižší] riziko této diagnózy". Ve skutečnosti PSA test není příliš dobrý na rozlišení mezi přítomností a nepřítomností karcinomu, ať se používá jakákoli hodnota pro hraniční bod. Jinými slovy, neexistuje žádná hodnota PSA, která by poskytovala zvláště vysoké likelihood ratio pro detekci karcinomu. Ačkoli je likelihood ratio, pokud jde o jeho výpočet, jedním ze složitějších hledisek diagnostického testu, má vysokou praktickou hodnotu a stává se upřednostňovaným způsobem vyjadřování a porovnávání užitečnosti různých testů. Likelihood ratio lze přímo použít k potvrzení nebo vyloučení určité diagnózy. Pokud například vejde nějaká osoba do ordinace a nemá vůbec žádné příznaky, je zřejmé, že má 5% riziko přítomnosti sideropenické anemie, jelikož je známo, že jedna osoba z 20 tuto diagnózu má (řečí diagnostických testů to znamená, že pretestová (apriorní) pravděpodobnost anemie, totožná s její prevalencí, je 0.05). Když se potom provede diagnostický test na anemii, sérovou hladinu ferritinu, výsledek obvykle učiní diagnózu anemie více nebo méně pravděpodobnou. Středně snížená sérová hladina ferritinu (mezi 18 a 45 ug/1) má likelihood ratio 3, takže riziko u pacienta s takovým výsledkem, že má si-deropenickou anemii, se obecně spočítá jako 0.05 x 3 neboli 0.15 (15 %). Tato hodnota je známa jako potestová (apos-teriorní) pravděpodobnost testu na sérový ferritin. (Přísně řečeno, likelihood ratio by se mělo používat spíše pro rizika než pro pravděpodobnosti, ale zde ukázaná jednodušší metoda poskytuje dobré přiblížení, je-li apriorní pravděpodobnost nízká. V tomto příkladě je 5% apriorní pravděpodobnost rovna apriornímu riziku 0.05/0.95 neboli 0.053; pozitivní test s likelihod ratio 3 dává aposteriorní riziko 0.158, což je rovno aposteriorní pravděpodobnosti 14 %). 41.3 SCREENING Screening znamená včasnou diagnostiku presymptomatické-ho období nemoci u zdravých jedinců v populaci (nazýváno jako Screening), nebo u pacientů, kteří však přišli k lékaři s jinými problémy (nazýváno jako case finding). Vyšetření, které tyto osoby podstupují by jim mělo zajistit, že budou žít déle anebo lépe, než kdyby toto vyšetření nepodstoupily. Takže důkaz, který se hledá v tomto případě není jenom důkaz o validitě diagnostického testu pro určení časné diagnózy, ale je třeba získat přesvědčující důkaz o tom, že se pacientovi v dlouhodobém horizontu bude dařit lépe, pokud bude jeho nemoc včas zjištěna. Tato jistota je nutná především proto, že prováděná vyšetření nejsou, alespoň z krátkodobého pohledu, pro člověka příjemná. Časná diagnóza většinou označí člověka jako že má, nebo alespoň je ve zvýšeném riziku že bude mít nějaké závažné onemocnění (nádor, cerebrovaskulární příhodu, infarkt myokardu a pod.). A toto označení trvá někdy měsíce, roky a někdy i desetiletí, než se taková nemoc manifestuje v symptomatické podobě (a to ještě jen u malé části těch, kteří byli ve screeningu pozitivní). Obecně se dá říci, že „označení" člověka poškozuje. Na příklad v jedné kohortě pracovníků, kteří byli vystřeni a někteří z nich pak označeni jako hypertenzivní bylo zjištěno, že u nich byla větší absence v zaměstnání, snížená psychologická pohoda a progresivní ztráta příjmu ve srovnání s jejich normotenzivními spolupracovníky (tyto poruchy nevyplývaly z jejich případné léčby, protože byly i u neléčených osob) A co může být ještě horší je falešně pozitivní výsledek screeningového testu, který dotyčného jenom poškozuje. Ale do jisté míry i u osob se správně pozitivním výsledkem screeningového testu jsou časy, kdy se tito lidé cítili naprosto zdrávi, nenávratně pryč. Takže časná diagnóza nemusí vždy znamenat žít déle, ale vždy znamená být nemocný déle! Z tohoto pohledu stojí otázky screeningu a vyhodnocení nejlepšího důkazu někde mezi kapitolou o diagnostice (nejlepší důkaz pro časnou diagnózu) a kapitolou o léčení (nejlepší důkaz o efektivitě následné léčby). Proto by každá screeningová metoda a každé klinické vy šeření, které vede k časné diagnóze, by mělo být vyhodnoceno podle následujících kritérií: 1. povede skutečně časná diagnóza k lepšímu přežívání pacienta a k lepší kvalitě života? Poznatky z randomizovaných klinických studií při dlouhodobém sledování osob s placebem ukázaly, že i osoby, řádně užívající placebo mohou mít lepší výsledky v budoucnu a na druhé straně je známo, že screeningové vyšetření může zachycovat spíše případy s pomalu progredujícím a benignějším průběhem nemoci. Proto prakticky jediným hodnotitelným kritériem je skutečný experiment, kdy osoby pozitivní ve screeningu byly rozděleny do dvou skupin, jedna léčena okamžitě a druhá až po manifestaci klinických příznaků. Tyto studie ukázaly, že na příklad vyšetření prsu a mamografie redukovaly mortalitu na karcinom prsu (ale protože pouze jedna třetina žen s časnou diagnózou měla prodloužené přežití, tak u ostatních dvou třetin se vlastně také jednalo spíše o poškození než o prospěch). Tyto studie ale také ukázaly zbytečnost (a de facto poškození) rtg vyšetření plic u karcinomu plic. V ideálním případě by dlouhodobé sledování mělo být zaměřeno nejen na mortalitu a délku přežívání, ale také na funkcionální změny a známky kvality života. 2. Jsou časně diagnostikovaní pacienti dobře spolupracujícími partnery při léčení? I když je léčba efektivní, pacient, který ji odmítá a nebo zapomene užívat z ní nemá žádný prospěch a zůstávají u něho pouze poškozující následky z označení jeho nemoci (pouze asi polovina pacientů se sama hodnotí jako dobře spolupracující). Existují metody jak vyhodnocovat spolupráci (compliance) pacientů, ale toto vyhodnocení by mělo být provedeno ještě před tím než se začne nějaký screening používat. 3. Je čas a energie lékaře, které vynaložil na potvrzení časné diagnózy a poskytování často celoživotní péče dobře investovanými prostředky? 4. Je frekvence a závažnost cílové nemoci dostatečná natolik, aby vynaložené úsilí a náklady byly opodstatněné? Obě posledně uvedené otázky si pokládá jednak ošetřující lékař a také celá společnost. Jedná se o to, zda vynaložené prostředky na screening, následné potvrzení diagnózy a nakonec na léčbu by nepřinesly větší užitek, kdyby byly použity jinak. Metodologicky je třeba při uvažování o screeningu zachovávat následující pravidla a postupy: Základním předpokladem pro úspěšný a efektivní screening je: - aby zajistil včasný záchyt onemocnění ještě před manifestací klinických příznaků - aby byla k dispozici efektivní léčba v časném stádiu onemocnění - aby při použití této léčby byla zajištěna příznivější prognóza onemocnění 710 Screening je definován jako vyšetření zatím asympto-matických osob a sám o sobě nediagnostikuje nemoc. Proto je nutné následné dovyšetření pomocí dalších a přesnějších laboratorních nebo klinických testů. Pro zavedení screeningového vyšetření jsou potřebné následující předpoklady: • vhodné onemocnění • vhodný test • vyhodnocení screeningového programu z hlediska jeho proveditelnosti a jeho očekávané efektivity Onemocnění vhodná pro screening jsou: • onemocnění závažná - u kterých časná terapie zlepšuje prognózu - snížení mortality a morbidity • onemocnění častá, kde screening může dosáhnout vysoké výtěžnosti Důležitým ukazatelem je prevalence preklinických stádií onemocnění, která ovlivňuje ekonomickou efektivitu screeningového vyšetření. Je-li vyšší prevalence těchto stádií, pak můžeme očekávat i větší zastoupení nemocných ve výsledku screeningového vyšetření. Prevalenci je možné zvýšit zaměřením screeningu na rizikovou populaci. Screeningový test by mě být: • levný • nenáročný na provedení • představující minimální zátěž pro pacienta • jeho výsledky by měly být validní, spolehlivé a opakovatelné. Vyhodnocení screeningového testu by mělo být provedeno před jeho použitím a to z hlediska jeho: • proveditelnosti • účinnosti. Proveditelnost screeningového programu zahrnuje tyto aspekty: • akceptace vyšetřovanou populací (PAP ve srovnání s rek-toskopií) • ekonomická efektivita (screeningové testy, následná diagnostika, sledování, terapie) • následná diagnostika a terapie positivních osob • výtěžnost výpočtu objevených případů (PV+, PV-) Efektivita screeningového programu je hodnocena podle: • snížení mortality • snížení morbidity Faktory ovlivňující efektivitu screeningu: • použití dobrovolníků • lead time • lengh time Dobrovolníci mohou mít lepší zdravotní stav oproti běžné populaci a častěji dodržují doporučení lékaře Mohou ale mít někdy horší zdravotní stavv důsledku positivní rodinné anamnézy, osobní anamnézy a jejich životního stylu. Proto je těžké odhadnout směr zkreslení výsledků screeningu a ještě těžší je jejich kvantifikace. Lead time je časové období mezi diagnózou provedenou pomocí screeningu a manifestací klinických příznaků. Pro eliminaci působení bias v důsledku tohoto jevu je možno provádět odpočet tohoto období (pokud je známo) při hodnocení na příklad přežívání a nebo hodnotit věkově specifickou úmrtnost. Length time (bias) znamená větší zastoupení osob s delší preklinickou fází onemocnění a tím i s lepší prognózou. Eliminace jeho působení je možná prostřenictvím opakovaných screeningových vyšetření. Přínos screeningového programu není vždy samozřejmostí a je nutno zvážit rizika a náklady oproti přínosu (ještě před širokým zavedením do praxe). 711 42 LECENI 42.1 INFORMACE O TERAPEUTICKÝCH MOŽNOSTECH Jestliže najdeme užitečné důkazy o terapeutických možnostech, musíme se rozhodnout, kde začít proces kritického hodnocení. Můžeme začít s hodnocením validity, protože jestliže informace není validní, pak nikoho nezajímá jestli je efekt účinku velký. Můžeme ale také začít s hodnocením klinického významu, protože jestliže důkaz není dostatečně klinicky významný, pak nikoho nezajímá ani jeho validita. V podstatě můžeme začít s jakoukoliv otázkou, ale měli bychom pokračovat pouze dostaneme-li příznivou odpověď. 42.1.1 VALIDITA Abychom posoudili zda jsou výsledky validní, musíme se ptát jestli byla provedena a utajena (tj.že posuzovatelé zdravotního stavu i osoby ve studii nevěděli ve které skupině jsou) randomizace! Není-li k dispozici žádná randomizovaná studie o daném problému, musíme zjišťovat: • zda byl výsledek léčby tak velký a zřejmý, že nepřipouští falešnou pozitivitu (vzácné!) a bylo by neetické randomizovat • zda výsledek léčby byl negativní nebo nebezpečný, tuto situaci můžeme také akceptovat, protože falešně negativní výsledek u nerandomizovaných studií je méně častý než falešně pozitivní (protože léčba je obvykle vysazena u pacientů s nejhorší prognózou a ti ostatní když správně užívají mají lepší prognózu, i když užívají neúčinný lék nebo placebo). V takových situacích je také možno zvážit možnost N=l klinického pokusu tj. podání léku i placeba jednomu pacientovi v náhodném pořadí v krátkém odstupu (1-2 týdny). Dále musíme zjišťovat zda bylo sledování úplné a dostatečně dlouhé? Pokud byly velké ztráty ze sledování na příklad pro to, že pacient má nežádoucí reakce a opustí studii , dojde při vyhodnocení studie k nadhodnocení účinnosti. Musíme se také ptát, jaké jsou přijatelné ztráty ze sledování? Obvykle pokud se ztráty pohybují do 20%, tak se považují za akceptovatelné. Při vyhodnocení však můžeme se ztracenými pacienty počítat a všechny ztracené pacienty hodnotit jako t.zv.„worst case"(tj .kompletně obrácený výsledek než většina co zůstala) a pokud při vyhodnocení je podpořen původní závěr, tak ani ztráty ze sledování neovlivňují výsledek studie). Také zjišťujeme jaká byla délka sledování a zda byla přiměřená povaze problému. Současně je třeba sledovat zda byli všichni pacienti analyzováni ve skupinách podle randomizace? Protože všichni co neužívali zkoušenou léčbu nebo dostali jinou léčbu by měli být analyzováni v původní skupině podle principu „intention to treat anály sis" (podle původního léčebného záměru). Další otázkou je zda byli pacienti i lékaři zaslepeni pokud jde o léčbu? (také aby pacienti s placebem nedostali jinou léčbu). 712 Pokud jde o chirurgické intervence, kde samozřejmě zaslepení operujícího (ošetřujícího) lékaře není možné, může se na vyhodnocení podílet jiný zaslepený klinik, který hodnotí nálezy. V rámci validity je také třeba sledovat, zda byly skupiny stejně léčeny kromě experimentální léčby (tj. případně jinými léky na jiné nemoci) ? A zda byly skupiny stejné na počátku studie? Zejména pokud jde o prognostické znaky - jestliže ne pak zda byla provedena úprava (přizpůsobení-adjustment). 42.1.2 VÝZNAMNOST Posoudit významnost znamená najít klinické vyjádření účinku a pak porovnat s výsledky jiné léčby. Nejprve posuzujeme jaký byl rozsah účinku léčby? Základní údaje o příkladu, který je použit pro vysvětlení jsou obsaženy na tabulce 4: Klinické ukazatele efektivity léčby Tab. 4 CER EER RRR ARR NNT Studie Lancet, 1998 50% 39% 22% 11% 9 Hypotetická situace 0.00050% 0.00039% 22%!!! 0.00011% 909090 „Event rate" = progrese neschopnosti u roztroušené sklerózy za 33 měsíců RRR = (CER-EER)/CER = = (50%-39%)/50% = 22% = (0.00050%-0.00039%)/0.00050% = 22%!!! ARR = (CER-EER) = 50%-39% =11% = 0.00050%-0.00039% = 0.00011% NNT = 1/ARR= 1/11% = 9 = 1/0.00011% = 909090 Ukazatele, používané při hodnocení léčebného účinku jsou: • „control event rate" CER - frekvence sledovaného následku (v%) v kontrolní skupině • „experimental event rate" EER - frekvence sledovaného následku (v%) v léčené skupině Rozdíl mezi CER a EER může být statisticky významný, ale důležité je i vyjádření klinického dopadu - což bylo až donedávna vyjadřováno pomocí RRR -„relative risk redu-ction" RRR = (CER-EER)/CER Podobně můžeme účinek vyjádřit obráceně jako: • „relative benefit increase" RBI = (CER-EER)/CER • „relative risk increase" RRI stejným výpočtem - pokud zvyšuje pravděpodobnost špatné události • nevýhodou RRR je, že nezohledňuje CER (tedy bazálni riziko) a proto nerozlišuje velké účinky léčby od malých • „absolute risk reduction" ARR = CER - EER respektuje baseline risk a je smysluplnější • jestliže léčba má dobrý efekt. Pak stejným výpočtem stanovíme „absolute benefit increse" ABI a má-li špatný efekt „absolute risk increase" ARI Absolutní redukce rizika ARR je sice dobrá, ale její hodnoty se někdy hůře pamatují (zejména jsou-li menší než 1.0), na druhé straně její inverzní hodnota je celé číslo a vyjadřuje kolik pacientů potřebujeme léčit zkoušenou léčbou abychom zabránili jednomu špatnému následku - „number needed to treat" NNT = 1/ARR Příklad: naší cílovou poruchou je diastolická hypertenze, intervencí jsou antihypertenzivní léky a chceme předejít úmrtí, cerebrovaskulární příhodě nebo infarktu myokardu. Je-li TK 115-129 mmHg, pak je CER 13%, EER 1.4%, délka sledování 1.5 roku a NNT 3 Je-li TK 90 -109 mmHg, pak je CER 5.5%, EER 4.7%, délka sledování 5.5 roku a NNT 128. Podobně nežádoucí účinky léčby se mohou popsat analogickým způsobem jako: - „number needed to harm" NNH = 1/ARI Abychom rozuměli NNT musíme zvážit další 2 aspekty: - čas sledování - chceme-li porovnat NNT pro různé doby sledování musíme udělat úpravu -adjustment alespoň pro jednu z nich NNThypothetical = NNTobserved x (observed time/ hy-pothetical time) Na příklad u hypertenze podle výše uvedeného příkladu: NNT1.5 = 128 x (5.5/1.5) = 470 to znamená, že potřebujeme léšit 470 lehkých hypertenzí ale jen 3 těžké po dobu 1.5 roku abychom zabránili 1 vážnému následku. - přesnost odhadu účinku léčby - NNT odhadují skutečný účinek a je třeba specifikovat limity, kde leží skutečný účinek = 95% Cl NNT a NNH sami o sobě nezachycují pacientovu individuální pravděpodobnost prospěchu nebo poškození. 42.1.3 POUŽITELNOST Když se zjistilo, že nalezený důkaz je jak validní takvý-znamný, je třeba posoudit, zda je také použitelný pro našeho pacienta. Při tom je třeba spojit důkaz s klinickou zkušeností a odbornou schopností. 1. nejprve se musíme zeptat je-li náš pacient tak odlišný od pacientů ve studii, že nemůžeme výsledky aplikovat? Odlišnost vyhodnotíme tak, že: • posoudíme, zda náš pacient splňuje kritéria pro zařazení do studie, ze které pochází důkaz (u kritérií, která nesplňuje musíme posoudit jejich užitečnost) • většina rozdílů kvantitativních! • věk, riziko vzniku následku, odpověď na léčbu • posoudíme, zda sociodemografické a patobiologické rysy našeho pacienta jsou odlišné (obvykle ne!) 2. dále se ptáme zda je léčba proveditelná v našich podmínkách? • zda je léčba ekonomicky přijatelná pro pacienta nebo zdravotnický systém 3. sledujeme jaký je potenciální prospěch léčby a rizika pro našeho pacienta? • pokud nebude léčen jaký je jeho individuální CER neboli „patient's expected event rate" PEER k tomuto odhadu použijeme RRR (pro účinnost léčby) a RRI (pro nežádoucí reakce) a určíme odpovídající NNT a NNH u našeho specifického pacienta (rychlejší je použít NNT a NNH ze studie). Delší postup via PEER - 4 možné postupy • CER pro našeho pacienta určíme podle celkového CER ze studie (pokud náš pacient představuje průměrného pacienta ze studie) • pokud je ve studii podskupina pacientů podobná našemu pacientovi určíme CER pro našeho pacienta podle této podskupiny (nebo můžeme rovnou použít ARR podskupiny a vytvořit NNT pro našeho pacienta) • jestliže studie obsahuje „clinical prediction guide" (ověřeno v jiné nezávislé studii), použijeme PEER z této studie • vyhledáme jinou studii popisující podobné pacienty - všechny 4 metody nakonec určí PEER pro našeho pacienta tj. co se stane když dostane kontrolní nebo srovnávací intervenci - PEER potom konvertujeme na NNT nebo NNH pro pacienty jako je náš, pomocí odpovídajícího RRR a RRI NNT = 1 / (PEER x RRR) K tomuto výpočtu existuje nomogram, publikovaný v práci Sacketta a spolupracovníků Sackett). Kratší postup s NNT - je jednodušší a rychlejší a proto se nejčastěji používá u lůžka pacienta (jeho délka je odhadována na 7minut) - specifikujeme odhadem riziko vzniku události u našeho pacienta vzhledem k průměrnému pacientovi v kontrolní skupině a vyjádříme desetinnou frakcí „f Výpočet odhadu pro našeho pacienta je pak NNT / ft , který je ukázán na následujícím příkladu: jestliže myslíme, že náš pacient (pokud by nebyl vůbec léčen) má dvojnásobné riziko vzniku následku než pacient v kontrolní skupině, pak f = 2 4. dále sledujeme jaké jsou pacientovy hodnoty a očekávání pokud se týká následku, kterému chceme zabránit, i léčby kterou mu nabízíme? • zjišťujeme pacientovi preference - i pomocí škály Škála pacientových preferencí Obr. 3 0,5 1,0 smrt plné zdraví Na obrázku 3 na jednom konci „0" znamená smrt a na druhém konci „1.0" znamená plné zdraví. Pak se ptáme pacienta, aby označil na škále hodnotu pro cílovou poruchu, které chceme léčbou zabránit (v uvedeném příkladě označil pacient progresi roztroušené sklerózy hodnotou 0.05, tedy téměř tak špatnou jako kdyby zemřel). Současně se ho ptáme, aby označil na škále hodnotu pro nežádoucí reakce při léčbě (opět v uvedeném příkladě označil pacient reakce jako velmi mírné hodnotou 0.95). Porovnáním těchto dvou posouzení (0.95/0.05 = 19) dostaneme hodnotu, která ukazuje kolikrát (v daném příkladě 19 krát) je cílová porucha (progrese roztroušené sklerózy) horší než nežádoucí reakce při léčbě. Pravděpodobnost pomoci a poškození LHH (likelihood of help or harm)- spojujeme pacientovy hodnoty s pravděpodobností jejich objevení. Příklad výpočtu LHH (s použitím údajů na tabulce 5): Riziko a prospěch léčení Tab. 5 Následek CER EER RRR ARR NNT Progrese neschopnosti 50% nebo 1/2 39% nebo 1/2.5 22% 11% 1/11 % = 9 Následek CER EER RRR ARR NNT Chřipkové onemocnění nebo lokální reakce 37% nebo 1/2.7 64% nebo 1/1.6 73% 27% 1/27% = 4 713 LHH = (1/NNT): (1/NNH) = (1/9): (1/4) = 0.11 : 0.25 Tedy 2 : 1 v neprospěch interferonu. Našemu pacientovi pak bude řečeno: „ jestliže máte podobné potíže jako pacienti ve studii pak je pravděpodobné, že léčba interferonem vás spiše dvakrát poškodí než vám prospěje". Jestliže ale vezmeme v úvahu, že náš pacient má trojnásobné riziko progrese nemoci (f =3), vyjádřené desetinnou frakcí, a také jeho hodnocení, že progrese jeho nemoci byla 19 x horší než nežádoucí účinky léčby {severity factor „s"), a riziko vyniku nežádoucích účinků bude stejné jako u pacientů ve studii (f = 1) pak nový a přesnější výpočet LHH je následující: LHH = ((1/NNT) x ft x s): ((1/NNH) x fh) = a : b = ((1/9) x 3 x 19): ((1/4) x 1) = 6.3 : 0.25 = 25 : 1 Takže v konečné fázi, s přihlédnutím k pacientovým preferencím a jeho individuálnímu riziku vychází u něho léčba interferonem 25krát prospěšnější než poškozující!!! Nyní je možno se podívat na CAT s příslušnou tématikou, který je uveden na konci této kapitoly. 42.1.4 COMPLIANCE Pacient akceptoval příznivé LHH a začal být léčen ale vše co jsme my i pacient investovali do diagnózy, kritického zhodnocení a individualizace přínosu a rizika léčby může být k ničemu, jestliže pacient nebude dodržovat režim léčby, diety, cvičení apod. • compliance je jedním z hlavních problémů a je v průměru asi 50% se značnou variabilitou u různých pacientů • příčiny non-compliance obvykle nejsou ty co myslíme ... věk, pohlaví, inteligence, vzdělání (ty obvykle nejsou významné) ale dlouhá čekací doba, vysoká cena, dlouhé trvání a komplexnost léčby (tyto faktory obvykle vedou ke ztrátě compliance). Musíme prověřit compliance vždy, když léčba nemá očekávaný účinek (především než zvýšíme dávku nebo přidáme další lék). Musíme pacienta pravidelně sledovat, ptát se zda užívá, případně používat některé objektivní metody průkazu compliance (stanovení hladiny léku nebo metabolitů v tělesných tekutinách). Cílem je pomoci pacientovi zlepšit compliance • krátkodobě ...přesné instrukce, písemné informace • dlouhodobě .. .komplex kombinace větší pozornosti a dohledu. 42.2 „DŮKAZY" A OBCHODNÍ ZÁJMY FARMACEUTICKÝCH FIREM Nejúčinnější způsob, jak u kliniků dosahovat změn v pre-skripčních zvyklostech , je cestou zástupců farmaceutických firem (ve Spojeném království se jim říká „drug reps" a v Severní Americe „detailers"), kteří cestují pořád dokola s aktovkou plnou „důkazů" na podporu svého zboží. Hnutí medicíny založené na důkazu se v posledních letech od farmaceutického průmyslu hodně naučilo tomu, jak měnit chování lékařů, a nyní používá tytéž promyšlené techniky přesvědčování jednotlivých zdravotnických pracovníků, známé pod anglickým názvem „academie detailing". Než svolíte ke schůzce s farmaceutickým reprezentantem, připomeňte si některá základní pravidla metodologie použí- vané ve výzkumu. Otázkám prospěchu z léčby by se v ideálním případě měly věnovat randomizované kontrolované studie. Ale předběžné otázky ohledně farmakokinetiky (tj. jak se lék chová během své cesty do místa účinku), a zvláště ty, které se týkají biologické dostupnosti, vyžadují přímý pokus s dávkováním léku na zdravých (a, je-li to etické a proveditelné, i na nemocných) dobrovolnících. Běžné (a naštěstí bezvýznamné) nežádoucí lékové reakce mohou být zachyceny, a jejich incidence kvantifikována, v RCT provedených za účelem prokázání účinnosti léku. Ale vzácné (a obvykle vážnější) nežádoucí lékové reakce vyžadují jak farmakovigilanční studie (prospektivní shromažďování údajů o pacientech dostávajících nově registrovaný lék), tak studie případů a kontrol pro stanovení souvislosti s podávaným lekem. V ideálním případě by ke stanovení příčinného vztahu měly být provedeny individuální expoziční testy (kde pacient, který již měl reakci, o níž se myslí, že byla způsobena daným lékem, dostane tento lék znovu za pečlivě kontrolovaných podmínek). Zástupci farmaceutických firem mají dnes již většinou solidní odbornou úroveň ( prodej léků se stal více propracovanou vědou), ale pořád se u nich často zjistí základní neznalost epidemiologických principů a designu klinických studií, zejména když se jim to hodí pro propagaci jejich produktu. Například často předkládají výsledky nekontrolovaných studií s vyjádřením rozdílů před a po měření určitého parametru . Dr. Andrew Herxheimer, který po mnoho let redigoval Drug and Therapeutics Bulletin, udělal přehled „odkazů" citovaných v reklamách na farmaceutické výrobky v předních lékařských časopisech Spojeného království. Zjistil, že velký podíl takových odkazů cituje „údaje z pořadačů" a ještě více jich odkazuje na publikace, které byly farmaceutickým průmyslem přímo napsány, redigovány i publikovány. Někdy (nicméně není to tak vždy) se ukáže, že důkazy z takových zdrojů mají nižší vědeckou kvalitu než ty, které se objevují v nezávislých recenzovaných časopisech. Je zřejmé, že pokud někdo pracuje pro farmaceutickou společnost a učiní větší vědecký objev, pravděpodobně poskytne své nálezy takovým časopisům, jako jsou Lancet nebo New England Journal of Medicíne, ještě před jejich publikováním na firemní půdě. Jinými slovy, není třeba „vyhazovat" pojednání o lékových studiích kvůli tomu, kde byla publikována, ale je nutné se hodně zblízka podívat na metody a na statistickou analýzu takových studií. 42.2.1 JAK SE ROZHODOVAT OHLEDNĚ LÉČBY Sackett a kolegové ve své knize Clinical epidemiology - a basic science for clinical medicíne tvrdí, že lékař, předtím než naordinuje pacientovi nějaký lék, by měl: • stanovit u tohoto pacienta hlavní smysl léčby (vyléčení, prevence návratu nemoci, omezení funkčního handicapu, prevence pozdních komplikací, psychická úleva, zmírnění nemoci, symptomatická úleva atd.), • vybrat nejvhodnější léčbu s využitím všech dostupných důkazů (to zahrnuje i odpověď na otázku, zdali vůbec pacient potřebuje nějaký lék užívat), • specifikovat léčebný cíl (jak poznat, kdy léčbu ukončit, změnit její intenzitu nebo přejít na nějakou jinou léčbu?). Například při léčbě vysokého krevního tlaku může lékař stanovit, že: • hlavním smyslem léčby je předcházet poškození cílových orgánů, jako jsou mozek, oči, srdce, ledviny atd. (a tak předcházet smrti), 714 • volba specifické léčby spočívá ve výběru mezi různými druhy antihypertenzních léků vybraných na základě ran-domizovaných, placebem kontrolovaných a srovnávacích studií, a rovněž tak mezi nefarmakologickými léčebnými možnostmi, jako je omezení soli, • léčebným cílem může být diastolický krevní tlak ve fázi 5 (na pravé paži vsedě) menší než 90 mmHg nebo tak blízký této hodnotě, jak to jen bude tolerovatelné vzhledem k vedlejším účinkům léčby. Pokud se nepostupuje podle těchto tří kroků (jak tomu často bývá například v péči o terminálne nemocné), může nastat v terapii chaos. V rámci své skryté kritiky náhradních cílových ukazatelů Sackett a jeho tým připomínají, že volba specifické léčby by měla být určována důkazy o tom, co skutečné funguje a ne co vypadá, že funguje, nebo by melo fungovat. „Dnešní léčba," varují na straně 188, „pokud je odvozena od biologických skutečností nebo nekontrolovaných klinických zkušeností, může být zítra jako špatný vtip." Náhradní cílové ukazatele Definice náhradního (nebo též zástupného) cílového ukazatele: „je to proměnná, která je poměrně snadno měřitelná a která předpovídá vzácný nebo vzdálený výsledek buď toxického podnětu (například škodliviny v prostředí) nebo léčebného zásahu (například léku, chirurgického výkonu, poskytnuté rady), ale která sama o sobě není přímým měřítkem ani poškození ani klinického prospěchu". Rostoucí záliba v náhradních cílových ukazatelích v lékařském výzkumu odráží dvě důležité stránky jejich použití. • Mohou značně snížit velikost vzorku, trvání studie, a tak snížit vynaložené náklady . • Mohou umožnit, aby byla léčba zhodnocena v situacích, kdy použití primárních ukazatelů by bylo příliš invazívní nebo neetické. Při vyhodnocování farmaceutických výrobků běžně používané náhradní cílové ukazatele zahrnují: • farmakokinetická měření (například křivky časového průběhu koncentrací léku nebo jeho aktivního metabolitu v krevním řečišti), • in vitro (tj. laboratorní) parametry jako je střední inhibiční koncentrace (MIC) antimikrobiální látky změřená na bakteriální kultuře na agaru, • makroskopický vzhled tkání (například žaludeční eroze viděné při endoskopii), • změna v hladinách (údajných) „biologických ukazatelů nemoci" (například mikroalbuminurie u diabetické nefro-patie), • radiologický vzhled (například stín na skiagramu hrudníku). Náhradní cílové ukazatele mají řadu nevýhod: - změna hodnoty náhradního cílového ukazatele sama o sobě neodpovídá na základní předběžnou otázku „Jaký je smysl nebo cíl léčby u tohoto pacienta?" a „Jaká je, podle platných a spolehlivých výzkumných studií, nejlepší dostupná léčba tohoto stavu?" - náhradní cílový ukazatel nemusí těsně odrážet léčebný cíl; jinými slovy, nemusí být platný či spolehlivý - použití náhradního cílového ukazatele má stejná omezení jako použití jakéhokoli jiného jednotlivého parametru úspěchu nebo selhání léčby - přehlíží všechny další parametry! Nadměrné spoléhání se na jediný náhradní cílový ukazatel jako na měřítko léčebného úspěchu obvykle odráží úzký klinický rozhled a přehnanou důvěřivost - náhradní cílové ukazatele často vznikají na zvířecích modelech nemoci, jelikož změny hodnoty specifické proměnné lze měřit za kontrolovaných podmínek u dobře definované populace. Avšak vyvozování závěrů podle těchto nálezů u lidských onemocnění je spojeno s rizikem, že nebudou platné protože: • Ve studiích na zvířatech má studovaná populace zcela jednotné biologické vlastnosti a může být geneticky in-brední. • Studovaná tkáň i nemoc se mohou lišit v důležitých rysech (například ve vnímavosti vůči patogenu, v rychlosti buněčného dělení) od obdobného stavu u lidských subjektů. • Zvířata se chovají v kontrolovaném prostředí, což minimalizuje vliv proměnných způsobu života (například stravy, cvičení, stresu) a průvodní medikace. • Podávání vysokých dávek chemických látek experimentálním zvířatům může pozměnit obvyklé metabolické dráhy a tak dát zavádějící výsledky. Živočišné druhy, které jsou nejvhodnější k takovým studiím , se liší od lidi vzhledem k různých chemickým látkám. Ideální vlastnosti náhradního cílového ukazatele jsou ukázány v následujícím přehledu: • Náhradní cílový ukazatel by měl být spolehlivý, reprodukovateľný, klinicky dostupný, snadno kvantifikovateľný, cenově dostupný a měl by vykazovat efekt „dávka-úči-nek" (to znamená, čím vyšší hladina náhradního cílového ukazatele, tím větší pravděpodobnost nemoci). • Měl by být skutečným prediktorem (tj. parametrem s predpovední hodnotou) nemoci (nebo rizika vzniku nemoci) a ne pouze vyjadřovat expozici nějaké spoluproměnné. Vztah mezi náhradním cílovým ukazatelem a nemocí by měl mít biologicky možné a přijatelné vysvětlení. • Měl by být senzitivní - to znamená, že „pozitivní" výsledek náhradního cílového ukazatele by měl zachytit všechny pacienty nebo většinu pacientů se zvýšeným rizikem nepříznivého stavu. • Měl by být specifický - to znamená, že „negativní" výsledek by měl vyloučit všechny pacienty nebo většinu pacientů bez zvýšeného rizika nepříznivého stavu. • Měl by existovat přesný hraniční bod mezi normálními a abnormálními hodnotami. • Měl by mít přijatelnou pozitivní prediktivní hodnotu - to je, že „pozitivní" výsledek by měl vždy nebo obvykle znamenat, že takový pacient má zvýšené riziko nepříznivého stavu • Měl by mít přijatelnou negativní prediktivní hodnotu - to je, že „negativní" výsledek by měl vždy nebo obvykle znamenat, že takový pacient nemá zvýšené riziko nepříznivého stavu • Měl by podléhat řízení jakosti. • Změny v hodnotě náhradního cílového ukazatele by měly rychle a správně odrážet odpověď na léčbu - zvláště jeho hladina by se měla normalizovat při remisi nebo vyléčení. Dobrým příkladem parametru, který splňuje většinu z těchto kritérií, ne-li všechna je mikroalbuminurie u diabetické nefropatie. Pokud farmaceutický reprezentant, který se vás pokouší přesvědčit o hodnotě nabízeného léku, není schopen zdůvodnit oprávněnost použitých cílových ukazatelů, měli byste jej vyzvat, aby poskytl ještě nějaký další důkaz. Jedním důležitým příkladem neplatného použití náhradního cílového ukazatele je počet CD4 buněk při sledová- 715 ní progrese v AIDS u HIV pozitivních subjektů. Studie CONCORDE byla RCT porovnávající časné a pozdní zahájení léčby zidovudinem u pacientů, kteří byli HIV pozitivní, ale klinicky asymptomatičtí. Předchozí studie ukázaly, že časné zahájení léčby vede k pomalejšímu poklesu počtu CD4 buněk (proměnná, u které bylo ukázáno, že klesá s progresí AIDS), a předpokládalo se, že vyšší počet CD4 buněk bude odrážet zlepšení šancí na přežití. Avšak studie CONCORDE ukázala, že zatímco počet CD4 buněk klesá pomaleji v léčebné skupině, tříleté přežití bylo v obou skupinách stejné. Tato zkušenost potvrdila varování, vyslovené již dříve autory, kteří měli podezření na neplatnost tohoto cílového ukazatele. Následný výzkum na tomto poli se pokusil určit náhradní cílový ukazatel, který je v korelaci se skutečným léčebným prospěchem, tzn. zpomalením progrese asymptomatické HIV infekce v klinický AIDS a dobou přežití od vzniku AIDS. Nedávný přehled shrnuje celý tento příběh a uzavírá, že kombinace několika parametrů (včetně procentuálního zastoupení CD4 C29 buněk, stupeň únavy, věk a hladinu hemoglobinu) předpovídá progresi mnohem lépe než počet CD4 buněk. Existuje celá řada dalších příkladů o používání nesprávných cílových ukazatelů jako na příklad komorové předčasné stahy k předpovědi smrti na vážnou poruchu srdečního rytmu, hladina antibiotik v krvi k předpovědi klinického vyléčení infekce, plaky na MRI (magnetická resonance) k vyjádření progrese roztroušené sklerózy a měření prosta-tického specifického antigénu (PSA) ke zhodnocení odpovědi na léčbu u karcinomu prostaty. Klinici jsou v rostoucí míře skeptičtí vůči argumentům ve prospěch používaní nových léků nebo starých léků v nových indikacích, které není zdůvodněno přímými důkazy o účinnosti. Předtím, než je možno náhradní cílové ukazatele použít při propagaci farmaceutických výrobků, musí průmysl zdůvodnit užitečnost těchto parametrů ukázáním přijatelného a pevného spojení mezi cílovým ukazatelem a vývojem nebo progresí nemoci. Nebylo by správné předpokládat, že farmaceutický průmysl vyvíjí náhradní cílové ukazatele s úmyslem klamat registrační autority a zdravotnické pracovníky. Důvody pro náhradní cílové ukazatele jsou především etické i ekonomické. Avšak průmysl má silný zájem na přehánění svých argumentů o síle těchto cílových ukazatelů. Jak získat důkazy od farmaceutického reprezentanta Každému lékaři, který se někdy setkal s reprezentantem prodávajícím nesteroidní antiflogistikum, je znám příklad žaludeční eroze. Otázka, kterou je třeba mu položit, není „Jaká je incidence žaludečních erozí u vašeho léku?", ale „Jaká je incidence možného život ohrožujícího krvácení ze žaludku?". Osvědčené principy setkání s farmaceutickým reprezentantem, včetně otázek, kteří by mu měly být položeny, jsou reprodukované z článku v Drug and Therapeutics Bulletin a z dalších zdrojů: 1. Mějte schůzku s reprezentanty vždy předem domluvenu. Vyberte si k návštěvě jen ty, jejichž výrobek vás zajímá, a omezte rozhovor na tento produkt. 2. Ujměte se vedení rozhovoru. Neposlouchejte naučené prodejní fráze, ale přímo se ptejte na žádoucí informace. 3. Požadujte nezávislé publikované důkazy z významných, odborníky recenzovaných časopisů. 4. Nekoukejte se na propagační brožury, které často obsahují nepublikovaný materiál, zavádějící grafy a vybrané citáty. 5. Nevšímejte si „důkazů" v podobě „vyprávění příběhu", jako že nějaký význačný lékař onen výrobek předepisuje. 716 6. Ptejte se po důkazech ve čtyřech specifických oblastech. • Bezpečnost - tj. pravděpodobnost dlouhodobých nebo vážných vedlejších účinků způsobených lékem (pamatujte, že vzácné, ale závažné nežádoucí reakce mohou být špatně dokumentovány). • Snášenlivost, která se nejlépe zjistí porovnáním sloučených procentuálních podílů pacientů, kteří museli ukončit léčbu, a to mezi daným lékem a jeho nejvý-znamnějším konkurentem. • Účinnost, jejímž nejdůležitějším rozměrem je, jak výrobek vychází ve srovnání s lékem oblíbeným u vás v současné době. • Cena, která by měla brát v úvahu nepřímé i přímé náklady. 7. Posuzujte důkazy přísně a věnujte pozornost statistické síle (velikost vzorku) a metodologické kvalitě klinických studií a použití náhradních cílových ukazatelů. Nepřijímejte teoretické argumenty ve prospěch daného léku (například „delší poločas") bez přímého důkazu, že se to přenáší do klinického prospěchu. 8. Nepřijímejte to, že je výrobek nový, jako argument pro to, abyste na něj přešli. Často jsou dobré vědecké argumenty pro pravý opak. 9. Odmítněte vyzkoušet výrobek přijetím startovacího baleni nebo účastí na malé, nekontrolované „výzkumné" studii. 10. Zaznamenejte si obsah rozhovoru a vraťte se k těmto poznámkám tehdy, bude-li reprezentant žádat o další návštěvu. 42.2.2 CAT - ROZTROUŠENÁ SKLERÓZA ...INTERFERON ODDALUJE PROGRESI ONEMOCNĚNÍ Klinický řádek: roztroušená skleróza...interferon beta-lb redukuje progresi sekundární progresivní RS Citace: European study group on interferon beta 1 b in secon-dary progresive MS. Placebo-controlled multicentre rando-mized trial of interferon beta 1 b in treatment of secondary progressive multiple sclerosis. Lancet 1998; 352; 1491-7 Klinická otázka (složená ze 3 částí): Oddálí interferon progresi neschopnosti u pacientů se sekundární progresivní RS? Vyhledávací termíny: „interferon" a „roztroušená skleróza" v MEDLINE Studie: Dvojitě zaslepený randomizovaný kontrolovaný pokus s analýzou „intention to treat" Pacienti ve studii - klinicky nebo laboratorně potvrzené případy RS se sekundární progresí (období zhoršení, nezávislých relapsů, trvající nejméně 6 měsíců, následované obdobím návratné-remitující RS), ve věku 18-55 let se základním Kurtzke Expanded Disability skoré (EDSS) 3-6,5 a s nejméně 2 relapsy nebo zvýšením EDSS o 1 bod v předchozích 2 letech. Pacienti byli vyloučeni ze studie, jestliže v nedávné době užívali imunosupresiva nebo imunomodulancia. Steroidy mohly být užívány při relapsu. Kontrolní skupina: (n=358, 358 analyzovaných) standardní léčba a injekce placeba SQ Experimentální skupina: (n=360, 360 analyzovaných) 4mil. IU interferon SQ ob den po 2 týdny a pak 8 mil IU ob den Důkaz: Následek Doba do vzniku CER EER RRR ARR NNT Progrese neschopnosti 33 měsíců 0.498 0.389 22% 0.109 9 95 % Cl 7 - 36 % 0.037-0.181 6-27 Pacienti na kolečkové židli 33 měsíců 0.246 0.167 32% 0.079 13 95% Cl 8 - 56 % 0.020-0.138 7-50 Event rate = progrese neschopnosti po 33 měsících Control event rate (placebo) CER Exper. event rate (interferon) EER Relative risk reduction RRR Absolute risk reduction ARR Number needed to treat NNT Komentář 1. Hodnocení EDDS bylo prováděno různými lékaři 2. Lékaři byli školeni v používání EDDS 3. Interferon měl vedlejší účinky jako lokální reakce v místě vpichu s NNH 4 4. Více pacientů ve skupině placebo dostávalo steroidy 5. Toto je první studie, která prokázala účinnost léčby interferonem u pacientů se sekundární progresivní roztroušenou sklerózou. Protože některé další studie ještě nejsou ukončeny, je třeba tento CAT aktualizovat každých 6 měsíců. Hodnotil: SE Straus Aktualizovat: v roce 20004 717 43 RIZIKO POŠKOZENI 43.1 ZHODNOCENÍ RIZIKA POŠKOZENÍ Často se musíme vyjádřit zda intervence nebo agens zevního prostředí může poškodit našeho pacienta, tedy zda jsou v eti-ologickém vztahu k určitému následku. • abychom odpověděli správně na otázku týkající se poškození, musíme zhodnotit důkaz o kauzalitě a to jeho validitu, význam a přímý vztah k našemu pacientovi(pou-žitelnost) • validita důkazu je klíčová pro vyloučení falešně pozitivních nebo falešně negativních závěrů, že agens (lék atd.) je příčinou nežádoucích (poškozujících) reakcí • často ani kliničtí farmakologové nerozhodnou zda nežádoucí reakce je skutečně v důsledku léčby 43.1.1 VALIDITA Odpovídá na otázku zda jsou výsledky studie o poškození/ etiologii validní? • validita je ohrožena různě u různých typů studií • systematické přehledy relevantních studií jsou nejvyšším typem důkazu - proto mají prioritu při pátrání po důkazu • individuální randomizované studie jsou obvykle rozsahem malé , aby mohly s přesností detegovat vzácnou nežádoucí reakci • validitu můžeme tedy nejlépe posoudit pomocí systematických přehledů, které zahrnují většinou dostatečný počet subjektů pro zhodnocení frekvence případných nežádoucích - poškozujících reakcí Při hodnocení nalezené publikace se zaměřujeme na následující otázky: 1. hodnotíme zda byly použity skupiny stejné s výjimkou expozice léčbě nebo jiné příčině? Příkladem může být systematický přehled nebo randomi-zovand studie kde pacienti s hypertenzí byli rozděleni do skupiny léčené antagonisty Ca nebo jinou léčbou (placebem) Otázka: má pacient, který užívá antagonisty calcia vyšší riziko vzniku karcinomu? Studie zda užívání antagonistů kalcia způsobuje rakovinu Tab. 6 (Lancet 1996; 348: 493-7) nežádoucí následek léčby nádor přítomný nepřítomný expozice léčbě (antagonisté kalcia) ano (RCT nebo kohortová) a b a + b ne (RCT nebo kohortová) c d c + d Celkem a + c b + d Nalezená studie shromáždila osoby ve věku 71 let a starší ze tří regionů USA, které byly nebo nebyly léčeny antagonisty calcia. Tato kohorta byla heterogenní protože řada osob měla také diabetes, kardiovaskulární nemoci a časté hospitalizace. V tomto příkladu není však design randomizované studie pro tyto účely vhodný (důvody velikosti, trvání i etické). Proto první vhodnou alternativou je kohortová studie . V literatuře byla nalezena kohortová studie na toto téma (Lancet 1996; 348: 493-7). Protože však léčba je účelově aplikována pacientům s nemocí (hypertenzí) mohou se v ko-hortové - nerandomizované studii exponovaní pacienti lišit od neexponovaných ve významných determinantách, které pak mohou ovlivňovat vznik následku (působení 3. zavádějícího faktoru). Je-li následek vzácný, nebo má dlouhou dobu latence, i rozsáhlá kohortová studie nemusí být proveditelná - potom je na řadě studie případů a kontrol, která má však ještě větší riziko působení zavádějících faktorů. 2. hodnotíme zda byla expozice (léčba) i následek měřeny stejně v obou skupinách? Dále zjišťujeme, zda bylo vyhodnocení následku zaslepené? To znamená, jestli se nepátralo usilovněji po nádorech ve skupině s antagonisty calcia a obráceně pacienti s následkem si lépe vzpomínají na expozici - proto je lépe když je studie zaslepená! 3. hodnotíme zda bylo sledování dostatečně dlouhé (vzhledem ke vzniku následku) a úplné? - je-li sledování krátkodobé, nemůžeme vyloučit falešnou negativitu v uvedené studii bylo sledování v průměru 3.7 roku a bylo zjištěno 47nádorových onemocnění z 1549 oso-boroků u užívajících antagonisty calcia - obdobně jsou-li velké ztráty ze sledování (>20%), výsledky jsou problematické 4. hodnotíme zda splňují výsledky studie některé dg testy kauzality? • expozice předchází následek - ve studii všichni s nádorem na začátku vyloučeni ze studie • vztah dávka a účinek - ve studii byl pozorován • vysazení a znovupodání léku - nežádoucí reakce se zmenší nebo vymizí a opět se objeví • konzistence vztahu ve více studiích - byly nalezeny studie z nichž některé prokazovaly úmrtí po tomto léčivu • je vztah biologicky plausibilní -interference s apoptózou jako možný mechanismus 43.1.2 VÝZNAMNOST Jestliže nalezená studie neodpověděla uspokojivě na předchozí otázky, je lépe hledat další. Jestliže ano, pak je třeba prokázat zda je asociace mezi expozicí a následkem dostatečně silná. 1. jaký je rozsah a přesnost asociace mezi expozicí a následkem? různé designy studie vyžadují různé metody posouzení: randomizované a kohortové studie - relativní riziko (RR) studie případů a kontrol - odds ratio (OR) Jak velké by mělo být působivé RR nebo OR? >4 u studií případů a kontrol a u mírných nežádoucích reakcí a klesající se závažností nežádoucího účinku >3 u kohortových studií, protože je zde menší riziko působení bias (ve studii užívání antagonistů calcia jako možné příčiny vzniku nádorů bylo 1.4 - tedy nepříliš působivé). 718 Analýza senzitivity může ukázat jak je RR nebo OR závislé na zavádějících faktorech • vypočítáme neupravované RR a potom upravené vzhledem alespoň k jednomu • zavádějícímu činiteli • pokud zůstane stabilní, pak je spolehlivost asociace větší • pokud je významný pokles pak je asociace podezřelá v analyzované studii naopak RR vzrůstalo z 1.4 na 1.7 po úpravě, to znamená, že zavádějící faktory neovlivňovaly vznik nádorů v souvislosti s léčbou antagonisty calcia Kromě rozsahu je třeba sledovat také přesnost asociace. • Ta je ošetřena pomocí intervalů spolehlivosti (Cl) • (ve studii byl okolo RR 1.4 Cl 1.27 - 2.34 = dobrý výsledek, protože Cl je úzký a nezahrnuje hodnotu 1.0). Sílu asociace (RR nebo OR) můžeme přeložit i do jiného ukazatele, srozumitelného pacientovi i lékaři - NNH ...počet pacientů, kteří musí být exponováni domnělému kauzálnímu agens, aby vznikl 1 další poškozující následek. Výpočet u kohortové nebo randomizované studie bude následující: AR (atributivní riziko) = a/(a+b) - c/(c+d) Ve studii případů a kontrol je to složitější: 1-(PEER x (1-OR)) / (1 - PEER) x PEER x (1-OR), kde PEER je nežádoucí účinek u neexponovaných. NNHs, vypočítané z typických PEER a OR jsou uvedeny na tabulce 7a a 7b. NNH odvozené z typických PEER a OR Tab. 7a ProORl 1.1 1.25 1.5 1.75 2 2.25 2.5 0.05 212 86 44 30 23 18 16 0.10 113 46 24 16 13 10 9 0.20 64 27 14 10 8 7 6 PEER 0.30 50 21 11 8 7 6 5 0.40 44 19 10 8 6 5 5 0.50 42 18 10 8 6 6 5 0.70 51 23 13 10 9 8 7 0.90 121 55 33 25 22 19 18 Jak je vidět z tabulky, pro stejné OR mohou být různé hodnoty NNH, v závislosti na PEER. Proto je velmi důležité správně odhadnout PEER pro našeho pacienta, na němž pak závisí velikost rizika poškození. Na příklad je li OR 0.9 a PEER 0.005 pak NNH bude 2000. Ale je-li PEER ve stejném případě 0.4, pak NNH bude 40. 43.1.3 POUŽITELNOST Musíme se zajímat zda může být tento validní a významný důkaz o možném poškození aplikován na našeho pacienta? 1. je náš pacient tak jiný než pacienti ve studii že výsledek nemůžeme použít? • nejedná se o to zda náš pacient splňuje kritéria pro zařazení jako pacienti ve studii, ale jestli je natolik rozdílný od pacientů ve studii, že výsledky studie na něho nemohou být aplikovány. 2. jaké je riziko vzniku nežádoucího následku u našeho pacienta? • odhad může být proveden podle rizika neexponovaných v naší studii pomocí desetinné frakce „f' • jestliže náš pacient je v polovičním riziku než pacienti ve studii f = 0.5 (NNH ve studii=116, f=0.5, pak 116/0.5=232) • jestliže náš pacient má dvojnásobné riziko než pacienti ve studii pak f=2 (NNH ve studii=116, f=2,0, pak 116/2=58) 3. jaké jsou pacientovi preference, starosti a očekávání od léčby? • pacient může kvantifikovat své hodnoty pro přínos léčby i poškození v důsledku léčby. A výsledkem je potom opět LHH (likelihood of help or harm - pravděpodobnost prospěchu nebo poškození) 4. jaká alternativní léčba je k dispozici? Zvažujeme také možnosti alternativní léčby, tj. použití jiného léčebného přípravku.V daném příkladu je mnoho alternativních způsobů léčby hypertenze. Závěrem této části je třeba zdůraznit, že vždy je třeba zvažovat jestli léčba (i ntervence) pacientovi spíše pomůže než uškodí. Tématika, uvedená v příkladu, je zpracována na následujícím CAT: 43.1.4 CAT HYPERTENZE - BLOKÁTORY CALCIOVÉHO KANÁLU MOHOU BÝT PŘÍČINNOU VZNIKU NÁDORŮ Klinický řádek: do doby než se situace vyjasní je lépe léčit pacienta jinými alternativními antihypertenzními léky Jestliže výsledek studie je pravdivý, pak NNH pro vznik jednoho nádoru je 116 při 3.7 letech užívání blokátorů kalciového kanálu Citace: Pahor M. Et al: Calcium-channel blockade and incidence of cancer in aged populations, Lancet 1996; 348: 493-7 Klinická otázka: Jsou pacienti užívající antagonisty kalcia pro hypertenzi ve zvýšeném riziku vzniku nádorového onemocnění? Vyhledávací termíny: „antagonsti kalcia" a „nádory" v MEDLINE Studie: Náhodný vzorek osob (muži i ženy) 65 let a starších (>80% response rate) ve 3 regionech USA byl vyšetřen takto: 90 minut interview, změřen krevní tlak a váha a výška. Osoby 719 s nádory byly vyloučeny ze studie a zbývající osoby byly sledovány v průměru 3.7 let pomocí interview, informací z případné hospitalizace a pomocí nádorového registru na vznik eventuelního nádoru. Důkaz: Exponovaní měli incidenci nádorů v 3.03% Neexponovaní měli incidenci nádorů v 2.17% RR = 3.03/2.17 = 1.4 (P=0.032), po úpravě pro potenciální zavádějící faktory se RR Zvýšilo na 1.7 (P=0.0005) !!! Komentář: 1. Jedinci léčení antagonisty kalcia mají častěji diabetes, kardiovaskulární nemoci a hospitalizace, ale po úpravě vzhledem k těmto možným zavádějícím faktorům RR se naopak ještě zvýšilo, takže výsledek neovlivňovaly. 2. Nebyl zjištěn vztah dávky účinku. 3. Nebyl zjištěn významný rozdíl podle typu léku. 4. Celkem 47 nádorů u léčených a to nádory různých lokalizací a typů. 5. Možný mechanismus vzniku nádoru: interference s apop-totickou destrukcí nádorové buňky. 6. Ostatní studie u těchto léků vyzněly nepřesvědčivě a autorům této studie bylo vyhrožováno smrtí!!! Hodnotil: Sackett 1996, platnost do 2001 720 44 PROGNÓZA 44.1 PROGNÓZA Na prognózu se ptá pacient a zvažuje ji lékař, zda někdy vůbec pacienta léčit (starší muž s chronickou lymfatickou leukémií, který se cítídobře - bude jeho prognóza významně změněna jestliže bude bez léčby do projevení se příznaků?). • tyto otázky mají 3 aspekty: - kvalitativní - co se může stát - kvantitativní - jaká je pravděpodobnost, že se něco stane - časový - za jak dlouho • úkolem je najít nejlepší důkaz pro vyslovení prognózy a zhodnotit validitu, význam a použitelnost 44.1.1 VALIDITA Při posuzování validity je třeba se ptát: • zda byl vybrán definovaný, reprezentativní vzorek pacientů ve stejné (obvykle v první časné fázi klinické manifestace) fázi nemoci? (inception cohort), výjimkou je situace, kdy chceme sledovat prognózu pozdních stádií nemoci • zda bylo sledování pacientů úplné a dostatečně dlouhé? ...ztráty ze sledování- důvody (změna bydliště atd. ale i úmrtí, zhoršení nemoci!!). Ideálně by měli být pacienti sledováni tak dlouho dokud se buď úplně neuzdraví, nebo se u nich neobjeví jiný sledovaný následek nemoci. Jestliže je sledování jen po krátkou dobu a objeví se jen několik nežádoucích následků, nemůžeme pacienta příliš ujistit o jeho budoucnosti. Jestliže je sledování dostatečně dlouhé, pak můžeme vyslovit věrohodnou prognózu. Ale i tehdy, jestliže bylo sledování dostatečně dlouhé, musíme se zajímat co se stalo s pacienty, kteří ze studie odstoupili, ať už z jakýchkoliv důvodů. Některé ztráty jsou nezbytné a obvykle nejsou ve vtahu k prognóze jako na příklad změna místa vzhledem k zaměstnání nebo bydlení. Ale ostatní „ztráty" (úmrtí, zhoršení nemoci, které znemožňuje sledování, ztáta samostatnosti a přesun k rodině atd.), pokud není dokumentována možnost vzniku sledovaného následku, podstatně sníží validitu studie. • jak veliké jsou ztráty osob ze sledování? Jsou-li ztráty <5% = malý bias, >20%=závažně ohrožuje validitu (scénář worst case a best case =sensitivity analysis - co jestli...?) příklad: prognostická studie, 100 pacientů, 4 úmrtí a 16 ztrát ze sledování - smrtnost 4 z 84 =4.8% - co ztracených 16? někteří nebo všichni mohli také zemřít - .. .scénář „worst case"20 ze 100=20% .. .scénář „best case" 4 ze 100 = 4% Validita studie je spíše problematická, protože „nejhorší varianta" vykazuje veliký rozdíl od dosaženého výsledku. • dále je třeba sledovat zda byla použita objektivní kritéria pro stanovení následku a v zaslepené podobě? extrémy následku = = úmrtí (lehce zjistitelné) ale příčina úmrtí je problém = úplná úzdrava Obě tyto extrémní situace je možno poměrně lehce zjistit. V rozmezí těchto extrémů je široká škála následků (pracovní schopnost, reziduálni bolest atd., kde pokud je slepé hodnocení, tak významně zvyšuje validitu). • také je třeba se zajímat pokud byly podskupiny s různou prognózou, zda byla provedena úprava (strati- fikací apod.) pro významné rizikové faktory a validace v nezávislé skupině („test set") pacientů? Prognostické faktory: • ..demografické- věk, pohlaví, socioekonom. stav • ..specifické pro nemoc - rozsah, hodnota testu určující abnormalitu • ..komorbidita - jiné poruchy Počáteční skupina pacientů, kde se prognostický faktor uplatnil se obvykle nazývá training set (derivation set) Následná skupina je pak obvykle nazývána test set (valida-tion set). Jestliže také potvrdí dosažené výsledky (prediktivní hodnotu prognostického faktoru), pak je možno situaci považovat za prokázanou a přistoupit eventuelně k napsání klinických prognostických doporučení (clinical prediction guide CPG). 44.1.2 VÝZNAMNOST • posuzujeme jaká je pravděpodobnost vzniku následku v čase a to je obvykle vyjádřeno třemi způsoby: ... % přežití v určitém čase (1 rok, 5 let) - survival rates ... medián přežití (délka sledování ve které 50% pacientů zemřelo) ... křivka přežití kde v čase je proporce (%) těch kteří dosud nezemřeli Prognóza na křivkách přežití Obr. 4 100 S 50- 1 e o- d 100- 0 50 v a o- n 100- é 50- 0 s o- 0 100- b y 50 o- 12 čas sledovaní v měsících 721 Na obrázku 4 jsou naznačeny 4 situace: A = žádný pacient neměl následek na konci studie, tj. buď je prognóza velmi dobrá, nebo byla studie příiš krátká. B,C,D = všechny tyto 3 situace ukazují, že nemoc je vážná a pouze 20% pacientů přežívá 1 rok - v tomto smyslu je možno informovat rodinu pacienta. Ale tvar křivek je různý, takže medián přežití (tj. čas ve kterém 50% osob zemře) je 9 měsíců pro nemoc v případě C, ale jen 3 měsíce pro nemoc v případě B. Tvar čáry přežití je souvisle klesající v případě D. Protože 1 roční přežívání, medián přežití a křivky přežití nás informují o jiných aspektech, je pro úplný obraz nejlépe použít všechny tři způsoby. • jak přesný je odhad prognózy? Jaký je vliv náhodné chyby protože studie jsou prováděny vždy jen na vzorku pacientů. Konvenčně je to vyjádřeno intervalem spolehlivosti. 44.1.3 POUŽITELNOST Při úvaze o použitelnosti výsledků prognostické studie si klademe následující otázky: • byli pacienti ve studii podobní mým pacientům? Zvažujeme zejména demografické a klinické charakteristiky (jak podobní = dostatečně podobní ?!) • otázku je možno položit i obráceně: byli pacienti ve studii tak rozdílní, že nelze výsledky aplikovat? Pokud je odpověď ne, pak můžeme výsledky studie použít. • bude mít tento důkaz klinicky významný dopad na naše závěry co nabídnout nebo říci našim pacientům? Někdy vzniká otázka jestli neléčit vůbec nebo léčit ... není-li odpověď na tuto otázku, pak by měla být poskytnuta alespoň informace pro pacienta a jeho rodinu co mohou očekávat. 722 45 SYSTEMATICKÉ PŘEHLEDY Systematický přehled je shrnutí lékařské literatury, používající jednoznačných metod k systematickému výběru, kritickému zhodnocení a syntéze světové literatury na daný problém. Účelem je minimalizovat bias (nejenom zaměřením na randomizované studie) a náhodnou chybu (shromážděním velkého množství jedinců). Kdy je nějaký přehled systematický? Pokud byste měli napsat pojednání o nějakém problému a šli do knihovny, kde byste listovali rejstříky knih a časopisů a pokud byste připadli na odstavec, který vypadá důležitý, okopírovali byste jej, a pokud byste našli něco, co by nesedělo k vaší teorii, kterou předpokládáte, nechali byste to tam. Toto, více nebo méně, tvoří metodologii tzv. novinářského přehledu - tedy převedeno na problematiku EBM, přehledu primárních studií, které nebyly identifikovány a analyzovány systematicky (tj. standardizované a objektivně). Novináři dostávají zaplaceno spíše podle toho, kolik toho napíší, než kolik toho přečtou nebo jak kriticky to zpracují, což vysvětluje, proč většina z „nových vědeckých objevů", o kterých se dnes čte v novinách, bude pravděpodobně zpochybněna ještě před koncem měsíce. Naproti tomu, systematický přehled je přehled primárních studií, který: • obsahuje údaje o cílech a účelu přehledu, materiálech a metodách, • byl proveden podle jasné a reprodukovatelné metodologie . Nejtrvalejší a nejužitečnější systematické přehledy, zvláště ty provedené Cochrane Collaboration , jsou pravidelně aktualizovány, aby do nich mohly být začleněny nové důkazy. Mnoho, ne-li většina lékařských přehledných článků je stále psáno novinářskou formou. Profesor Paul Knipschild, ve vynikající knize Iaina Chalmerse a Douga Altmana Systematic reviews, popisuje, jak nositel Nobelovy ceny, biochemik Linus Pauling, používal vybrané citáty z lékařské literatury, aby „prokázal" svou teorii, že vitamin C pomáhá déle žít a cítit se lépe. Když Knipschild a jeho kolegové systematicky prohledali literaturu ohledně důkazů pro tuto hypotézu a proti ní, zjistili, že ačkoli jedna nebo dvě studie silně nasvědčovaly tomu, že by vitamin C mohl předcházet vzniku nachlazení, je mnohem více studií, které neukázaly žádný prospěšný účinek. Linus Pauling pravděpodobně nechtěl záměrně klamat své čtenáře, ale jelikož jeho nadšení pro jeho věc převážilo jeho vědeckou objektivitu, nebyl si vědom systematické chyby výběru (selection bias), ovlivňující jeho volbu publikací. Kdybychom se i my snažili o to, co dělal Pauling - tj. pátrali v lékařské literatuře po důkazech na podporu naší zamilované teorie - dělali bychom stejně nestandardní a nevědeckou práci. Vadný sekundární výzkum, jehož příkladem je novinářský přehled, je stejně vědecky nebezpečný jako vadný primární výzkum. Bylo prokázáno, že experti, kteří jsou léta ponořeni v nějakém oboru a vědí, jaká „by měla" být odpověď na nějakou otázku, jsou významně méně schopni vytvořit objektivní přehled literatury z jejich oboru, než ti, kdo v jejich oboru experty nejsou. Kdyby bylo možno se spolehnout na to, že názory expertů se shodují s výsledky nezávislých systematických přehledů, tak by to nemělo žádné důsledky, ale to bohužel není možné . Tyto odsuzované studie jsou stále široce citovány lidmi, kteří by rádi nahradili všechny experty v nějakém oboru (jako jsou kardiologové) experty na vyhledávání a posuzování (lidmi, kteří se specializují na vyhledávání a kritizování publikací v kterémkoli oboru). Ale nikdo z nich v posledních letech posuzována zjištění nezopakoval. Jinými slovy, snad bychom měli důvěřovat současným odborníkům v tom, že mají sklon více zakládat svá doporučení na důkladném vyhodnocování důkazů! Ale obecné pravidlo je, že pokud se chystáte pověřit někoho vyhledáním nejlepších objektivních důkazů o prospěchu antikoagulancií u fibrilace síní, měli byste požádat někoho, kdo je expertem na systematické přehledy, aby pracoval po boku experta na fibrilaci síní. Abychom byli poctiví vůči Linusu Paulingovi, on se skutečně zmínil o řadě studií, jejichž výsledky byly vážnou výzvou jeho teorii, že vitamin C zabraňuje nachlazení, ale popsal všechny takové studie jako „metodologicky vadné". Jak nám připomíná Knipschild, takové byly i mnohé ze studií, které Pauling zahrnul do své analýzy, ale protože jejich výsledky souhlasily s jeho teorií, byl Pauling, možná podvědomě, méně kritický k slabým stránkám jejich designu. Když se provádí systematický přehled, nejen že hledání důležitých článků musí být důkladné a objektivní, ale kritéria používaná k odmítnutí článků jako „vadných" musejí být jasně daná a nezávislá na výsledcích těch studií. Jinými slovy, nevyhazujte studii proto, že všechny ostatní studie v této oblasti ukázaly něco odlišného, vyhoďte ji proto, že cíle, účel nebo metody studie nesplnily vaše kritéria pro její zařazení do analýzy, ať již její výsledky ukazují cokoli. 45.1 VYHODNOCENÍ SYSTEMATICKÝCH PŘEHLEDŮ Otázka, kterou má systematický přehled řešit, musí být formulována velice přesně, jelikož tvůrce přehledu musí učinit rozhodnutí typu ano/ne, zda bude zahrnuta každá potenciálně důležitá publikace nebo zda bude odmítnuta jako „nedůležitá". Na příklad otázka „Zabraňují antikoagulancia iktům u pacientů s fibrilaci síní?" zní pěkně specificky, dokud se nezačne s probíráním seznamu možných studií k zahrnutí do přehledu. Zahrnuje „fibrilace síní" jak revmatickou tak nerevmatickou formu (o nichž se ví, že jsou spojeny s odlišnými riziky iktu) a zahrnuje paroxysmální fibrilaci síní? Zahrnuje „iktus" jak ischemický iktus, tak i hemorrhagic-ký iktus? A když se hovoří o iktu, měli bychom zvážit vedlejší účinky antikoagulancií vzhledem k možnému prospěchu z nich? Měla by být skutečná antikoagulancia jako heparin a warfarin porovnána s placebem nebo s jinými léky, které omezují krevní srážlivost, jako je aspirin a příbuzné výrobky? Nakonec, měl by přehled zahrnout studie na pacientech, kteří již předtím měli iktus nebo tranzitorní ischemickou ataku, nebo by měl být omezen na studie na pacientech bez těchto hlavních rizikových faktorů dalšího iktu? Ona „jednoduchá" otázka položená dříve se stává nezod-pověditelnou a myji musíme zdokonalit následovně: „Vyhodnotit účinnost a bezpečnost léčby antikoagulancií warfarinového typu v sekundární prevenci (tj. po předcházejícím iktu nebo tranzitorní ischemické atace) u pacientů s nerevmatickou fibrilaci síní: porovnání s placebem." 723 Byla důkladně prohledána vhodná databáze a byly prozkoumány jiné potenciálně důležité zdroje? Jednou z výhod systematického přehledu je, na rozdíl od vyprávěcího nebo novinářského přehledu, že se od autora žádá, aby řekl, odkud informace pocházejí a jak byly zpracovány. Hledání důležitých článků v databázi Medline je velice komplikovaná věda a dokonce i nejlepší hledání v Medline vynechá důležité publikace, pro něž musí tvůrce přehledu vstoupit do některých dalších databází. Při hledání studií pro zahrnutí do přehledu je důležitým vědeckým závazným pravidlem úzkostlivě se vyvarovat jazykovému imperialismu. Například vyjádřením „Eine Placebo-kontrolierte Doppel-blindstudie" a „une étude ran-domisée a double insu face au placebo" musí být dána stejná váha jako „a double blind, randomised controlled trial"! Dále, zvláště tam, kde se uvažuje o statistické syntéze výsledků (meta-analýze), může být vhodné napsat autorům primárních studií a požádat je o nezpracované údaje o jednotlivých pacientech, které nikdy nebyly zahrnuty do publikovaného přehledu. I když bylo toto vše uděláno, hledání materiálu pro systematicky přehled sotva začalo. Jak ukázali Paul Knipschild a jeho kolegové, když hledali studie o vitaminu C a o prevenci nachlazení, jejich elektronické databáze jim poskytly pouze 22 z celkového konečného počtu 61 studií. Dalších 39 studií odhalilo ruční prohledávání databáze Index Mediem (14 studií nenalezených předtím), hledání odkazů ve studiích nalezených v Medline (dalších 15 studií), dále odkazy odkazů (devět dalších studií) a odkazy odkazů odkazů (jedna studie navíc nerozpoznanná žádným z předchozích hledání). Nakonec ale Knipschild a jeho tým zjistili, že jen jedna ze studií nerozpoznaných v Medline vyhověla přísným kritériím metodologické kvality a přispěla nakonec k jejich systematickému přehledu o vitaminu C v prevenci nachlazení. Prozkoumání tzv. „šedé literatury" může mít větší relativní důležitost, bereme-li v úvahu studie mimo hlavní lékařský obory, jako je fyzioterapie nebo alternativní medicína. Byla zhodnocena metodologická kvalita a podle toho studie seřazeny? Metodologické nedostatky, které činí výsledky studií neplatnými, jsou často obecné (tj. jsou nezávislé na předmětu studie), ale mohu také být zvláštní metodologické vlastnosti, které v určité oblasti rozlišují mezi dobrou, střední a nízkou kvalitou. Proto je jedním z úkolů tvůrce systematického přehledu sestavit seznam kritérií včetně obecných i zvláštních stránek kvality, podle nichž by měla být každá studie posuzována. Teoreticky by bylo možné spočítat složené číselné skóre, jež by odráželo „celkovou metodologickou kvalitu". Avšak ve skutečnosti by měla být spéše opatrnost při vyvíjení takových skóre, jelikož neexistuje zlatý standard pro „skutečnou" metodologickou kvalitu studie a taková složená skóre by v praxi pravděpodobně nebyla ani platná ani spolehlivá. Různé skupiny Cochrane Collaboration tvořící přehledy, vyvíjejí obecné i tematicky specifické metody pro přiřazování skóre kvality výzkumným studiím. Běžně méně než polovina publikovaných meta-analýz obsahuje reprodu-kovatelná kritéria pro vyhodnocení kvality studií, které byly zařazeny nebo vyloučeny. Jak citlivé (senzitivní) jsou výsledky studií vůči způsobu zpracování přehledu? Pokud nerozumíte tomu, co tato otázka znamená, vyhledejte si ironicky myšlenou publikaci Carla Counsella a kolegů ve vánočním čísle BMJ z roku 1994, která „prokazovala" zcela fiktivní vztah mezi výsledkem házení kostek a výsledkem akutního iktu. Autoři popisuji řadu umělých experimentů s kutálením kostek, v nichž červené, bílé a zelené kostky představovaly různé druhy léčby akutního iktu. Celkově „studie" neukázaly žádný významný prospěch z těchto tří terapií. Avšak napodobení řady dokonale možných situací v procesu meta-analýzy - jako je publikační systematická chyba daná vyloučením několika „negativních" studií, analýza podskupin, která vyřadila údaje o léčbě červenými kostkami (jelikož se při zpětném pohledu na výsledky, jevily červené kostky jako škodlivé), a jiná, hlavně arbitrárni, vyloučení na základě „metodologické kvality" - vedlo ke zjevně vysoce významnému prospěchu z „léčby kostkami" u akutního iktu. Ovšem, že nemůžete kutálením kostek vyléčit nikoho s iktem, ale pokud by se tyto simulované výsledky týkaly skutečných medicínských sporných otázek (jako které skupiny postmenopauzálních žen by měly užívat hormonální substituční léčbu nebo zdali by se měly plody v poloze koncem pánevním rutinně posílat na císařský řez), jak byste takové jemné systematické chyby vypátrali? Odpověď je, že se musíte propracovat různými „co kdyby". Co kdyby autoři systematického přehledu bývali změnili kritéria pro zařazení studií ke zpracování? Co kdyby vyloučili nepublikované studie? Co kdyby přiřadili studiím „váhu na základě kvality" odlišně? Co kdyby studie o nižší metodologické kvalitě byly zařazeny (nebo vyloučeny)? Co kdyby byli všichni pacienti, kteří nebyli do studie počítáni, považováni za zemřelé (nebo vyléčené)? Zkoumání těchto co kdyby je známo jako analýza sen-zitivity. Pokud zjistíte, že takové různé manipulace s údaji vedou k malým nebo žádným rozdílům v celkových výsledcích přehledu, můžete předpokládat, že závěry přehledu jsou poměrně robustní (odolné vůči změnám parametrů). Pokud však klíčové nálezy zmizí, když se změní kterékoli „co kdyby", závěry by měly být vyjádřeny mnohem obezřetněji a vy byste měli váhat, než byste v jejich světle změnili vaši praxi. Byl význam číselných výsledků hodnocen prostým rozumem a s patřičným zřetelem k širším hlediskům problému? Často je snadné nechat se „navnadit" diagramy a grafy v systematickém přehledu. Ale jakýkoli číselný výsledek, jakkoli přesný, správný, „významný" a nebo jinak nezpochybnitelný, musí být umístěn do souvislosti s jednoduchou a často obyčejnou otázkou, kterou přehled zpracovával. Klinik musí rozhodnout, jak (pokud vůbec) tento číselný výsledek, ať je významný nebo ne, by měl ovlivnit péči o jednotlivého pacienta. Zvláště důležitou vlastností, kterou je třeba uvážit, když podnikáme nebo posuzujeme systematický přehled, je externí platnost zahrnutých studií. Studie může mít vysokou metodologickou kvalitu a mít přesné a působivé číselné výsledky, ale může být například vedena na účastnících ve věku pod 60 let, a proto nemusí být platná pro lidi nad 75. Zahrnutí nevhodných a neplatných studií do systematického přehledu zaručeně povede k nesmyslům a sníží důvěryhodnost sekundárního výzkumu. 45.2 META-ANALÝZA PRO NESTATISTIKA Meta-analýza, je definovaná jako statistická syntéza číselných výsledků několika studií, z nichž všechny pracovaly na stejné otázce. Pro nestatistika je dobrá meta-analýza 724 často snadněji pochopitelná než řada publikací primárního výzkumu, z něhož byla odvozena. Statistické techniky, které stojí za meta-analýzou, jsou tytéž jako pro kteroukoli jinou analýzu údajů - jde jen o to, že některá čísla jsou větší. Je užitečné, že jedna mezinárodní poradní skupina přišla se standardním formátem pro meta-analýzy (ustanovení QUOROM, podobné formátu CONSORT pro randomizova-né kontrolované studie. Prvním úkolem tvůrce meta-analýzy, po absolvování předběžných kroků pro systematický přehled, je rozhodnout, který ze všech různých parametrů výsledků vybraných autory primárních studií je (nebo jsou) nejlepší k použití pro celkovou syntézu. Například ve studiích o určitém režimu chemoterapie na karcinom prsu budou někteří autoři publikovat kumulativní mortalitu (tj. celkový počet lidí, kteří zemřeli k určitému datu) za tři a 12 měsíců, zatímco jiné studie budou uvádět šestiměsíční, 12měsíční a pětiletou kumulativní mortalitu. Zpracovatel meta-analýzy se může rozhodnout, že se soustředí na 12měsíční mortalitu, protože tento výsledek lze snadno vytáhnout ze všech těch studií. Avšak může usoudit, že tříměsíční mortalita je klinicky důležitým cílovým ukazatelem, a tak bude muset napsat autorům ostatních studií a požádat je o nezpracované údaje, z nichž by tato čísla vypočítal. Vedle rychlého zpracování čísel patří k popisu práce tvůrce meta-analýzy uvést do tabulky důležité informace o kritériích pro zařazení studie k analýze, velikost vzorku, výchozí charakteristiky pacientů, četnost vyřazení („odpadnutí") ze studie a výsledky primárních a sekundárních cílových ukazatelů ze všech zahrnutých studií. Bude-li tento úkol řádně proveden, je možno porovnat metody i výsledky dvou studií, jejichž autoři svůj výzkum sepsali různými způsoby. Ačkoli jsou takové tabulky často opticky odrazující, chrání před tím, aby se složitě porovnávala tabulka výsledků jednoho autora s kruhovým grafem či histogramem jiného autora. V současné době je sklon k předkládání výsledků meta--analýz ve standardní formě. Je to částečně proto, že tvůrci meta-analýz často k jejich výpočtům používají počítačové programové vybavení a tyto programy obsahují standardní grafický balíček. Toto obrazové znázornění (v hovorové angličtině známé jako „forest plot" nebo „blobbogram") bylo provedeno Srovnání efektivity koronárního bypassu (CABG) s perkutánní koronárni angioplastikou (PTCA) v léčbě angíny pectoris Obr. 5 STUDIE CABRI RITA EAST GAB TOLOUSE MASS LAUSANNE EROCI META-ANALYZA CELKEM OR (95% CI) u sloučených poměrů rizik z osmi RCT, kde každá porovnávala koronárni bypass (CABG) s perkutánní koronárni angioplastikou (PTCA) v léčbě těžké anginy pectoris. Primárním (hlavním) výsledkem v této meta-analýze byla smrt nebo srdeční příhoda během jednoho roku. Těchto osm studií, zastoupených svým akronymem (například CABRI), je uvedeno pod sebou po levé straně na obrázku 5.Vodorovná úsečka odpovídající každé studii ukazuje relativní riziko smrti nebo srdeční příhody během jednoho roku u pacientů randomizovaných pro PTCA ve srovnání s pacienty randomizovanými pro CABG. „Skvrnka" (angl. „blob") uprostřed každé úsečky je bodovým odhadem rozdílu mezi skupinami (nejlepším jednotlivým odhadem prospěchu v podobě zachráněných životů nabídnutím CABG oproti nabídce PTCA) a délka úsečky představuje 95% interval spolehlivosti tohoto odhadu. Svislá černá přímka jdoucí středem diagramu je známa jako „čára nulového účinku" a v tomto případě je sdružena s relativním rizikem (RR) 1.0. Jinými slovy, pokud vodorovná úsečka kterékoli studie nepřekročí čáru nulového účinku, je 95% šance, že mezi skupinami je „skutečný" rozdíl. Pokud interval spolehlivosti výsledku (ona vodorovná úsečka) překročí čáru nulového účinku (tj. tu svislou čáru), může to buď znamenat, že není významný rozdíl mezi těmi léčbami, a/nebo, že velikost vzorku byla příliš malá na to, aby se spolehlivě vědělo, kde leží skutečný výsledek. Jednotlivé studie dávají bodové odhady relativního rizika PTCA ve srovnání s CABG mezi 0.5 a 5.0 a intervaly spolehlivosti některých studií jsou tak široké, že se ani nevejdou do grafu. A teď přichází to nejlepší na meta-analýzách. Podívejte se na malý kosočtverec pod všemi vodorovnými čárami. Představuje sloučené údaje ze všech osmi studií (celkové relativní riziko PTCA:CABG = 1.08) s novým, mnohem užším intervalem spolehlivosti tohoto relativního rizika (0.79 - 1.50). Jelikož se kosočtverec silně překrývá s čárou nulového účinku, můžeme říci, že pravděpodobně máme málo na výběr mezi těmi dvěma léčbami ve smyslu primárního cílového ukazatele (smrti nebo srdeční příhody v prvním roce). V tomto příkladě každá z osmi studií jednotlivě také naznačila nevýznamný rozdíl v účinku, ale u žádné z nich nebyla velikost vzorku dost velká na to, abychom se mohli spolehnout na její negativní výsledek. Avšak všimněte si, že tento úhledný kosočtvereček neznamená, že byste tedy mohli nabízet každému pacientovi s angínou raději PTCA než CABG. Má mnohem omezenější význam - že průměrný pacient ve studiích předložených v této meta-analýze má stejnou pravděpodobnost dosáhnout primárního cílového ukazatele (smrti nebo srdeční příhody během roku), ať je randomizován pro kteroukoli z obou možností léčby. Volba léčby by ovšem měla také vzít v úvahu, jak se pacient cítí na podstoupení větší srdeční operace (CABG) oproti relativně menší proceduře (PTCA). V mnoha meta-analýzách „nevýznamné" studie (tj. ty, které samy o sobě neukázaly významný rozdíl mezi léčebnou a kontrolní skupinou) přispívají ke sloučenému výsledku, který je statisticky významný. Nejslavnějším příkladem řečeného, což Cochrane Collaboration přijala za své logo, je meta-analýza sedmi studií o účinku podávání steroidů matkám, u kterých se očekával předčasný porod. Jen dvě z těch sedmi studií ukázaly statisticky významný prospěch (ve smyslu přežití dítěte), ale zlepšení v přesnosti (tj. zúžení intervalů spolehlivosti) u kumulativních výsledků, patrné ve zmenšení šířky kosočtverce ve srovnání s jednotlivými úsečkami, předvedlo sílu důkazů ve prospěch této intervence. Tato meta-analýza ukázala, že u dětí matek léčených steroi- 725 dy byla o 30-50 % menší pravděpodobnost úmrtí, než u dětí kontrolních matek. Existují propracovanější techniky meta-analýzy údajů jednotlivých pacientů, které poskytuje správnější a přesnější model pro výpočet bodového odhadu účinku. Také je vhodné si vyhledat vynikající přehlednou sérii o meta-analýzách publikovanou před několika lety v BMJ, spolu se zvláštním dodatkem k této sérii o různých programových balíčcích nyní dostupných pro meta-analýzu, který byl uveřejněn pouze na Internetu. 45.2.1 VYSVĚTLENÍ HETEROGENITY V každodenní řeči „homogenní" znamená „stejnorodý, jednotného složení" a „heterogenní" znamená „různorodý, mnoho různých součástí". V řeči meta-analýzy homogenita znamená, že výsledky každé jednotlivé studie jsou slučitelné s výsledky kterékoli z těch dalších. Homogenitu lze odhadnout na první pohled je-li dolní mez intervalu spolehlivosti každé studie nižší než horní mez intervalu spolehlivosti všech ostatních (tj. všechny vodorovné úsečky se do nějaké míry překrývají). Statisticky řečeno jsou tyto studie homogenní. Naproti tomu některé studie, jejichž dolní mez intervalu spolehlivosti je vyšší než horní mez intervalu spolehlivosti alespoň jedné další studie (tj. některé úsečky se vůbec nepřekrývají). Takové studie lze nazvat heterogenními. Definitivní test však zahrnuje trochu promyšlenější statistický manévr, než pozvednout pravítko nad „blobbo-gramem". Ten nejběžněji užívaný je variantou chí kvadrát (X2) testu, jelikož otázka, které se týká, je: „Je mezi výsledky studií větší variabilita než náhodná?" Statistika x2 má v průměru hodnotu rovnou počtu stupňů volnosti (v tomto případě počet studií v meta-analýze minus jedna), a tak by x2 o hodnotě 7.0 pro sadu osmi studií neposkytl žádný důkaz statistické heterogenity. (Ve skutečnosti by ani neprokázal, že studie jsou homogenní, hlavně proto, že x2 test má malou sílu, aby odhalil malé, ale důležité úrovně heterogenity.) Hodnota x2 nám mnohem více než počet studií v meta--analýze říká, že studie, které přispěly k analýze, jsou v nějakém důležitém ohledu odlišné od jiných. Například mohou být známy rozdíly v metodologii (například autoři mohli použít různé dotazníky k vyhodnocení příznaků deprese) nebo mohou být známy klinické rozdíly mezi účastníky studie (například jedním centrem mohla být fakutní nemocnice, kam se odesílají nejvíce nemocní pacienti). Avšak mohou existovat neznámé nebo nezaznamenané rozdíly mezi studiemi, o kterých může zpracovatel meta-analýzy jenom hloubat, dokud nevytáhne další podrobnosti z autorů studií. Předvedení statistické heterogenity je matematický výkon a je to práce statistika, ale vysvětlení této heterogenity (tj. pátrání po klinické heterogenite a její objasnění) je interpretační výkon a vyžaduje představivost, zdravý rozum a závisí na klinických nebo výzkumných zkušenostech. Obrázek 6 ukazuje výsledky 10 studií o strategiích na snížení cholesterolu. Výsledky jsou vyjádřeny jako procentuální pokles rizika onemocnění srdce spojený se snížením sérové hladiny cholesterolu o každých 0.6 mmol/1. Vodorovné úsečky představují 95% intervaly spolehlivosti každého výsledku a je jasné, že i kdyby nebyl znám výsledek x2 = 127, že ty studie jsou vysoce heterogenní. Prosté „zprůměrování" výsledků studií z obrázku by bylo velice zavádějící. Tvůrce meta-analýzy se musí vrátit ke svým primárním zdrojům a zeptat se: „V jakém ohledu se studie A lišila od studie B a co mají studie C, D a H spo- lečného, co způsobuje, že jejich výsledky jsou nahloučeny u jednoho konce diagramu?" V tomto případě korekce na věk subjektů studie snížila x2 ze 127 na 45. Jinými slovy, většinu „neslučitelnosti" ve výsledcích lze vysvětlit skutečností, že když se pustíte do nějaké strategie (například dietní intervence), která úspěšně sníží vaši hladinu cholesterolu, bude podstatně pravděpodobnější předejít srdeční příhodě, pokud je vám 45, než když je vám 85. Studie o strategii snížení cholesterolu Obr. 6 British Regional Heart BUPA Gothenburg MRFIT screenees Renfrew-Paisley Whitehall Honolulu Central Sweden Israeli Pooling project -O—i O Janout V. : Klinická epidemiologie - nedílná součást klinických rozhodovacích procesů, GRADA Publishing, 1998 => Greenhalgh T.: Jak pracovat s vědeckou publikací. Základy medicíny založené na důkazu, GRADA Publishing, 2003 => 3. Sackett D.L., Haynes R.B., Guyatt G.H., Tugwell P: Clinical epidemiology a basic science for clinical medicíne, Little,Brown and Company, 1991 => 4. Brownson R.C., Baker E.A., Leet T.L., Gillespie K.N.: Evidence - Based Public Health, Oxford university press, 200388,7 733 POZNÁMKY -^■l^K; ^^rjt zdravotní f^HI^Bs m *T» ustav Prof. MUDr. Kamil Provazník, CSc. Doc. MUDr. Lumír Komárek, CSc. MANUÁL PREVENCE V LÉKAŘSKÉ PRAXI Souborné vydání Obálku navrhl Jiří Sušanka Vydala Univerzita Karlova - 3. lékařská fakulta ve spolupráci se Státním zdravotním ústavem Praha a MSMT v rámci Národního programu podpory zdraví jako svůj náklad v nakladatelství Fortuna, JUDr. František Talián, Ostrovní 30, 110 00 Praha 1 Sazba Fortuna-Type, s. r. o., Ostrovní 30, 110 00 Praha 1 Vytiskla Šerifa, s. r. o., Jinonická 80, 150 00 Praha 5 Počet stran 736 První vydání Neprodejné ISBN 80-7168-942-4