|
كتاب جامع بهداشت عمومي |
فصل
8 / گفتار 11 / دكتر محسن
جانقرباني
طراحي يك تجربه : كارآزمايي هاي باليني 2
|
|
فهرست
مطالب طراحي يك تجربه : كارآزمايي باليني 2 پيامدهاي
باليني در مقابل پيامدهاي جايگزين طرح هاي ديگركارآزمايي كورتصادفي
شده طرح
هاي بين گروهي تقسيم تصادفي نشده |
|
|
|
|
|
|
|
|
دكتر
محسن جانقرباني
دانشگاه علوم پزشكي اصفهان
پس از يادگيري اين مطالب،
فراگيرنده قادر خواهد بود :
Ø
نحوه پيگيري و رعايت منشور يك
كارآزمايي باليني را طراحي و تشريح نمايد Ø
پيامد يافته هاي يك كارآزمايي باليني
را اندازه گيري و تحليل نمايد Ø
نحوه پايش يافته هاي كارآزمايي را
طراحي و تشريح كند Ø
انواع روش هاي كارآزمايي باليني
تصادفي كلاسيك را توضيح دهد |
منشور كارآزمايي باليني، اندازه گيري پيامد يافته ها، پايش يافته
ها، كارآزمايي تصادفي كلاسيك
در بخش گذشته، كارآزمايي تصادفي شده و كورسازي شده بحث شد: چگونه شركت كنندگان
انتخاب شوند، متغيرهاي پايه اندازه گيري شوند، تقسيم تصادفي انجام شود و مداخله
اعمال گردد. در اين بخش، نحوه به حداكثر رساندن پيگيري و رعايت منشور، اندازه گيري
پيامد و تحليل يافته ها بحث ميشود. در كارآزمايي هاي باليني كاري روي شركت
كنندگان انجام ميشود و اين بخش نياز به پايش يافته ها را در طي كارآزمايي نشان ميدهد.
اين بخش با مروري بر برخي از روش هاي ديگر كارآزمايي تصادفي شده كلاسيك پايان مييابد.
اگر تعداد قابل توجهي از شركت كنندگان در مطالعه، مداخله تحت بررسي را دريافت
نكنند، منشور را رعايت نكنند، يا در طي پيگيري گم شوند، قدرت يافته هاي كارآزمايي
احتمالا كم يا سوگرا ميشود. راهكارهاي به حداكثر رساندن پيگيري و تمكين در جدول 1
خلاصه شده اند.
تاثير مداخله (و قدرت كارآزمايي)، به اندازه شركت كنندگاني كه آن را دريافت
نكرده اند كاهش مييابد. پژوهشگر بايد تلاش كند دارو يا مداخله رفتاري را انتخاب
كند كه بسادگي اعمال يا مصرف شود و بطور كامل قابل تحمل باشد. اگر يك مداخله
رفتاري نياز به ساعت ها تمرين توسط شركت كنندگان داشته باشد، احتمالا رعايت آن
ضعيف خواهد بود. داروهايي را كه ميتوان روزانه يك دوز واحد آن را مصرف كرد، آسان
تر بخاطر سپرده ميشوند و در نتيجه ترجيح داده ميشوند. منشور بايد شامل شروطي
باشد كه رعايت دستورها را افزايش دهد، نظير آموختن به شركت كنندگان كه قرص ها را
بطور معمول صبح ها در وقت معيني مصرف كنند و به آن ها جعبة قرصي داده شود كه
روزهاي هفته روي آن مشخص شده اند.
همچنين، لازم است بهترين روش سنجش تمكين از مداخله، نظير استفاده از روش هاي
گزارش شخصي، شمارش قرص ها و سطوح متابوليت هاي ادرار و سرم در نظر گرفته شود. اين
اطلاعات ميتواند شركت كنندگاني را كه تمكين نميكنند بشناسد، در نتيجه اگر در
پايان مطالعه تفاوتي بين گروه ها نبود در توجيه اين يافته به پژوهشگر كمك نمايد.
پژوهشگر ميتواند قبل از گرفتن رضايت، آنچه در مطالعه انجام ميشود را شرح دهد
و با برنامه ريزي مراجعه ها در زماني راحت و با تعداد كافي كارمند براي جلوگيري از
معطلي، با تلفن زدن به شركت كننده يك روز قبل از هر مراجعه و با جبران هزينه هاي
رفت و آمد و ساير هزينه هاي اضافي، رعايت مراجعه ها و سنجش هاي مطالعه را افزايش دهد.
عدم پيگيري شركت كنندگان در كارآزمايي و اندازه گيري پيامد مورد نظر ميتواند
باعث يافته هاي سوگرا شود، روايي (اعتبار) يافته ها را كم كند و قدرت آماري را
كاهش دهد. براي مثال، يك كارآزمايي افشانه بيني كلسي تونين براي كاهش خطر شكستگي
هاي استئوپروزي گزارش نمود كه درمان خطر شكستگي را 36% كاهش ميدهد (1). ولي حدود
60% آن هايي كه تقسيم تصادفي شدند در حين پيگيري گم شدند، و معلوم نشد آيا در اين
شركت كنندگان شكستگي روي داده است يا خير. از آنجا كه تعداد كل شكستگي ها كم بود،
حتي چند شكستگي در شركت كنندگاني كه طي پيگيري گم شدند ميتوانست يافته هاي
كارآزمايي را تغيير دهد. اين ابهام اعتبار يافته هاي مطالعه را كم كرد (2).
حتي اگر شركت كنندگان منشور را نقض كنند يا مداخله كارآزمايي را قطع نمايند،
بايد پيگيري شوند، بطوري كه بتوان از پيامدهاي آن ها در تحليل هاي با قصد درمان
استفاده نمود. در بسياري از كارآزمايي ها، شركت كنندگاني كه با شركت در كارآزمايي ديگر، منشور را
نقض ميكنند، مداخله را قطع ميكنند، يا اثرات جانبي را گزارش ميكنند كه باعث قطع
پيگيري ميشود، ميتواند باعث يافته هاي سوگرا يا غيرقابل تفسير شود. براي مثال،
دارويي را در نظر بگيرد كه باعث اثرجانبي علامتداري ميشود و اغلب باعث قطع داروي مطالعه ميگردد. اگر
شركت كنندگاني كه داروي مطالعه را قطع كرده اند براي پيامد، پيگيري نشوند ميزان
رويدادها در گروه درمان فعال به سمت پايين سوگرا خواهد شد. اگر اثر جانبي با پيامد
اصلي مرتبط باشد، اين سوگرايي ميتواند روي يافته هاي اصلي اثر جدي بگذارد.
|
مثال |
اصل |
|
لازم است قبل از تقسيم تصادفي دو يا چند بار ملاقات انجام داد آن هايي را كه قبل از تقسيم تصادفي در دوره درگير سازي تمكين نميكنند حذف
نماييد آن هايي را كه احتمال دارد نقل مكان كنند يا تمكين نميكنند حذف كنيد |
افرادي را انتخاب كنيد كه احتمال دارد مداخله و منشور را رعايت كنند |
|
بجاي دو قرص از يك قرص استفاده كنيد ملاقات ها به اندازه كافي باشد تا تماس نزديك برقرار شود، ولي آنقدر تكرار
نشود كه خسته كننده شود. برنامه هاي ملاقاتها را در شب يا آخر هفته تنظيم كنيد يا اطلاعات را با پست
الكترونيكي گردآوري كنيد كارمند كافي داشته باشيد تا از معطلي جلوگيري شود هزينه هاي رفت و آمد را تامين كنيد با افراد رابطه شخصي برقرار كنيد |
مداخله را آسان سازيد تماس هاي مطالعه را راحت و لذت بخش كنيد |
|
آزمون هاي غيرمهاجم و آگاهي بخش را انتخاب كنيد نتايج جالب آزمون را به شركت كننده بدهيد و مشاوره مناسب انجام دهيد |
سنجش هاي مطالعه رابي درد و جالب كنيد |
|
هرگز پيگيري افراد را بخاطر عدم رعايت منشور، رويدادهاي مغاير يا اثرات
جانبي قطع نكنيد براي شركت كنندگان كارت هاي تبريك تولد و تعطيلي بفرستيد پيام هاي پست الكترونيكي يا خبرنامه بفرستيد روي اهميت علمي تمكين و پيگيري تاكيد كنيد |
افراد را به ادامه شركت در كارآزمايي تشويق كنيد |
|
افراد در تماس با فرد را ترغيب كنيد و از خدمات رديابي استفاده كنيد |
افرادي كه حين پيگيري گم شده اند را بيابيد |
برخي راهكارهاي پيگيري كامل مشابه آن هايي است كه براي مطالعه هاي همگروهي
گفته شد. در آغاز مطالعه، بايد شركت كنندگان را از اهميت پيگيري آگاه نمود و
پژوهشگران بايد نام، نشاني و شماره تلفن يك يا دو نفر از آشنايان نزديك را كه
هميشه ميدانند شركت كننده كجاست ثبت كنند. اين كار علاوه بر اينكه توانايي
پژوهشگر را براي ارزيابي وضع حياتي زياد ميكند، ممكن است با تلفن كردن به كساني
كه بطور مطلق شركت در مطالعه را رد كرده اند به مقياس هاي پيامد جانشين دسترسي
پيدا كنند. در كارآزمايي مطالعه قلب و جايگزيني استروژن، 89% زنان براي آخرين
معاينه مراجعه نمودند، با 8% ديگر آخرين تماس تلفني براي تعيين پيامد برقرار شد و
با تماس تلفني، نامه هاي سفارشي، تماس با بستگان نزديك و خدمات رديابي اطلاعاتي در
خصوص وضع حياتي هر يك از شركت كنندگان بدست آمد (3).
طرح كارآزمايي بايد طوري باشد كه رعايت مداخله وتكميل تمام مراجعه هاي پيگير و
سنجش ها را تا حد ممكن براي شركت كنندگان آسان سازد. مراجعه هاي طولاني و پر
اضطراب برخي از شركت كنندگان را از مراجعه باز ميدارد. بيشتر احتمال دارد شركت
كنندگان به مراجعه هايي پاسخ گويند كه مستلزم آزمون هاي غيرمهاجم است، نظير
توموگرافي رايانه اي پرتو الكتروني قلب، بجاي آزمون هاي مهاجمي نظير آنژيوگرافي
عروق تاجي. گردآوري اطلاعات پيگيري بوسيله تلفن يا وسايل الكترونيكي ممكن است
تمكين شركت كنندگاني را كه مراجعه ها را مشكل يافته اند بهبود بخشد. از طرف ديگر،
اگر برخي پاداش هاي اجتماعي يا بين فردي براي شركت كننده وجود نداشته باشد، شركت
كنندگان ممكن است علاقه خود رابه كارآزمايي از دست بدهند. شركت كنندگان ممكن است
از مراجعه هاي ماهانه مطالعه خسته شوند و اگر تنها سالي يك بار مراجعه كنند ممكن
است علاقه خود را از دست بدهند. با مثبت و لذت بخش كردن تجربه كارآزمايي براي شركت
كنندگان، پيگيري نيز اصلاح ميشود : سنجش ها و روش هاي كارآزمايي را بدون درد و
جالب طراحي كنيد، آزمون هايي را انجام دهيد كه در غير اين صورت در اختيار نميباشند، يافته هاي آزمون ها را به
شركت كنندگان بدهيد (اگر يافته روي پيامد تاثير نداشته باشد)، خبرنامه ها را
بفرستيد، يا پيام هاي قدرداني بفرستيد، كارت هاي تبريك تولد و تعطيلي و هديه هاي
ارزان بفرستيد و با كارمند مطالعه روابط شخصي قوي برقرار كنيد.
دو جنبه طراحي كه مخصوص كارآزمايي ها است و ممكن است تمكين و پيگيري را بهبود
بخشند عبارتند از: مراجعه هاي غربالگري قبل از تقسيم تصادفي و دوره درگيرسازي. از
شركت كنندگان بخواهيد قبل از تقسيم تصادفي در يك يا دو مراجعه
غربالگري شركت كنند تا شركت كنندگاني كه
در مييابند نميتوانند چنين مراجعه هايي را كامل كنند حذف شوند. رمز كار در اينجا
اين است كه سدهاي به اندازه كافي بلندي براي ورود به مطالعه برقرار كنيد تا كساني
كه بعدا تمكين نخواهند كرد را حذف كند، ولي آنقدر بلند نباشد كه شركت كنندگاني را
كه تمكين رضايت بخشي خواهند داشت نيز حذف كند.
دوره
درگيرسازي ممكن است براي افزايش نسبت شركت كنندگان
در مطالعه كه مداخله و روش هاي پيگيري را رعايت ميكنند طرح مفيدي باشد. در آغاز
مطالعه، تمام شركت كنندگان روي دارونما گذاشته ميشوند. بعدا در زماني خاص (معمولا چند هفته)، آن هايي كه مداخله را
رعايت كرده اند بطور كور تقسيم تصادفي ميشوند كه دريافت دارونما را ادامه دهند يا شروع به دريافت داروي فعال
كنند. در اين شيوه، قبل از تقسيم تصادفي با حذف شركت كنندگاني كه تمكين نميكنند
ميتوان قدرت مطالعه را افزايش داد و برآورد بهتر اثرات كلي مداخله را ممكن ساخت.
ولي معلوم نيست آيا قبل از تقسيم تصادفي درگيرسازي دارونما موثرتر است يا لزوم
تكميل يك يا چند مراجعه غربالگري.
نوعي طرح درگير سازي در شكل 1 نشان داده شده است كه در دوره درگيرسازي بجاي
دارونما از داروي فعال استفاده ميشود. در طرح درگيرسازي داروي فعال علاوه بر
افزايش تمكين دربين شركت كنندگان، افرادي انتخاب ميشوند كه مداخله را تحمل ميكنند
و به آن پاسخ ميدهند. از پاسخ به يك متغير سرراهي (يعني متغيري كه بين مداخله و
پيامد قرار دارد)، به عنوان معيار تقسيم تصادفي استفاده ميشود. براي مثال، در يك
كارآزمايي اثر داروي ضد آريتمي بر ميرايي، پژوهشگر ممكن است تنها شركت كنندگاني را
تقسيم تصادفي كند كه آريتمي آنها بدون اثرات جانبي بطور رضايت بخش فروكش كرده است
(4). اين طرح با افزايش نسبت افراد گروه مداخله كه به مداخله پاسخ ميدهند، قدرت
را به حداكثر ميرساند. همچنين با تقليد از تمايل پزشك به ادامه مصرف يك دارو،
تنها وقتي كه وي شواهدي دال بر اينكه كار ميكند را ميبيند، قابليت تعميم اصلاح
ميشود. وقتي افرادي كه مداخله را تحمل نميكنند يا پاسخ نميدهند از يك كارآزمايي
حذف شوند، نتايج به كساني كه حذف شده اند قابل تعميم نميباشد.
همچنين، ممكن است ميزان اثرات جانبي در بين آنهايي كه عضوگيري شده اند كمتر از آن ميزان در بين تمام آن
هايي باشد كه روي مداخله گذاشته شده اند. در كارآزمايي اثر كاروديلول (Carvedilol) بر ميرايي در
مبتلايان به نارسايي احتقاني قلب از يك دوره درگير سازي فعال دو هفته اي استفاده
شد. در طي درگيرسازي، نارسايي احتقاني قلب 17 نفر بدتر شد و 7 نفر جان خود را از
دست دادند (5). اين افراد در كارآزمايي تقسيم تصادفي نشدند، و اين اثرات معكوس درمان دارويي به
عنوان پيامد در نظر گرفته نشد.
اغلب در انتخاب مقياس پيامد، پژوهشگر مجبور است بين مناسبت باليني با قابليت
اجرا و هزينه تعادل برقرار كند.
|
|
مقياس هاي از نظر باليني مرتبط، نظير مرگ، سكته قلبي، بستري شدن در بيمارستان
و كيفيت زندگي، پرمعني تـريـن پيامدهاي كارآزمايي ها هستند. از نشانگرهاي جايگزين
براي خطر پيامد، نظير كلسترول براي خطر بيماري عروق تاجي قلب، وقتي استفاده ميشود
كه آزمودن يك داروي جديد در مراحل به نسبت اوليه است و منابع براي يك مطالعه بزرگ
با پيامدهاي باليني، خيلي محدود است. نشانگرهاي جايگزين حداقل بايد مقبوليت
بيولوژيكي داشته باشند و با پيامد مورد نظر رابطه داشته باشند، براي مثال، معمولا
از چگالي استخوان به عنوان جايگزيني براي خطر شكستگي استفاده ميشود، زيرا نشان
داده شده كه چگالي كم استخوان در استئوپروز با افزايش خطر شكستگي همراه است. ولي
ثابت نشده، در آن هايي كه درمان باعث تغييرات مطلوب در نشانگر جايگزين ميشود،
پيامدهاي باليني بهتري ايجاد خواهند كرد. متاسفانه، نمونه هاي بسياري از كارآزمايي ها وجود دارند كه از
نشانگرهاي جايگزين براي پيامدهاي باليني استفاده شده و يافته هاي گمراه كننده
ايجاد نموده اند. براي مثال، چندين مطالعه نشان داده اند كه آريتمي بطني در
مبتلايان به سكته قلبي، خطر مرگ را افزايش ميدهد. كارآزمايي هاي بعدي نيز نشان
داده اند كه داروهاي خاصي ميتوانند آريتمي بطني را سركوب كنند (پيامد
جايگزين) متاسفانه، كارآزمايي سركوب
آريتمي قلبي (Cardiac Arrhythmia Suppression Trial] CAST]]) نشان داد كه
هرچند اين داروها دفعات آريتمي شديد را كم ميكنند، ميزان ميرايي در بيماران درمان
شده بالاتر بود (4).
مقياس پيامد بايد طوري باشد كه بتوان بطور صحيح و دقيق آن را ارزيابي كرد. وزن
نوزاد در هنگام تولد مثالي از يك پيامد است كه اين معيارها را دارد، مثال ديگري كه
اين معيارها را ندارد، ناتواني مادرزادي در يادگيري است، يك متغير رفتاري كه
انتهاي نامشخص يك طيف را بيان ميكند.
متغيرهاي وابسته پيوسته اين مزيت را بر متغيرهاي دو حالتي دارند كه قدرت مطالعه را زياد ميكنند،
در نتيجه به اندازه نمونه كوچك تري نياز دارند.
اگر يك پيامد دو حالتي غيرقابل اجتناب باشد، قدرت مطالعه بيشتر به تعداد
رويدادها بستگي دارد تا به تعداد كل شركت كنندگان (6). براي مثال، در كارآزمايي مطالعه
قلب و جايگزيني استروژن، قدرت مطالعه با 2763 زن شركت كننده در كارآزمايي تعيين
نشد، بلكه با 348 نفري كه پيامد اصلي (سكته قبلي غيركشنده يا مرگ از بيماري عروق
تاجي قلب) را تجربه كردند، تعيين شد (2). يك پيامد دو حالتي شايع تر، نظير سندرم
بيماري عروق تاجي حاد (سكته قلبي غيركشنده، مرگ از بيماري عروق تاجي، و بستري براي
آنژين ناپايدار) كه در568 زن روي داد، را ميتوان با قدرت به مراتب بيشتري آزمود.
اغلب داشتن چندين متغير وابسته كه جنبه هاي مختلف پديده مورد نظر را اندازه ميگيرند
مطلوب است. در كارآزمايي مطالعه قلب و استروژن جايگزين، رويدادهاي بيماري عروق
تاجي قلب به عنوان نقطه فرجام اصلي انتخاب شد. تمام سكته هاي قلبي غيركشنده، مرگ
از بيماري عروق تاجي قلب، رگ دار شدن مجدد، بستري بخاطر آنژين ناپايدار و نارسايي
احتقاني قلب، سكته مغزي و حمله گذراي كم خوني، رويدادهاي ترومبوآمبولي وريدي و
تمام علل مرگ بررسي شدند و قضاوت شد اين متغيرها اثرات قلبي عروقي هورمون درماني
را بهتر توصيف ميكنند (3). ولي براي برنامه ريزي اندازه نمونه و دوره مطالعه و
براي اجتناب از مسائل تفسير آماري فرضيه هاي چندگانه يك نقطه فرجام اصلي واحد
طراحي شد.
بيشتر پيامدهايي كه افراد گزارش ميكنند، نظير سابقه سكته مغزي يا ترك سيگار
صددرصد درست نيست. گزارش فردي پيامدها كه براي كارآزمايي مهم است بايد در صورت
امكان تاييد شود. معمولا، معيارهاي قضاوت در باره رويداد بيماري نظير سكته مغزي،
عبارتند از (الف) ايجاد معيارهاي شفاف براي پيامد (نقص جديد نرولوژيك با ضايعه
مشابه توموگرافي رايانه اي يا اسكن تصويربرداري مغناطيسي)، (ب) گردآوري مدارك
باليني لازم براي ارزيابي (خلاصه ترخيص و گزارش هاي پرتونگاري)، و (ج) هر مورد
بالقوه توسط خبرگان بررسي و قضاوت شود آيا معيارهاي تشخيصي در نظر گرفته شده اند
يا خير. آن هايي كه اطلاعات را گردآوري ميكنند و در باره موارد داوري مينماييد
بايد از تخصيص درمان بي اطلاع باشند.
پژوهشگر بايد مقياس هايي را براي پيامد در نظر بگيرد كه رويداد اثرات مضر را
كه ناشي از مداخله ميباشند، تشخيص دهد. يكي از هدف هاي اصلي اغلب كارآزمايي هاي
باليني، حتي آن هايي كه درمان هاي به ظاهر بي ضرر، نظير يك برنامه آموزش بهداشت را
ميآزمايند اين است كه آيا اثرات مفيد يك مداخله بر اثرات مضر آن ميچربد يا خير.
طيف اثرات مضر ميتواند از علائم به نسبت جزيي نظير بثورات پوستي يا رويدادهاي
شبه آنفلوآنزا، تا عوارض شديد و مرگبار باشد. پژوهشگر بايد اين مسئله را در نظر
بگيرد كه هم ماهيت فرجام و هم اندازه نمونه لازم براي تشخيص اثرات مضر ممكن است
متفاوت از آن هايي باشد كه براي تشخيص منافع است. متاسفانه، معمولا تشخيص اثرات
جانبي كمياب، بدون توجه به اينكه كارآزمايي چقدر بزرگ است، غيرممكن است و تنها پس
از آنكه آن مداخله بطور وسيع استفاده شد، ميتوان به آن پي برد.
اگر اثرات بالقوه مضر يك درمان جديد معلوم نباشد، پژوهشگر بايد در مراحل اوليه
آزمودن درمان جديد پرسش هايي وسيع و باز راجع به تمام انواع اثرات بالقوه مضر
بنمايد. در كارآزمايي هاي بزرگ، ارزيابي و كد گذاري تمام رويدادهاي بالقوه مضر ميتواند
خيلي گران و وقت گير، با نتايج مهم كم باشد. پژوهشگران بايد ضمن ارزيابي كافي زيان
هاي بالقوه مداخله راهكارهايي براي به حداقل رساندن اين بار اضافي در نظر گيرند.
براي مثال، رويدادهاي شايع، نظير عفونت دستگاه تنفسي، و اختلال هاي گوارشي را ميتوان
در زير مجموعه اي از شركت كنندگان يا در يك زمان محدود بررسي كرد. رويدادها يا
اثرات بالقوه مضر مهم كه بخاطر پژوهش هاي قبلي مورد انتظارند را ميتوان با پرسش
هاي خاص بطور صحيح تر و موثرتر بررسي كرد. براي مثال، چونكه رابدوميوليزيس (Rhabdomyolysis) يك اثر جانبي گزارش شده درمان با استاتين ها است، بايد در هر
كارآزماييِ يك استاتين جديد علائم و نشانه هاي ميوزيت پرسيده شود. هرگاه از داده
هاي يك كارآزمايي براي تصويب يك داروي جديد استفاده ميشود، طرح كارآزمايي بايد
انتظارهاي قانوني براي گزارش رويدادهاي مضر را برآورده سازد.
معمولا تحليل آماري فرضيه اصلي يك كارآزمايي باليني، آسان است. اگر پيامد دو
حالتي است، ساده ترين روش، مقايسه نسبت هاي گروه هاي مطالعه بااستفاده از آزمون
مجذور كاي است. وقتي پيامد پيوسته است از آزمون t ، يا اگر توزيع پيامد طبيعي نباشد، از روش غيرپارامتري
ميتوان استفاده كرد. در بيشتر كارآزمايي هاي باليني دوره پيگيري هر شركت كننده
متفاوت است، كه استفاده از روش هاي بقا را ضروري ميكند. مدل هاي آماري پيچيده تر،
نظير تحليل مخاطرات نسبي كاكس، ميتوانند آن را تكميل نمايند و بطور همزمان توزيع
هاي نامناسب شانسي متغيرهاي مخدوش كننده در آغاز مطالعه را تطبيق نمايند. جزئيات
فني اين روش ها و نحوه و زمان استفاده از آن ها در كتاب هاي ديگر شرح داده شده است
(7).
دو موضوع مهم كه در تحليل يافته هاي كارآزمايي باليني بايد در نظر گرفته شوند
عبارتند از برتري روش تحليل با قصد درمان و نقش كمكي تحليل هاي زير ـ گروهي.
براي تحليل، پژوهشگر بايد تصميم بگيرد با "تقاطع
ها" چه كند. يعني شركت كنندگاني كه
به گروه درمان فعال تخصيص يافته اند و درمان را مصرف نميكنند يا آن را ادامه نميدهند
و آن هايي كه به گروه شاهد تخصيص يافته اند و سرانجام درمان فعالي ميگيرند. تحليل
با قصد درمان پيامدها را براساس تخصيص تصادفي هر مورد مقايسه ميكند، بدون توجه به
اينكه مداخله تخصيص يافته را گرفته است يا خير. تحليل هاي با قصد درمان ممكن است
اثر كامل درمان راكمتراز حد برآورد نمايند، ولي در كارآزمايي هاي باليني در مقابل
علل مهم تر نتايج سوگرا در كارآزمايي هاي باليني محافظت ايجاد ميكنند.
راه ديگري براي تحليل هاي با قصد درمان اين است كه تنها كساني در تجزيه و
تحليل وارد شوند كه مداخله را رعايت كرده اند. براي مثال براي انجام تحليل هاي
تمام مدت منشور تنها شركت كنندگاني در هر دو گروه در نظر گرفته ميشوند كه بيش از
80% داروي تحت مطالعه تخصيص يافته خود را دريافت كرده اند يا تنها آنهايي كه قابل
ارزيابي هستند (يعني، نسبت معيني از داروي مطالعه را گرفته اند، نسبت معيني از
مراجعه ها را انجام داده اند و تجاوزهاي ديگري از منشور نداشته اند). اين كار به
نظر معقول ميرسد، زيرا افراد تنها هنگامي كه در واقع تحت مداخله قرار گيرند ميتوانند
تحت تاثير واقع شوند، ولي مسئله اين است كه تمكين كنندگان ممكن است با كساني كه
تمكين نميكنند به جهاتي كه ميتواند بر پيامد موثر باشد، متفاوت باشند. در
كارآزمايي مداخله هاي استروژن ـ پروژستين پس از يائسگي، 875 زن يائسه بطور تصادفي
به چهار رژيم استروژن يا استروژن به اضافه پروژستين مختلف و دارونما تخصيص يافتند
(8). پس از 3 سال 30% زناني كه بدون مخالفت به گروه استروژن تخصيص يافته بودند
بخاطر هيپرپلازي آندومتر، كه منادي سرطان آندومتر است، درمان را قطع كردند. اگر
اين زنان از تحليل تمام مدت منشور حذف شوند، ممكن است رابطه درمان استروژن و سرطان
آندومتر ديده نشود.
عيب عمده روش تحليل با قصد درمان اين است كه شركت كنندگاني كه انتخاب شده اند
تا مداخله تخصيص يافته را نگيرند، كم و بيش در برآورد اثرات آن مداخله منظور ميشوند.
در نتيجه قطع يا تقاطع قابل توجه بين درمان ها باعث ميشود كه تحليل هاي با قصد
درمان اندازه تاثير درمان را كمتر از حد برآورد نمايند. به اين دليل، اغلب، يافته
هاي كارآزمايي ها را با هر دو روش تحليل با قصد درمان و تحليل تمام مدت منشور
ارزيابي ميكنند. اگر نتايج هر دو تحليل متفاوت باشد، اعتماد به نتيجه گيري هاي از
كارآزمايي زياد ميشود. اگر نتايج هر دو تحليل متفاوت باشد، معمولا يافته هاي
تحليل هاي با قصد درمان برتر هستند، زيرا ارزش تقسيم تصادفي را حفظ ميكنند، و بر
خلاف تحليل هاي تمام مدت منشور، تنها ميتوانند برآورد اثر را در جهت محافظه
كارانه (به نفع فرضيه صفر) سوگرا نمايند. تنها وقتي كه سنجش هاي پيگير كامل باشند
بدون توجه به اينكه شركت كنندگان درمان را رعايت كرده اند يا خير ميتوان يافته ها
را به هر دو طريق تحليل نمود.
تحليل
هاي زير ـ گروهي به صورت مقايسه بين گروه هاي تقسيم
تصادفي شده در زير ـ مجموعه اي از همگروه كارآزمايي تعريف ميشود. اين تحليل ها از
شهرت دوگانه اي (هم خوب و هم بد) برخوردارند، زيرا به آساني از آن ها سوء استفاده
ميشود و ميتوانند به نتيجه گيري هاي اشتباه منجر شوند. با اين حال، درصورت دقت،
ميتوانند اطلاعات كمكي مفيدي فراهم نموده و استنتاج هاي ممكن از يك كارآزمايي
باليني را بسط دهند. براي حفظ ارزش تقسيم تصادفي، زير ـ گروه ها بايد بر اساس سنجش
هايي كه قبل از شروع درمان طبقه بندي شده اند تعريف شوند. براي مثال، يك كارآزمايي
آلندورنات (Alendronate) براي پيشگيري
ازشكستگي هاي استئوپروزي به اين نتيجه رسيد كه دارو خطر شكستگي را در بين زنان با
چگالي استخوان كم 14% كاهش ميدهد. تحليل هاي از قبل برنامه ريزي شده بر حسب زير ـ
گروه هاي چگالي استخوان كه در آغاز مطالعه اندازه گيري شده بود نشان داد در زناني
كه چگالي استخوان آن ها بيش از 5/2 انحراف معياركمتراز طبيعي بود، درمان موثر بوده
است (36% كاهش خطر شكستگي)P<0/01 در مقابل، در زنان با چگالي استخوان بيشتر در آغاز مطالعه، درمان
موثر نبود (9). ذكر اين نكته مهم است كه ارزش تقسيم تصادفي در هر يك از زيرـ گروه
هاحفظ شده است. ميزان شكستگي در زنان تقسيم تصادفي شده به آلندرونات باميزان در
زناني كه به دارونما تقسيم تصادفي شده بودند در هر زير ـ گروه مقايسه شد، آن هايي
كه چگالي استخوان كم داشتند (با سنجش هايي كه قبل از تقسيم تصادفي انجام شده بود
تعريف شد( و آن هايي كه چگالي استخوان زيادتر داشتند با هم مقايسه
شدند.
ولي تحليل هاي زير ـ گروهي به چند دليل باعث ايجاد يافته هاي گمراه كننده ميشوند.
طبق تعريف، زير ـ گروه ها ازكل جمعيت كارآزمايي كوچكترند و ممكن است براي يافتن
تفاوت هاي مهم قدرت كافي نداشته باشند. وقتي قدرت كافي براي يافتن يك تاثير وجود
ندارد، پژوهشگران بايد از اين ادعا كه دارو درزير ـ گروه "موثرنبوده"
خودداري كنند. پژوهشگران اغلب يافته ها را درتعداد زيادي از زير ـ گروه ها بررسي
ميكنند و احتمال يافتن شانسي تاثير متفاوتي از مداخله در يك زير ـ گروه افزايش مييابد.
بطور مطلوب، تحليل هاي زير ـ گروه هاي برنامه ريزي شده بايد قبل از آغاز كارآزمايي
تعريف شوند و تعداد زير ـ گروه هاي تجزيه و تحليل شده بايد همراه با يافته هاي مطالعه
گزارش شوند. در يك روش محافظه كارانه لازم است ادعاهاي راجع به پاسخ هاي مختلف در
زير ـ گروه ها با شواهد آماري مبني بر اين كه بين درمان و ويژگي زير ـ گروه تعامل
وجود دارد، حمايت شود. براي مثال، در مطالعه الندرونات تعامل معني داري بين چگالي
استخوان در آغاز مطالعه و تاثير درمان بر خطر شكستگي يافت شد (P<0/01) و از اين نتيجه گيري حمايت كرد كه
الندرونات در زنان مبتلا به استئوپروز موثر است، ولي در زنان با چگالي استخوان
بيشتر موثر نيست.
تحليل هاي زير ـ گروهي بر اساس عوامل پس از تقسيم تصادفي از ارزش تقسيم تصادفي
حفاظت نميكنند و اغلب يافته هاي گمراه كننده ايجاد ميكنند. تحليل تمام مدت منشور
كه به افرادي محدود ميشود كه درمان تقسيم تصادفي شده را رعايت ميكنند مثالي از
اين نوع تحليل زير ـ گروهي است.
چرا يك كارآزمايي باليني را پايش ميكنيم ؟ يك تفاوت مهم بين كارآزمايي هاي
باليني و مطالعه هاي مشاهده اي اين است كه در كارآزمايي باليني عملي روي شركت كنندگان
انجام ميشود. به دلايل اخلاقي، پژوهشگر بايد مطمئن شود كه شركت كنندگان در معرض
يك مداخله زيانبار قرار نميگيرند، از يك مداخله مفيد مضايقه نميشود، يا اگر پرسش
پژوهشي را نميتوان پاسخ داد كارآزمايي ادامه نمييابد.
مبرم ترين دليل پايش كارآزمايي هاي باليني اين است كه مطمئن شويم مداخله بطور
غيرمنتظره زيان آور نباشد. اگر زيان ها بر منافع بچربند، كارآزمايي بايد متوقف
شود. دوم، اگر مداخله موثرتر از آني باشد كه هنگام طراحي كارآزمايي برآورد شده
بود، آنگاه منفعت را ميتوان زود در كارآزمايي مشاهده كرد. هر گاه منفعت معلومي
ثابت شده باشد، ادامه كارآزمايي و تاخير در ارائه مداخله به شركت كنندگاني كه روي
دارونما هستند و افراد ديگري كه ميتوانند از آن سود ببرند، ممكن است اخلاقي
نباشد. سوم، اگر امكان پاسخ دادن به پرسش پژوهش وجود ندارد، ادامه شركت افراد در
يك كارآزمايي كه به زمان و تلاش نياز دارد و ممكن است باعث ناراحتي يا خطر شود،
غيراخلاقي است. اگر يك كارآزمايي براي 5 سال برنامه ريزي شده ولي پس از 4 سال
تفاوت اندكي در ميزان رويدادهاي پيامد در گروه هاي درمان شده و درمان نشده وجود
داشته باشد، آنگاه "قدرت شرطي" (احتمال پاسخ به پرسش پژوهشي بانتايج
حاصل) خيلي كوچك ميشود و براي توقف كارآزمايي بايد اقدام كرد. به علاوه، چون كه
كارآزمايي هاي باليني پر هزينه هستند، توقف آن ها به محض يافتن پاسخ پرسش هزينه ها
را كم ميكند.
قبل از خاتمه يك كارآزمايي خاص، ممكن است كارآزمايي هاي ديگر به پرسش پژوهشي
پاسخ دهند. مطلوب آن است، كه بيش از يك كارآزمايي شواهدي راجع به پرسش پژوهشي خاص
فراهم كنند، ولي اگر حين كارآزمايي شواهد قطعي در اختيارقرار گيرد، پژوهشگر بايد
توقف كارآزمايي را در نظر بگيرد. در برنامه ريزي هر كارآزمايي بايدنحوه انجام پايش
ضمني منظور شود. قبل از شروع مطالعه بايد رهنمودها و روش هاي پايش بطور مكتوب شرح
داده شوند. نكاتي كه در اين رهنمودها در نظر گرفته ميشوند در جدول 2 ارائه شده
اند.
هميشه توقف كارآزمايي بايد با تصميم به دقت سنجيده شده اي انجام شود، بطوري كه
مسئوليت هاي اخلاقي نسبت به شركت كنندگان و پيشرفت علمي دانش را متعادل كند. هر
گاه يك كارآزمايي زود خاتمه يابد، شانس بدست آوردن يافته هاي قطعي تر از بين ميرود.
اغلب تصميم گيري پيچيده است و بايد خطرهاي بالقوه براي شركت كنندگان در مقابل
منافع احتمالي سنجيده شود. بنابراين، لازم است كميته اي كه كارآزمايي را پايش ميكند
شامل پزشكان، طرفداران شركت كنندگان، آمارشناسان و خبرگان در انجام كارآزمايي ها
باشد. بطور طبيعي اين خبرگان از خارج از كارآزمايي هستند و در كارآزمايي، در گير
نميباشند، در نتيجه منافع شخصي يا مالي در ادامه آن ندارد.
|
عناصرپايش عضوگيري تمكين تقسيم تصادفي كورسازي پيگيري متغيرهاي مهم پيامدها
اثرات
زيان آور مخدوش
كنندگان بالقوه چه كسي پايش خواهد كرد اگر كارآزمايي كوچك با خطر
جزيي، پژوهشگران كارآزمايي در غير اين صورت هيئت مستقل پايش داده ها تغيير منشور در اثر پايش ختم كارآزمايي اصلاح كارآزمايي توقف شاخه
اي از كارآزمايي افزودن
سنجش هاي جديد لازم براي پايش ايمني ادامه
ندادن شركت كنندگان پر خطر بسط به
موقع كارآزمايي افزايش
نمونه كارآزمايي هرچند وقت يك بار پايش انجام ميشود به اندازه
كافي تا به هدف هاي پايش برسيم تنها تا
وقتي كه داده هاي جديد قابل توجهي وجود دارد روش هاي آماري براي پايش |
در توقف يك كارآزمايي، آزمون هاي معني داري آماري اطلاعات مهم، ولي غير قاطع
فراهم ميكنند. ثبات روندهاي زماني بايد ارزيابي شوند، ثبات تاثيرات بر پيامدهاي
مربوطه بايد ارزيابي شوند، و تاثير توقف زود مطالعه بر اعتبار يافته ها بايد به
دقت در نظر گرفته شود (مثال 1).
براي پايش يافته هاي ضمني يك كارآزمايي روش هاي آماري زيادي وجوددارد. تحليل
مكرر يافته هاي يك كارآزمايي نوعي آزمودن چندگانه است و در نتيجه احتمال ارتكاب
خطاي نوع اول را افزايش ميدهــد. بـراي
|
مطالعه
كانادايي ضد انعقاد فيبريلاسيون دهليزي (10) : فيبريلاسيون دهليزي يك عامل خطر سكته مغزي و رويدادهاي
آمبولي است. مطالعه كانادايي ضد انعقاد فيبريلاسيون دهليزي يك كارآزمايي دو
سوكور، تقسيم تصادفي شده، با شاهد دار و نما، براي ارزيابي تاثير وارفارين (Warfarin) دركاهش ميزان
سكته مغزي، آمبوليسم سيستميك، يا خونريزي داخل مغزي يا كشنده در مبتلايان به
فيبريلاسيون دهليزي غير روماتيسمي بود. مطالعه طراحي شده بود تا 660 بيمار را در
نظر بگيرد و آن ها را براي 5/3 سال تحت درمان پيگيري كند. در طي كارآزمايي (پس
از اينكه 383 بيمار تقسيم تصادفي شدند و براي ميانگين 2 سال پيگيري شدند(، يافته
هاي دوكارآزمايي تقسيم تصادفي شده ديگر گزارش گرديد و كاهش معني داري در
رويدادهاي آمبولي و ميزان كمتري از رويدادهاي خون ريزي دهنده عمده در مبتلايان
به فيبريلاسيون دهليزي كه با وارفارين درمان شده بودند را نشان داد. كميته رهبري
مطالعه كانادايي ضد انعقاد فيبريلاسيون دهليزي تصميم گرفت كه شواهد دال بر
سودوارفارين به اندازه كافي ميباشد تا بدون بررسي مقدماتي داده ها كارآزمايي
متوقف شود. كارآزمايي
سركوب آريتمي قلبي (4):
رويداد دپولاريزاسيون نارس بطني در زنده ماندگان ازسكته قلبي يك عامل خطر مرگ
ناگهاني است. كارآزمايي سركوب آريتمي قلبي تاثير درمان ضد آريتمي (اينكائنيد [Encainide]، فلكائنيد [Flecainide]، يا موري سيزين [Moricizine]( را در مبتلايان
به آريتمي بطني بدون علامت يا با علائم خفيف پس از سكته قلبي بر خطر مرگ ناگهاني
ارزيابي كرد. پس از متوسط 10 ماه پيگيري، افرادي كه با داروي فعال درمان شده
بودند در مقايسه باآن هايي كه به دارونما تخصيص يافته بودند ميرايي كلي بيشتري
(5/7% در مقابل 3% ( و ميزان هاي مرگ از آريتمي بيشتري
(5/4% در مقابل 5/1% ( داشتند. برنامه
ريزي شده بود كه كارآزمايي تا 5 سال ادامه يابد، ولي پس از 18 ماه متوقف شد. پروژه
داروي كرونر (11، 12): پروژه
داروي كرونر يك كارآزمايي تقسيم تصادفي، و كورسازي شده براي تعيين اين بود كه
آيا 5 مداخله مختلف پايين آورنده كلسترول (استروژن كونژوگه، 5 ميلي گرم درروز،
استروژن 5/2 ميلي گرم در روز، كلوفيبرات 8/1 گرم در روز، دكستروتيروكسين 6 ميلي
گرم درروز، نياسين 3 گرم در روز( ميزان ميرايي 5
ساله را كاهش ميدهد يا خير. پروژه داروي كرونر 8341 مرد مبتلا به سكته قلبي را
كه حداقل براي 5 سال پيگيري ميشدند در نظر گرفت. پس از متوسط 18 ماه پيگيري،
بخاطر سكته قلبي غيركشنده اضافي (2/6% درمقايسه با 2/3% ( و رويدادهاي
ترومبوآمبولي وريدي (5/3% درمقايسه با 5/1% ( شاخه دوز بالاي
استروژن متوقف شد. اين تصميم گيري با اين حقيقت تقويت شد كه استروژن بالا با
آتروفي بيضه اي، ژينكوماستي، حساسيت پستان ها، و كاهش ميل جنسي نيز همراه است.
در همان زمان، دكستروتيروكسين در زير ـ گروه مرداني كه در نوار قلبي پايه ضربان
بطني نارس مكرر نشان داده بودند متوقف شد، زيرا ميزان مرگ در اين زير ـ گروه 5/38%
در مقايسه با 5/11% در زير ـ گروه مشابهي كه دارونما دريافت ميكردند بود. به زودي
پس از آن درمان دكستروتيروكسين بخاطرميزان ميرايي اضافي درگروه تحت درمان در
تمام افراد متوقف شد. دو سال قبل از پايان برنامه ريزي شده مطالعه، شاخه 5/2
ميليگرم استروژن در روز نيز بخاطر عدم وجود شواهدي دال بر تاثير مفيد و افزايش
خطر رويداد ترومبوآمبولي وريدي در مردان تحت درمان متوقف شد. مطالعه سلامت پزشكان (13): مطالعه سلامت پزشكان يك كارآزمايي
تصادفي شده تاثيرآسپيرين (325 ميلي گرم يك روز در ميان( بر ميرايي از
بيماري قلبي ـ عروقي بود. كارآزمايي پس از 8/4 سال از 8 سال پيگيري برنامه ريزي
شده متوقف گرديد. درگروه تحت درمان كاهش معني داري از سكته قلبي وجود داشت
(خطرنسبي براي سكته قلبي غيركشنده = 56/0)، ولي تعداد مرگ هاي ناشي از بيماري
قلبي عروقي در هر دو گروه مساوي بود. ميزان مرگ از بيماري قلبي عروقي كه در
مطالعه مشاهده شد خيــلي كمتــر از حد انتظار بــود (88 پس از 5/4 سال پيگيري در
مقابل 733 مورد انتظار( و كارآزمايي
بخاطر قدرت شرطي براي كشف اثر مطلوب درمان آسپيرين بر مرگ از بيماري قلبي عروقي
كه به سطح بسيار پاييني افت كرد، متوقف شد. |
مثال، اگر
براي هر آزمون از05/0 = α استفاده شود و در
طي كارآزمايي چهار مرتبه و در پايان يك مرتبه يافته ها تحليل شوند، احتمال ارتكاب
خطاي نوع اول به حد 14% افزايش مييابد
(14). براي حل اين مسئله، معمولا روش هاي آماري براي پايش ضمني، α را براي هر آزمون (αi) كاهش ميدهد، بطوري كه كل آلفا مساوي 05/0 شود. براي
تصميم گيري درباره " نحوه مصرف α" روش هاي متعددي وجود دارد.
انواعي از كارآزمايي هاي تقسيم تصادفي شده كلاسيك وجود دارند كه در صورت مساعد بودن شرايط مفيدند.
هدف هاي طرح فاكتوريل پاسخ دادن به دو موضوع پژوهشي مجزا با يك همگروه واحد از شركت كنندگان
است (شكل 2). يك مثال خوب مطالعه سلامت پزشكان است كه براي آزمودن اثر آسپيرين بر
سكته قلبي و اثر بتاكاروتن بر سرطان، طراحي شده بود (15). شركت كنندگان بطور
تصادفي به چهار گروه تقسيم شدند، ولي هر يك از دو فرضيه را ميتوان با مقايسه دو نيمه
از همگروه تحت مطالعه آزمود. نخست، تمام كساني كه روي آسپيرين بودند با تمام كساني
كه روي دارونماي آسپيرين بودند مقايسه شدند (بدون توجه به اين حقيقت كه نصف هر يك
از اين گروه ها بتاكاروتن دريافت ميكردند(، سپس تمام كساني
كه روي بتاكاروتن بودند با تمام كساني كه روي دارونماي بتاكاروتن بودند مقايسه
شدند (اكنون بدون توجه به اين حقيقت كه نصف از هر يك از اين گروه ها آسپيرين ميگرفتند(. پژوهشگر دو
كارآزمايي كامل را به قيمت يك كارآزمايي تمام ميكند.
طرح فاكتوريل فوق العاده موثر است. محدوديت عمده آن احتمال تعامل بين درمان ها
و پيامدها است. در مثال فوق، هر تاثير بتاكاروتن بر سكته قلبي پيامد نصف شركت
كنندگاني را كه آسپرين دريافت ميكنند تغيير خواهد داد، قدرت را كم و تفسير را
مشكل خواهد نمود.
طرح هاي فاكتوريل در واقع ميتوانند براي مطالعه چنين تعامل هايي بكارروند،
ولي اين كارآزمايي ها به نمونه هاي با حجم زياد نياز دارند، پيچيده تر هستند و
اجراي آن ها مشكل تر است و تفسير نتايج مشكل ميباشد. بهترين نقش طرح هاي فاكتوريل
در پژوهش باليني مطالعه دو موضوع پژوهشي به نسبت مستقل است.
تقسيم
تصادفي جفت هاي جور شده يك راهكار
براي متعادل نمودن متغيرهاي مخدوش كننده اوليه است كه مستلزم انتخاب جفت هاي
افرادي است كه براي عوامل مهمي نظير سن و جنس جور شده اند، سپس بطور تصادفي مشخص
ميكنيم كدام عضو هر جفت مي تواند به كدام گروه مطالعه تخصيص يابد. يك جنبه بويژه
جالب اين طرح اين است كه براي نشان دادن تفاوت اثرات درمان و شاهد در دو قسمت از
يك شخصي در يك زمان استفاده شود. براي مثال، در مطالعه رتينوپاتي ديابتي يك چشم هر
شركت كننده بطور تصادفي به درمان با فتوكواگولاسيون اختصاص يافت در حالي كه چشم
ديگر وي به عنوان شاهد عمل ميكرد (16).
تقسيم
تصادفي گروهي يا خوشه اي مستلزم اين
است كه پژوهشگر بجاي تقسيم تصادفي افراد، دسته ها يا گروه هاي افراد را كه بطور
طبيعي تشكيل ميشوند تقسيم تصادفي كند. يك مثال خوب كارآزمايي است كه بازيكنان 120
تيم بيسبال دانشكده را انتخاب كرد، و نصف تيم را بطور تصادفي به يك مداخله كه ترك
جويدن توتون را تشويق ميكرد تخصيص داد و ميزان بطور معني دار كمتري از جويدن
توتون را در بازيكنان تيمي كه مداخله را دريافت كرده بود مشاهده كرد (17). اعمال
مداخله در گروه هاي افراد ممكن است از مبادرت به درمان در يك يك افراد قابل اجراتر
و هزينه ـ تاثير بيشتري داشته باشد، و ممكن است موضوع هاي پژوهشي در خصوص اثرات
برنامه هاي بهداشتي را در جمعيت بهتر مشخص نمايد. اعمال برخي مداخله ها، نظير رژيم
غذايي كم چربي، در يك عضو خانواده بدون اعمال آن در ساير افراد خانواده مشكل است.
همين طور، شركت كنندگاني كه يك مداخله قابل انتقال را دريافت ميكنند ممكن است اين
توصيه را با آشناياني كه به گروه شاهد تخصيص يافته اند در ميان بگذارند. براي
مثال، پزشكي كه در يك مجتمع پزشكي كار ميكند و بطور تصادفي به يك مداخله آموزشي
تخصيص يافته است احتمال زيادي دارد اين مداخله را با همكارانش درميان بگذارد. يك
عيب تقسيم تصادفي گروهي اين واقعيت است كه برآورد اندازه نمونه و تجزيه و تحليل
هاپيچيده تر است (18).
كارآزمايي هايي كه گروه هاي تقسيم تصادفي نشده را باهم مقايسه ميكنند در
كنترل تاثير متغيرهاي مخدوش كننده خيلي كمتر از كارآزمايي هاي كورتصادفي شده رضايت
بخش هستند. متغيرهايي را كه در آغاز مطالعه اندازه گيري شده و بطور نامساوي بين دو
گروه مطالعه توزيع گرديده اند ميتوان با روش هاي تحليلي تطبيق كرد، ولي اين
راهكار مسئله متغيرهاي مخدوش كننده اندازه گيري نشده را در نظر نميگيرد. چالمرز
يافته هاي مطالعه هاي تقسيم تصادفي شده و نشده موضوع پژوهشي مشابهي را مرور كرد
(19)، حتي پس از تطبيق آماري براي اختلاف هاي متغيرهاي آغاز مطالعه، مزاياي ظاهري
مداخله در مطالعه هاي تقسيم تصادفي نشده خيلي زيادتر بود. اين مطالعه و تحليل هاي
ديگر (20) نشان ميدهند كه در مطالعه هاي باليني تقسيم تصادفي نشده مسئله مخدوش
شدن ميتواند جدي باشد و نميتوان با تطبيق آماري اثر آن ها را كاملا از بين برد.
گاهي افراد با يك مكانيسم شبه تصادفي به گروه هاي مطالعه تخصيص مييابند. براي
مثال، افراد يك در ميان (يا با شماره پرونده زوج) به گروه درمان اختصاص مييابند.
گاهي چنين طرح هايي مزاياي تداركاتي دارند، ولي قابليت پيشگويي تخصيص گروه مطالعه
به پژوهشگر اين امكان را ميدهد تا با دستكاري ترتيب تقدم و تاخر يا شايستگي
انتخاب افراد جديد در مداخله اعمال نفوذ كند.
گاهي، پژوهشگر بر طبق ضوابط باليني معيني افراد را به گروه هاي مطالعه اختصاص
ميدهد. براي مثال، بيماران ديابتي برحسب اينكه مايل باشند چهار تزريق در روز را
قبول كنند ممكن است براي دريافت چهار مرتبه انسولين در روز يا انسولين با اثر
طولاني يك مرتبه در روز تخصيص يابند.
مسئله اين است كساني كه مايل هستند چهار تزريق انجام دهند ممكن است توصيه هاي
بهداشتي ديگر را نيز بيشتر رعايت كنند و اين ميتواند علت هر اختلافي باشد كه در
پيامدهاي دو برنامه درماني مشاهده ميشود.
گاهي طرح هاي تقسيم تصادفي نشده بر اساس اين اعتقاد غلط كه اخلاقي تر هستند
انتخاب ميشوند. در واقع، تنهــا مطالعه هايي اخلاقي هستند كه آنقدر خوب طراحي شده
باشند تا احتمال معقول پاسخ صحيح دادن
|
|
|
|
به موضوع
پژوهشي را داشته باشند و طرح هاي تقسيم تصادفي شده بيش از طرح هاي تقسيم تصادفي
نشده احتمال دارد به نتيجه قطعي منجر شوند. به علاوه مبناي اخلاقي هر كارآزمايي
اين ابهام است كه آيا مداخله مفيد يا مضر است، ابهامي به نام تعادل (Equipoise) كه اگر قرار است اصلا كارآزمايي
انجام شود بايد وجود داشته باشد.
طرح هايي كه شامل تقسيم تصادفي نباشند، ميتوانند براي برخي از انواع پرسش ها
انتخاب مفيدي باشند (شكل 3). در يك طرح مجموعه زماني، براي ارزيابي اثر يك درمان هر شركت كننده به عنوان شاهد
خودش عمل ميكند. اين بدين معني است كه نه تنها ويژگي هاي ذاتي نظير سن، جنس و عوامل
ارثي متعادل شده اند (نظير مطالعه هاي بين گروهي) بلكه به عنوان متغيرهاي مخدوش
كننده در واقع حذف شده اند.
عيب عمده طرح هاي درون گروهي نبودن يك گروه
شاهد همزمان است. تاثير ظاهري مداخله ممكن
است ناشي از اثرات آموزشي (شركت كنندگان آزمون هاي عملكرد ادراكي را در پيگيري بهتر انجام ميدهند،
زيرا از آزمون آغازمطالعه آموخته اند)، بر گشت به ميانگين (افرادي كه به علت فشارخون بالا در آغاز مطالعه انتخاب شده
بودند به سادگي بخاطر بي ثباتي تصادفي در فشارخون در پيگيري معلوم شد فشارخون
پايين تري دارند)، يا روندهاي زماني (فراواني عفونت هاي تنفسي در پيگيري كمتر بود، چون كه كارآزمايي در فصل
آنفلوآنزا آغاز شده بود) باشد. گاهي طرح هاي درون گروهي از يك راهكار شروع و توقف
مكرر درمان استفاده ميكنند. اگر شروع و توقف مكرر روش هاي مداخله الگوي مشابهي در
پيامد ايجاد كند، از اين موضوع كه اين تغييرات ناشي از درمان است به شدت حمايت ميشود.
اين روش تنها وقتي مفيد است كه متغيّر وابسته نسبت به مداخله به سرعت و قابل برگشت
پاسخ دهد (براي مثال تاثير مصرف الكل برسطح ليپوپروتئين كلسترول پرچگالي).
طرح
ضربدري هم ويژگي هاي طرح هاي بين گروهي و هم
طرح هاي درون گروهي را دارد (شكل 4). نصف شركت كنندگان بطور تصادفي دوره شاهد را
شروع ميكنند و سپس به داروي فعال بر ميگردند، در حالي كه نصف ديگر به عكس عمل ميكنند.
اين روش (يا مربع لاتين براي بيش از دو گروه درماني) تحليل هاي بين گروهي و نيز
درون گروهي را مقدور ميسازد. مزاياي اين طرح قابل توجه است : احتمال مخدوش شدن را
به حداقل ميرساند، زيرا هم شركت كننده به عنوان شاهد خودش عمل ميكند و بطور قابل
توجهي قدرت كارآزمايي را زيادميكند بطوري كه شركت كنندگان كمتري نياز است. با اين
حال، معايب آن نيز قابل توجه است: دوره مطالعه را دو برابر ميكند و پيچيدگي تجزيه
و تحليل و تفسير ناشي از مسئله اثرات انتقالي به آن افزوده ميشود. اثر انتقالي تاثير باقيمانده مداخله
بر پيامد در طي دوره اي است كه مداخله قطع شده است.
براي مثال، پس از يك دوره درمان با داروي مدر (ديورتيك) فشارخون ممكن است ماه
ها به سطح اوليه باز نگردد. براي كاهش اثر انتقالي، پژوهشگر ميتواند يك دوره "پاكسازي" بدون درمان
را به اين اميد وارد كند كه متغير وابسته قبل از شروع مداخله بعدي به حالت طبيعي
برگردد، ولي دانستن اينكه آيا تمام اثرات انتقالي از بين رفته اند مشكل است. بطور
كلي، مطالعه هاي ضربدري تنها وقتي انتخاب مناسبي هستند كه تعداد افراد تحت مطالعه
محدود باشد و باور كنيم اثرات انتقالي مسئله اي نيست.
|
|
بطور كلي در صورت امكان به پرسش هاي پژوهشي بايد با كارآزمايي هاي تقسيم
تصادفي شده پاسخ داده شود. مزيت عمده يك كارآزمايي تقسيم تصادفي شده استعداد آن
براي كنترل تاثير متغيرهاي مخدوش كننده است و در نتيجه پاسخ هاي قطعي تر فراهم ميكند.
براي برخي پرسش هاي پژوهشي، يك كارآزمايي ممكن است سريع تر و كم هزينه تر از
مطالعه هاي مشاهده اي باشد، بويژه اگر متغير وابسته پيوسته باشد و به سرعت به
مداخله پاسخ دهد. براي مثال، نشان دادن رابطه بين چربي رژيم غذايي و كلسترول سرم
در يك مطالعه مشاهده اي مشكل است (بخاطر خطاهاي سنجش متغير رژيم غذايي)، ولي انجام
آن در يك كارآزمايي به نسبت آسان است. براي برخي پرسش هاي پژوهشي جهت كنترل مخدوش
كنندگان و اطمينان از اينكه منفعت آن بر خطرش ميچربد بوضوح يك كارآزمايي لازم
است. براي مثال، مطالعه هاي مشاهده اي مدام نشان داده اند افرادي كه بتا ـ كاروتن مصرف ميكنند خطر سرطان كمتري دارند،
ولي چهار كارآزمايي بزرگ اين منفعت را نيافتند (21)، يافته هاي مطالعه هاي مشاهده
اي ممكن است ناشي از مخدوش شدن باشد، زيرا افرادي كه ويتامين ها را مصرف ميكنند
ممكن است از آن هايي كه مصرف نميكنند بيشتر نگران سلامتي خود باشند.
به هر حال، كارآزمايي ها معمولا وقت گير و گران هستند و اغلب شركت كنندگان را
در معرض خطر يا ناراحتي قرار ميدهند. بنابراين، تا وقتي كه به اندازه كافي راجع
به مداخله بدانيم كه پيشنهاد كند يك كارآزمايي تعيين كننده مقدور است، كارآزمايي
ها نبايد انجام شوند. چنين اطلاعاتي شامل تعريف دقيق مداخله (درمان، مشاوره، روش
جراحي يا مقدار دارو، دوره و طريق مصرف)، سود احتمالي مداخله (براي برآورد اندازه
نمونه و دوره كارآزمايي) و اثرات زيان آور احتمالي مداخله (براي حفظ ايمني كافي
شركت كنندگان) ميباشند. هر گاه بخاطر فقدان تقسيم تصادفي، كورسازي، يا تعداد كافي
شركت كنندگان پاسخ قطعي بعيد باشد نبايد يك كارآزمايي باليني انجام داد.
1 ـ اگر تعداد قابل توجهي از شركت كنندگان در مطالعه مداخله تحت بررسي را دريافت نكنند منشور مطالعه را رعايت نكنند، يا در حين
پيگيري گم شوند، يافته هاي كارآزمايي احتمالا
كمتر از حد قدرت دارند، سوگرا هستند، يا غيرقابل تفسيرند.
2 ـ سنجش هاي ازنظرباليني مرتبط، نظير مرگ، سكته قلبي، بستري در بيمارستان و كيفيت زندگي، پرمعني ترين
پيامدهاي كارآزمايي ها هستند. پژوهشگر بايد تا حد ممكن، سنجش هاي پيامدي را در نظر
بگيرد كه رويداد اثرات زيان آور كه ممكن است ناشي از مداخله باشد، را پيدا كند.
3 ـ تحليل هاي با قصد درمان روش اصلي است كه مزيت كنترل مخدوش كنندگان را به وسيله تقسيم تصادفي دارد.
تحليل هاي تمام منشور، روش ثانويه اي است كه برآوردي از اندازه تاثير را در افراد رعايت كننده به
دست ميدهد، بايد با احتياط تفسير شوند.
4 ـ با دقت كافي، تحليل هاي زير ـ گروهي ميتوانند اطلاعات كمكي مفيدي فراهم نمايند و استنتاج حاصل
از يك كارآزمايي را بسط دهند. براي حفظ ارزش تقسيم تصادفي، زير ـ گروه ها بايد بر
اساس سنجش هايي تعريف شوند كه قبل از شروع درمان انجام شده اند، و تحليل هابايد
پيامدهاي بين زيرـ مجموعه هاي تخصيص تصادفي شده گروه هاي مطالعه را مقايسه كنند.
5 ـ تفاوت مهم بين كارآزمايي هاي باليني و مطالعه هاي مشاهده اي اين است كه در
يك كارآزمايي باليني، عملي روي شركت كنندگان انجام ميشود. پايش ضمني يك كارآزمايي بايد اطمينان دهد
كه شركت كنندگان با مداخله زيان آور مواجه نشده اند، مداخله مفيد دريغ نشده، يا در
صورتي كه نتوان پرسش پژوهشي را پاسخ داد كارآزمايي ادامه نيابد.
6 ـ چندين نوع
طرح كارآزمايي تقسيم تصادفي شده وجود دارند كه ميتوانند تحت شرايط مساعد كارآيي
را بطور قابل توجهي افزايش دهند.
الف) طرح فاكتوريل امكان اجراي دو كارآزمايي مستقل را به قيمت يك كارآزمايي فراهم ميكند.
ب) تقسيم تصادفي جفت هاي جور شده متغيرهاي مخدوش كننده آغاز مطالعه را متعادل ميكند.
ج) تقسيم تصادفي گروهي مطالعه موثر دسته هايي را كه بطور طبيعي وجود دارند ميسر ميسازند.
د) طرح هاي مجموعه زماني يك گروه
(تقسيم تصادفي نشده) دارد كه در طي دوره مداخله هاي مختلف پيامدهاي هر فرد را با
خودش مقايسه ميكند.
ه) طرح ضربدري اگر اثرات انتقالي مسئله اي
نباشند ميتوانند مخدوش كننده را كنترل كنند و اندازه نمونه را به حداقل برساند.
|
1) Chesnut CH, Silverman S , Andriano K, et al. A randomized trial of nasal spray salmon calcitonin in postmenopausal women with
established osteoporosis: the PROOF study. Am J Med, 2000; 109:330-331. 2) Cummings S., Chapurlat R.
What PROOF proves about calcitonin and
clinical trials. Am J Med, 2000; 109:267-276. 3) Hulley S, Grady D, Bush T, et al. Randomized trial of estrogen plus progestin for secondary prevention of coronary heart disease
in postmenopausal women. JAMA
1998; 280:605-13. 4) Preliminary report: effect of encainide and
felcainide on mortality in a randomized trial of arrhythmia
suppression after
myocardial infarction.
The Cardiac Arrhythmia Suppression Trial (CAST) Investigators. N Engl J Med
1989; 321:406-12. 5) Pfeffer M, Stevenson L. Beta - adrenergic blockers and survival in heart failure. N Engl J Med 1996;
334:1396-7. 6) Yusuf S, Collins R, Peto R. Why do we need some large, simple
randomized trials? Stat Med 1984; 3:404-20 7) Friedman LM, DeMets DL, Furberg C. Fundamentals of clinical trials, 3rd ed. St. Louis: Mosby-Year Book,
1996. 8) Writing Group for the PEPI
Trial. Effect of estrogen
or estrogen/progestin regimens on heart disease risk factors in postmenopausal women. JAMA 1995; 273:199-208. 9) Cummings S, Black D , Thompson D, et al. Effect of alendronate on
risk of fracture in women with low bone
density but without vertebral fractures: results from the Fracture Intervention Trial. JAMA
1998; 280:2077-82. 10) Laupacis A, Connolly SJ , Gent M, et al. How should results from completed studies influence ongoing
clinical trials? The CAFA Study
experience. Ann Intern Med 1991; 115:818-22. 11) The Coronar Drug Project. Initial findings leading to
modifications of its research
protocol. JAMA 1970; 214:1303-13.
12) The Coronary Drug Project. Findings leading to discontinuation of the 2.5mg day estrogen group. The coronary Drug Project Research Group. JAMA 1973; 226:652-7. 13) Findings from the aspirin component of the ongoing Physicians Health
Study. N Engl J Med 1988; 318:262-4.
14) Armitage P., McPherson C., Rowe B., Repeated significance test on
accumulation data. J R Stat Soc 1969; 132A:235-44. 15) Hennekens C, Eberlein K. A randomized Trlal of aspirin and
beta-carotene among U.S. physicians. Prev Med 1985; 14:165-8. 16) Diabetic Retinopathy Study
Research Group.
Preliminary report on: effects of
photocoagulation therapy. Am J Ophthalmol 1976; 81:383- 96. 17) Walsh M, Hilton J., Masouredis C., et al. Smokeless tobacco
cessation intervention for
college athletes: results after
1 year. Am J Pub Health 1999;89:
228-34. 18) Donner A, Birkett N, Buck C. Randomization by cluster: sample
size requirements and analysis.
Am J Epidemiol 1981; 114: 906-14.
19) Chalmers T, Celano P, Sacks H, et al. Bias in treatment assignment
in controlled clinical trials. N Engl J Med 1983; 309: 1358-61. 20) Pocock S. Current issues in the design and interpretation of clinical
trials. Br Med J 1985; 296: 39-42.
21) Marshall J. Beta-carotene: a miss for epidemiology. J Natl Cancer Inst 1999, 91: 2068-9. |