מומחה מוביל במתודולוגיית ניסויים קליניים ואפידמיולוגיה, ד"ר סטיבן אוונס, MD, מסביר מושגים סטטיסטיים מרכזיים למטופלים. הוא מבהיר מהו ניסוי בעל עוצמה סטטיסטית נמוכה ומדוע הוא נכשל בזיהוי השפעות טיפול אמיתיות. ד"ר אוונס מפרט את החשיבות של נקודות קצה ראשוניות מוגדרות מראש כדי למנוע הטיה. הוא גם מפרט את המדד "מספר הנדרש לטיפול" (NNT), תוך הדגשת השימושים והמגבלות שלו. מושגים אלה חיוניים לפרשנות של חדשות רפואיות ולהבנת יעילות הטיפול.
הבנת ניתוח ניסויים קליניים: הסבר על עוצמה סטטיסטית, נקודות קצה ו-NNT
קפיצה לפרק
- ניסויים קליניים בעלי עוצמה סטטיסטית נמוכה
- נקודות קצה ראשוניות לעומת משניות
- כשל היורה מטקסס
- מספר הנדרש לטיפול (NNT)
- פירוש תוצאות ניסוי
- תמלול מלא
ניסויים קליניים בעלי עוצמה סטטיסטית נמוכה
ניסוי קליני בעל עוצמה סטטיסטית נמוכה חסר משתתפים מספיקים כדי לזהות באופן אמין אפקט טיפולי אמיתי. ד"ר סטיבן אוונס, MD, מסביר שעוצמת הניסוי היא היכולת שלו למצוא הבדל אמיתי אם קיים כזה. הוא משתמש בניסויי טיפול ב-COVID-19 כדוגמה, וציין שלחקר תמותה נדרש גודל מדגם גדול כי שיעורי התמותה יכולים להיות נמוכים.
למשל, זיהוי הפחתה בתמותה מ-10% ל-7% דורש מספר גדול של חולים. אם הניסוי קטן מדי, הוא הופך לבעל עוצמה סטטיסטית נמוכה ועלול לפספס תועלת קלינית חשובה. ניסויי COVID-19 המוקדמים היו לרוב בעלי עוצמה סטטיסטית נמוכה עבור תוצאות תמותה. ד"ר סטיבן אוונס, MD, מדגיש שעוצמה קשורה ישירות לתוצאה הספציפית הנחקרת.
נקודות קצה ראשוניות לעומת משניות
ניסויים קליניים מגדירים נקודות קצה ראשוניות ומשניות כדי למדוד הצלחה טיפולית. נקודת הקצה הראשונית היא התוצאה העיקרית שהניסוי מתוכנן להעריך. ד"ר סטיבן אוונס, MD, מציין שתמותה היא נקודת קצה ראשונית קריטית אך מאתגרת כי היא דורשת מספר גדול של חולים.
חוקרים בוחרים לרוב תוצאות ראשוניות קלות יותר למחקר, כמו זמן עד החלמה או עומס נגיפי. מדדים אובייקטיביים אלה יכולים לדרוש פחות משתתפים. עם זאת, ד"ר אוונס מזהיר שהגדרות אלה חייבות להיות בריאות ומוקמות לפני תחילת הניסוי. שינוי נקודות קצה לאחר ראיית התוצאות מציג הטיה משמעותית ומבטל את הממצאים.
כשל היורה מטקסס
כשל היורה מטקסס הוא מושג קריטי בשלמות ניסויים קליניים. ד"ר סטיבן אוונס, MD, מתאר זאת כציור מטרה סביב חורי קליעים לאחר יריית אקדח. במחקר, זה אומר לשנות את התוצאה הראשונית של הניסוי לאחר ראיית הנתונים כדי לקבל תוצאה רצויה.
נוהג זה מציג הטיה חמורה ומערער את תקפות הניסוי. בעוד שקיימות סיבות לגיטימיות לשינוי נקודות קצה, הן חייבות להתרחש לפני חשיפת התוצאות. ד"ר אוונס מדגיש שקביעה מראש של נקודות קצה היא חיונית לניתוח אמין של ניסויים קליניים. זה מונע מחוקרים לתמרן תוצאות כדי להציג תוצאות חיוביות כוזבות.
מספר הנדרש לטיפול (NNT)
מספר הנדרש לטיפול (NNT) הוא מדד שימושי לחולים להבנת תועלת טיפולית. ד"ר סטיבן אוונס, MD, מגדיר NNT כמספר החולים שצריכים לקבל טיפול כדי למנוע תוצאה שלילית אחת. לדוגמה, אם תרופה מפחיתה תמותה מ-10% ל-5%, ה-NNT הוא 20.
זה אומר שצריך לטפל ב-20 אנשים כדי למנוע מוות אחד. עם זאת, ד"ר סטיבן אוונס, MD, מציין מגבלות חשובות. NNT אינו מספר טהור; הוא תלוי בזמן המעקב ובהגדרת התוצאה. השוואות בין טיפולים תקפות רק אם ה-NNT מחושב באופן זהה. למרות פשטותו, NNT דורש פרשנות זהירה.
פירוש תוצאות ניסוי
פירוש נכון של תוצאות ניסוי קליני דורש הבנה של מושגים סטטיסטיים מרכזיים. ד"ר סטיבן אוונס, MD, מייעץ לחפש מחקרים בעלי עוצמה סטטיסטית מספקת עם נקודות קצה שנקבעו מראש. זה מבטיח שהממצאים אמינים ולא נובעים ממקריות או הטיה.
חולים צריכים לשקול את הרלוונטיות הקלינית של התוצאות. תוצאה מובהקת סטטיסטית אינה בהכרח משמעותית אם ה-NNT גבוה מאוד. ד"ר אנטון טיטוב, MD, מדגיש את החשיבות של מושגים אלה לאוריינות בריאות הציבור. הבנת עוצמה סטטיסטית, נקודות קצה ו-NNT עוזרת לכולם להעריך באופן ביקורתי חדשות רפואיות ולקבל החלטות מושכלות.
תמלול מלא
ד"ר אנטון טיטוב, MD: פרופ' אוונס, יש כמה מושגים בסיסיים בניסויים קליניים. מה זה אומר, למשל, שהניסוי הוא בעל עוצמה סטטיסטית נמוכה? טרמינולוגיה של ניסויים קליניים נמצאת כעת בחזית; היא יוצאת בעיתונים. אנשים צריכים להבין את המושגים הבסיסיים האלה. אז מה זה אומר אם ניסוי הוא בעל עוצמה סטטיסטית נמוכה? מה זה NNT, מספר הנדרש לטיפול? יש יתרונות וחסרונות וסוג כזה של מושג בסיסי. מה הן נקודות הקצה הראשוניות והמשניות של ניסויים קליניים? ברור שמעט ניסויים הזיזו את שערי השדה, וזה היה מידע נפוץ בקהילה הרפואית.
ד"ר סטיבן אוונס, MD: ננסה לקחת כמעט את כל הדוגמאות שלנו מהמצב הנוכחי עם COVID-19. אם אנחנו הולכים לחקור תמותה, זה ידרוש מספר די גדול של אנשים. למרבה המזל, לא כולם ימותו, אפילו במצב בית חולים. אם יש לנו, נניח, 10% מהאנשים מתים, אז כדי למצוא הבדל שכנראה יהיה די חשוב—נניח, הפחתת שיעור התמותה של 10% בתוך 30 יום מתחילת הטיפול ל-7% תמותה—אנחנו יורדים מ-10% ל-7%. אנחנו נצטרך מספר גדול של חולים כדי להיות מסוגלים לגלות האם הבדל כזה באמת מתרחש.
אנחנו עושים ניתוח סטטיסטי על זה. אבל אם המספרים בניסוי קטנים מדי, אז זה ניסוי שאנחנו קוראים לו בעל עוצמה סטטיסטית נמוכה. העוצמה של המחקר לזהות הבדל אמיתי, אם קיים, הייתה נמוכה מדי. זה היה נכון עבור חלק מהניסויים המוקדמים שבוצעו על טיפולים פוטנציאליים ל-COVID-19.
בעוד שאם אנחנו חוקרים אלפי חולים, אז סביר שהניסוי לא יהיה בעל עוצמה סטטיסטית נמוכה עבור תמותה כתוצאה, provided we're dealing with differences that are reasonable. אם רצינו לזהות הבדל בין שיעור תמותה של 10% לשיעור תמותה של 9.9%, היינו צריכים עשרות אלפי חולים. זה, כמובן, לא הבדל שהיה מאוד שימושי לחולים בודדים.
אז ניסויים בעלי עוצמה סטטיסטית נמוכה הם בעיה. זה בעל עוצמה סטטיסטית נמוכה ביחס לתוצאה שאתה חוקר. אם היית עושה תמותה לתוצאה הראשונית שלך, היית צריך הרבה חולים. לעתים קרובות מאוד, מה שאנשים עושים זה לעשות תמותה לתוצאה משנית ולהפוך את התוצאה הראשונית שלהם למשהו שקל יותר לחקור ושעבורו אנחנו צריכים פחות חולים.
בסוג כזה של מצב, זה לרוב הזמן עד להחלמה מהמחלה. הבעיה עם זה היא שזה יכול להיות מעט סובייקטיבי. אתה יכול להגדיר שמישהו מגיע לרמת החלמה based on a clinical assessment, אבל זה may be based on viral load or something of that kind, which is an objective assessment.
So we may be able to have an objective assessment for a primary outcome that is easier to study than mortality. The problem is that when we look at recovery, we have a definition for it. But it may be that people don't meet those definitions. It becomes obvious in the trial that the outcome you set out as a primary one is not going to give you any useful data.
There can be legitimate reasons for changing it. But the difficulty is that if people know what the results are showing, they can change the question and therefore get the answer they want. In epidemiology, this is called the Texas sharpshooter syndrome, where the Texas gunman stands at the side of a barn and fires his gun at the barn, and then afterward walks up and draws a target.
You need in a trial to have a target specified beforehand, then do the trial and see what the results are, rather than changing the target while the trial is running. In general, there can be legitimate reasons for changing your outcome. But you've got to be very careful and make sure that you're not doing it after having already fired your gun and seen where the bullets fall.
You need to do it before you know where the bullets are falling.
When we come to measuring the outcome, one of the things we can do is say, what is the mortality rate? Let's say we have a treatment difference of 10% down to 5%. That means in every hundred people, there will be five people who do not die as a result of having treatment. For every 20 people, there will be one person who does not die.
When we turn that upside down, we say that the number needed to treat to prevent one death will be 20, with our difference between 10% and 5%. That would also be the case if there was a difference between 20% and 15% or between 50% and 45%. It is a measure of the number of patients who need to be treated to prevent one death.
Sometimes, instead of death, we look at a particular event like myocardial infarction or a stroke. The problem with this number is that it isn't a pure number. It depends on how long you followed patients up for. It also has some other statistical problems with it.
So it's not one that I particularly like, even though it sounds quite a nice thing to say: "Oh, this drug needs 20 patients needed to treat to get the benefit, whereas this drug needs 50 patients needing to be treated." If you've used the same rules for both, then NNT can be quite helpful. But you've got to be careful to make sure that your definition of the NNT, which isn't a pure number, is used exactly the same when you make comparisons between treatments.