Проблема клінічних випробувань III фази

Клінічні випробування III фази є завершальним етапом досліджень, необхідних до того, як лікарський засіб отримає схвалення Управління з контролю за продуктами та ліками США (FDA). Потрібні два досить масштабні дослідження, які повинні показати, що препарат є безпечним та ефективним для досліджуваних.

Однак із такими клінічними дослідженнями існує давня проблема, про яку FDA вже давно знали, але її безсило виправити. Вони спеціально розроблені з використанням жорстких критеріїв включення та виключення, які можуть виключити значну частину населення. Іншими словами, люди, на яких вивчаються ліки, не є репрезентативними для тих, хто насправді отримуватиме ліки після затвердження.

Іншими словами, клінічні дослідження фази III складаються на користь пошуку позитивних результатів для досліджуваного препарату.

Нове дослідження, опубліковане в останньому номері журналу Американський журнал психіатрії Вісневським та його колегами (2009) вирішили перевірити гіпотезу, дослідивши великі дані, отримані в рамках проекту STAR * D, що підтримується урядом. "STAR * D був розроблений з широкими критеріями включення та мінімальними виключеннями, щоб забезпечити набір репрезентативної вибірки амбулаторних пацієнтів, які шукають лікування, які отримують лікування в типових клінічних умовах", - відзначили дослідники.

Дослідники розділили суб'єктів STAR * D на дві групи - тих, хто пройшов кваліфікацію для клінічного випробування фази III ("зразок ефективності"), та тих, хто не мав би:

STAR * D взяв участь загалом 4041 учасник, 2876 з яких склали аналізовану вибірку (маючи принаймні один візит після базової лінії та оцінку 14 або вище за HAM-D). З них 2855 можна класифікувати на вибірку ефективності (N = 635, 22,2%) або вибірку неефективності (N = 2220, 77,8%)

Ви можете побачити цікаве явище, яке вже ґрунтується на класифікації дослідників. Лише 22,2 відсотка суб'єктів зірки STAR * D мали б право на клінічне випробування фази III. Переважна більшість випробовуваних не мали б кваліфікації, що негайно ставить під сумнів узагальненість та корисність даних, які стосувались би лише 22,2 відсотка населення. (Попередні дослідження припускали, що ця кількість може бути лише 9 відсотків.)

Вони також виявили, що зразок ефективності, порівняно з неефективністю вибірки людей із депресією, мав:

  • Коротша тривалість депресії
  • Нижчі показники попередніх спроб самогубства
  • Нижчі показники сімейної історії зловживання наркотичними речовинами
  • Нижчі показники тривожності та інших недепресивних симптомів
  • Швидше за все, це можна побачити в психіатричній спеціалізованій установі
  • Рідше виникають серйозні побічні ефекти
  • Рідше виникає серйозна побічна подія (психіатрична або через ліки)

Все це може легко пояснити спостереження більшості клініцистів щодо того, що ліки рідко відповідають очікуванням, виявленим та опублікованим у рецензованих дослідженнях (так званий "золотий стандарт"):

[A] Усі показники результатів показали значні, але помірні відмінності між групами, причому вибірка ефективності мала в середньому кращі результати. Ці відмінності узгоджувались за напрямком та величиною ефекту при окремому дослідженні в умовах первинної та психіатричної допомоги.

З огляду на ці відмінності між групами, менша вибірка ефективності явно не репрезентативна для більш інклюзивної групи, яка шукає лікування. На підставі висновку, зразок пацієнта, який відповідає критеріям включення для клінічного випробування фази III, не є репрезентативним для пацієнтів із депресією, що спостерігаються у типовій клінічній практиці, і результати випробувань III фази можуть бути більш оптимістичними, ніж результати, отримані на практиці. [...]

Наскільки нам відомо, поточне дослідження першим вивчає відмінності результатів лікування. Примітно, що рівень відповіді та ремісії був нижчим, а час відповіді та ремісії був довшим у пацієнтів, які не відповідали випробуванням на ефективність. Таким чином, поточні дослідження ефективності дозволяють припустити більш оптимістичний результат, ніж це ймовірно на практиці, а тривалість адекватного лікування, запропонована даними досліджень ефективності, може бути занадто короткою.

Існує очевидний компроміс у відкритті клінічних випробувань фази III для більш широкої та репрезентативної вибірки пацієнтів - ліки не будуть відповідати пороговому рівню ефективності FDA, а тому не будуть затверджені. Отже, якщо FDA не змінить свої вимоги до фази III, ця ситуація, швидше за все, не зміниться самостійно, незалежно від того, найближчим часом, незважаючи на такі дані, як це свідчить про те, що дослідження є принципово хибним.

Під час досліджень, як ви обираєте свою вибірку, є фундаментальним способом, яким ви можете допомогти сформувати свої результати. Звичайно, дослідники це знають і часто обирають критерії включення чи виключення для своєї вибірки, що призведе до найбільшої ймовірності знаходження ними значення у своїх даних. Після того, як ви знаєте, на що слід звертати увагу при відборі проб (наприклад, це рандомізована чи зручна вибірка? Чи занадто жорсткі критерії включення / виключення? Це репрезентативна сукупність та демографічні показники?), Ви можете багато розповісти про фактичну корисність та узагальнення результатів дослідження.

Останні дослідження продовжують довгий ряд подібних досліджень, які дають нам уявлення про те, чому ліки рідко працюють так само добре (або з якомога меншою кількістю побічних ефектів), як показали їх клінічні випробування.

Отже, якщо ви відчуваєте розчарування з приводу того, що ваш антидепресант або психіатричний препарат не працює так добре, як рекламується, це може бути однією з причин - він не настільки ефективний у загальній популяції, як на дослідженій зразку вишні.

Довідково:

Стівен Р. Вішнєвський, А. Джон Раш, Ендрю А. Ніренберг, Бредлі Н. Гейнс, Дайан Уорден, Джеймс Ф. Лютер, Патрік Дж. Макграт, Філіп В. Лавори, Майкл Е. Тейз, Мауріціо Фава та Мадхукар Х. Тріведі. (2009). Чи можна узагальнити результати клінічної практики на етапі III випробувань антидепресантів? ЗВІТ * D Звіт. Am J Psychiatry, 166 (5), 599-607.

!-- GDPR -->