Большая языковая модель прогнозирует повторную госпитализацию пациентов
Выписка из больницы — важная веха для пациентов, но иногда это не конец пути к выздоровлению. Почти 15% пациентов больниц в США повторно госпитализируются в течение 30 дней после их первоначальной выписки, что часто связано с худшими результатами и более высокими затратами как для пациентов, так и для больниц.
Исследователи из NYU Langone Health, академического медицинского центра Нью-Йоркского университета, в сотрудничестве с экспертами NVIDIA разработали большую языковую модель (LLM), которая прогнозирует риск 30-дневной повторной госпитализации пациента, а также другие клинические исходы.
Модель NYUTron, развернутая в шести стационарных учреждениях системы здравоохранения, представленная сегодня в научном журнале Nature, предоставляет врачам информацию на основе искусственного интеллекта, которая может помочь им выявлять пациентов, нуждающихся в клиническом вмешательстве, чтобы снизить вероятность повторной госпитализации.
«Когда вы выписываете пациента из больницы, вы не ожидаете, что ему придется вернуться, или вам, вероятно, следовало держать его в больнице дольше», — сказал доктор Эрик Оерманн, доцент кафедры радиологии и нейрохирургии в школе Гроссмана Нью-Йоркского университета. доктора медицины и ведущий сотрудник NYUTron. «Используя анализ модели искусственного интеллекта, мы вскоре сможем предоставить врачам возможность предотвращать или исправлять ситуации, которые подвергают пациентов более высокому риску повторной госпитализации».
На данный момент модель была применена к более чем 50 000 пациентам, выписанным из системы здравоохранения Нью-Йоркского университета, где она делится прогнозами риска повторной госпитализации с врачами посредством уведомлений по электронной почте. В следующий раз команда Орманна планирует провести клиническое исследование, чтобы проверить, снижают ли вмешательства, основанные на анализах NYUTron, уровень повторной госпитализации.
Правительство США отслеживает показатели 30-дневной реадмиссии как индикатор качества медицинской помощи, предоставляемой больницами. Медицинские учреждения с высокими ставками штрафуются — такой уровень проверки стимулирует больницы улучшить процесс выписки.
Существует множество причин, по которым недавно выписанному пациенту может потребоваться повторная госпитализация — среди них инфекция, чрезмерное назначение антибиотиков, хирургические дренажи, которые были удалены слишком рано. Если эти факторы риска можно будет обнаружить раньше, врачи смогут вмешаться, скорректировав планы лечения или дольше наблюдая за пациентами в больнице.
«Хотя с 1980-х годов существуют вычислительные модели для прогнозирования повторной госпитализации пациентов, мы рассматриваем это как задачу обработки естественного языка, которая требует корпуса клинических текстов в масштабе системы здравоохранения», — сказал Оерманн. «Мы обучили нашего магистратуры работе с неструктурированными данными электронных медицинских записей, чтобы посмотреть, смогут ли они получить информацию, о которой люди раньше не задумывались».
NYUTron предварительно обучался на медицинских записях NYU Langone Health за 10 лет: более 4 миллиардов слов клинических записей, представляющих почти 400 000 пациентов. Модель достигла повышения точности более чем на 10 процентов по сравнению с современной моделью машинного обучения для прогнозирования повторной госпитализации.
После того, как LLM был обучен для первоначального варианта использования 30-дневной повторной госпитализации, команда смогла разработать четыре других алгоритма прогнозирования примерно за неделю. К ним относятся прогнозирование продолжительности пребывания пациента в больнице, вероятности внутрибольничной смертности и вероятности отклонения страховых требований пациента.
«Управление больницей в некотором смысле похоже на управление отелем», — сказал Оерманн. «Информация, которая помогает больницам работать более эффективно, означает больше коек и лучший уход за большим количеством пациентов».
NYUTron — это LLM с сотнями миллионов параметров, обученный с использованием платформы NVIDIA NeMo Megatron на большом кластере графических процессоров NVIDIA A100 с тензорными ядрами.
«Большая часть разговоров о языковых моделях сейчас ведется вокруг гигантских моделей общего назначения с миллиардами параметров, обученных на беспорядочных наборах данных с использованием сотен или тысяч графических процессоров», — сказал Оерманн. «Вместо этого мы используем модели среднего размера, обученные на высокоточных данных, для решения конкретных задач здравоохранения».