В.В. Поройков «Технологический суверенитет в фармацевтике: большие данные, вычислительные инструменты, необходимые компетенции»
Необходимость активных действий по достижению технологического суверенитета Российской Федерации в области фармацевтики не вызывает сомнений, поскольку в настоящее время доля импортных лекарственных препаратов в денежном выражении составляет около 60%. При этом производство лишь около 10% фармацевтических субстанций, из которых производятся отечественные лекарства, локализовано на территории нашей страны (основные поставщики – Индия и Китай). В рамках программы «Фарма-2030» поставлена амбициозная задача повысить до 80% долю производимых по полному циклу стратегически важных препаратов, и стимулировать разработку и выпуск инновационных более безопасных и эффективных лекарств.
Поиск и разработка инновационных лекарств основаны на анализе больших биомедицинских и химических данных, который проводится с применением машинного обучения, нередко называемых в настоящее время методами искусственного интеллекта. Исходно эти данные доступны во множестве научных публикаций и патентов, а для извлечения из них информации используются методы интеллектуального анализа текстов. Наряду с этим, в мире существуют свободно- и коммерчески доступные информационные ресурсы, агрегирующие данные из первичных источников, однако для практического использования доступной информации с целью выявления зависимостей методами машинного обучения необходима тщательная предобработка, требующая глубокого понимания предметной области. Необходимо также подчеркнуть, что вышеупомянутые информационные ресурсы локализованы в странах, которые в последние годы оказывают санкционное давление на Российскую Федерацию; соответственно, нельзя исключать, что в определенный момент доступ к этим ресурсам будет заблокирован. Таким образом, задача создания отечественного информационного ресурса, агрегирующего современную биомедицинскую и химическую информацию, имеет стратегическое значение для развития фармацевтической отрасли.
Поиск и разработка новых лекарственных препаратов с применением методов in silico – мультидисциплинарная область, требующая, наряду с навыками и знаниями в области анализа данных и машинного обучения, фундаментальной подготовки в предметной области, из которой происходят данные для анализа и моделирования. Если это данные из медицинской химии, фармакологии и токсикологии, необходимо иметь глубокие знания в области физики, химии, молекулярной и клеточной биологии, обеспечивающие понимание механизмов взаимодействия молекул и регуляторных процессов в иерархических биологических системах. Для анализа «больших медицинских данных» требуется базовое медицинское образование с дополнительной подготовкой в области биохимии, молекулярной и клеточной биологии, а также «ОМИКсных наук».
Имеющийся опыт показывает, что творческие личности, независимо от исходной специализации в области IT либо биомедицины, в состоянии приобрести дополнительные знания и умения в «параллельной реальности» (медико-биологические науки - для айтишников и методы анализа данных с применением машинного обучения – для выпускников медико-биологических факультетов университетов).
Следует также подчеркнуть, что поскольку создание более безопасных и эффективных лекарств осуществляется на самом передовом крае развития медико-биологических наук, необходимо постоянное совершенствование специалиста, готовность и способность «учиться всю жизнь».
Видеозапись представленных на Академической сессии докладов доступна по ссылке