Белок AstaP, впервые найденный в зеленых микроводорослях, связывает каротиноиды — вещества с высокой антиоксидантной активностью — и способен переносить их в клетки сетчатки, что в перспективе может помочь защитить ее от возрастных изменений. Ученые из РАН, МФТИ и МГУ с помощью искусственного интеллекта смогли изменить структуру природного варианта AstaP, улучшив его свойства. Разработка описана в статье, опубликованной в журнале Protein Science.
Алгоритмы MPNN (message passing neural network — нейросеть, передающая сообщения) способны предсказывать последовательность аминокислот в молекуле белка по координатам атомов ее «скелета». «Посоветованные» нейросетью белки часто оказываются более стабильными, растворимыми или простыми в получении.
Авторы новой работы использовали нейросеть этого типа, чтобы улучшить свойства белка AstaP (сокр. astaxanthin-binding protein — белок, связывающий астаксантин). Ученые обнаружили, что антиоксидантное действие каротиноидов, доставляемых белком AstaP, снижает вред от гранул пигмента липофусцина, который накапливается в клетках и приводит к возрастной дегенерации сетчатки, ответственной примерно за 50% случаев слепоты. Оптимизация структуры AstaP под доставку каротиноидов потенциально может помочь пожилым людям сохранять зрение.
Алгоритмы MPNN рассчитывают структуры молекул по кристаллографическим данным с точностью выше 50%. Но белки AstaP не удается закристаллизовать, тем самым определив их пространственную структуру, а единственная модель структуры этого белка в комплексе с молекулой астаксантина была получена методом ЯМР-спектроскопии.
Авторы работы предложили новый подход к расчетам, чтобы более эффективно использовать алгоритмы машинного обучения на основе MPNN в работе с данными ЯМР. В результате ученым удалось создать новые белки NeuroAstaP. Четыре из пяти предсказанных вариантов не только сохранили функциональность природного белка AstaP, но и получили ряд преимуществ, в частности, уменьшенный размер, совпадая с последовательностью природного белка на 40%.
Исследователи отмечают, что предложенный подход на основе пошагового улучшения численных характеристик моделей и компьютерного подтверждения промежуточных результатов позволяет применять эти же алгоритмы к данным ЯМР без дополнительного переобучения и тем самым расширяет набор инструментов для рациональной инженерии белковых молекул для применения в задачах медицины и биотехнологии.