Ю. Порозов, "Основы биоинформатики"
(BI)

Юрий Порозов. (СПбГУ ИТМО и Istituto di Fisiologia Clinica del CNR, Pisa, Италия)

Основы биоинформатики

Начало 27.02.10 в 14:00

Аннотация.

Современная биоинформатика – весьма молодая, бурно развивающаяся и довольно непривычная для математиков и информатиков наука. По сути это собрание различных математических моделей и методов в помощь биологам (в основном молекулярным биологам) для решения чисто биологических задач (предсказание пространственной структуры белков, расшифровка структуры ДНК и т.п.) Несмотря на наличие корня «информатика» в названии этой науки, она настолько пропитана биологией, что без довольно глубоких биологических знаний делать математику в ней нечего. В то же время область приложения математических знаний, в том числе и самых современных математических теорий здесь просто необъятна. Цель курса - познакомить слушателей с основными моделями и методами биоинформатики, а также с основными стоящим перед ней проблемами.

I. Введение: 4 ч.
Предмет биоинформатики. Цели, задачи и методы науки. Основные понятия. Аминокислоты, их строение, свойства. Нуклеиновые кислоты и нуклеотиды. ДНК и РНК. Строение ДНК. Способы представления информации о последовательностях – форматы записи Fasta, Genbank, PDB и способы визуализации. Источники информации, базы данных и Интернет для биоинформатики. Протеины, пространственное строение, функции.

II. ДНК. Методы анализа последовательностей: 4 ч.
Молекула ДНК – хранилище генетической информации. Строение ДНК. Упаковка молекулы. Комплементарность. Гены, регуляторные последовательности, сайты связывания. Кодирование информации при помощи нуклеотидов. Репликация (удвоение молекулы). Анализ последовательностей. Парное выравнивание. Алгоритм Смит-Ватерман. Алгоритм Нидлмана-Вунша. Множественное выравнивание. Применение выравнивания в биоинформатике, примеры.

III. Белки: 4 ч.
Строение белков. Первичная структура белка. Вторичная структура. Третичная и четвертичная структура белка. Мотивы и домены. α-структуры, β-структуры и их комбинации. Функции белков. Связь между структурой и функцией белков. Главная цепь. Боковые цепи. Геометрия главной цепи. Конформации белка. Конформации боковых цепей. Диаграмма Рамачандран и библиотеки ротамеров.

IV. Белки. Трехмерные структуры, предсказание: 4 ч.
Фолдинг (сворачивание) белка. Парадокс Левенталя. Методы определения пространственной структуры белков. X-ray-дифракция. Метод ЯМР. Потенциальная энергия молекулы. Предсказание вторичной структуры. Предсказание третичной структуры: AB-initio. Моделирование гомологов. Threading (распознавание фолда). Структурное выравнивание.

V. Биологические базы данных и серверы. 4 ч.
NCBI и сервисы. PDB. OCA. SRS. SRS-3D. PredictProtein. Swiss-Model. ExPASy. UniProt. Сервера EMBL. Инструменты: Swiss-PDBviewer, VMD, Accelrys Discovery Studio. Актуальные проблемы, требующие решения: аннотация генома, поиск генов, поиск сайтов репликации у человека. Сворачивание белков, предсказание структуры белка, предсказание функции и клеточной локализации белков. Предсказание подвижности белков и классификация протеинов по принципу подвижности.

Рекомендуемая литература:
1. Финкельштейн А.В., Птицын О.Б. Физика белка. Курс лекций. 2005, 456 с.
2. Ж. Сетубал, Ж. Мейданис. Введение в вычислительную молекулярную биологию. 2007. 420 c.
3. A. Lesk, Introduction to Protein Architecture, 2nd edition (2001).
4. S.L. Salzberg, D.B.Searls, S. Kasif (editors), Computational Methods in Molecular Biology, (1998).
5. Branden and Tooze, Introduction to Protein Structure (2nd edition).
6. D. Gusfield, Algorithms on Strings, Trees and Sequences, (1997).
7. M. Waterman, Introduction to Computational Biology: Maps, Sequences and Genomes (Interdisciplinary Statistics) (1995-2000)
8. Attwood T., Parry-Smith D. Introduction to Bioinformatics. 1999, 218 c.