Лекція про біоінформатика





Згорнути, щоб ввести вас. 27 лекції з біоінформатики (в тому числі описи, слайди та повні відео) У літньій школі з біоінформатики, яка проходила в липні 2014 року біля Санкт-Петербурга, об’єднала 100 студентів з усіх куточків Росії та СНД, а також викладачів з МСУ, МРТ, Skoltech, RAS, SPbAU, SPbPU, Санкт-Петербургського університету, Ялського університету, Fox Chase ракового центру, Джордж Вашингтонського університету, Пенсільванія та інших відмінних організацій.

Школа була традиційно проведена командою Інституту біоінформатики, і була підтримана SPbAU RAS, SPbU, JetBrains, RVC, BIOCAD, EMC, Dynasty Foundation і RFBR, завдяки яким вдалося зробити захід абсолютно безкоштовно для всіх учасників.

Цього року школа відбудеться 20-25 липня біля Москви (інформаційна інформація тут, скорочений термін), всі лекції також будуть записані.

Організація матеріалів
Якщо список нижче видається занадто важко для пошуку та вибору лекцій, ви також можете використовувати програму школи, список відтворення на YouTube та сторінку з усіма слайдами.

1. Вступ до біоінформатики (Alla Lapidus, SPbAU RAS, SPbSU)
[Відео] [Slides]

Революція в ядерній фізикі призвело багато років тому до накопичення величезних обсягів даних, які потрібно зберігати і обробити. Це можливо тільки для комп'ютерів і суперкомп'ютерів.

Геномічний бум останніх 10-15 років продовжив цю традицію і переповнено її: біомедичні дослідження стосуються кожного з нас, а отже, більше і більше даних будуть вироблятися, особливо в світлі ідеї персоналізованої медицини і вимог великої фармації. Немає нічого спільного з комп'ютерними знаннями та програмними продуктами. Але ви також повинні знати, що дізнатися, як проаналізувати дані, і скільки ви можете довіряти. Як зберігати і обробляти. Де застосовувати і де використовувати.

Лекція висвітлює більшість таких «яків». Алла прагне підкреслити важливість та хліб біоінформатики.

131063

2. Процес мутації та методи його вивчення (Олексій Кондрашов, Московський державний університет)
[Відео] [Slides]

Процес мутацій є першим з двох основних чинників еволюції Дарвіна. Лекція присвячена причинам і механізмам мутації, методам вимірювання параметрів процесу мутації при невеликих, середніх і великих часах, даних про показники мутації і найпростіших моделей впливу мутації на генетичну структуру населення.

3. У Природний вибір та методи його вивчення (Алексій Кондрашов, Московський державний університет)
[Відео] [Slides]

Природний вибір є другим з двох основних чинників еволюції Дарвіна. Лекція обговорює причини та механізми вибору, методи та параметри, які використовуються для опису та вивчення його, дані щодо вибору природи та найпростіших моделей впливу вибору на населення.



4. Розвиток дитини та біоінформатика: виклики та рішення (Єлена Григоренко, Яльський університет)
[Відео] [Slides]

Лекція присвячена обговоренню особливостей розвитку та біоінформатики.
Розглянуто проблеми пренатальної діагностики та пренатального осаду, а також екзомічне відведення новонароджених.

Розповідає про дослідження впливу раннього розвитку навколишнього середовища на стан метилом, а про геномічну етіологію розвитку дитинства. У висновку розглянуто етичні питання, пов’язані з використанням геномної інформації при прийнятті діагностичних та індивідуальних рішень щодо розвитку дитини.

5. Умань Нове покоління Sequencing: Принципи, можливості та перспективи (Марія Логачева, Московський державний університет)
[Відео] [Slides]

На прикладі дослідження біологічних і біомедичних досліджень перетворилося очисні процеси. Дозволяє порівняно швидко і недорого отримувати послідовності генів і геномів раніше нерозширених видів, а також - на матеріалі великої кількості фізичних осіб одного виду - виявити внутрішньоспецифічну мінливість, шукати гени, пов'язані з рисами інтересу. На додаток до фактичного визначення геномних послідовностей, НГС дозволяє детальний аналіз експресії генів в різних тканинах тіла або в різних умовах, широко використовується в епігенетичних дослідженнях.

Лекція дає огляд основних методів відведення, їх фізико-хімічних принципів, особливостей підготовки зразків, особливостей отриманих даних, їх вартості та типових помилок. Особлива увага приділяється аплікаційності різних методів розв’язання біологічних проблем, а рекомендації подаються для планування експериментів, пов’язаних з НГС.

6. Жнівень Структурний білок Біологія: Огляд проблем і підходів
[Відео] [Slides]

Використання тільки первинних послідовностей вирішує більшість проблем нуклеїнової кислоти (ДНК та РНК). При навчанні функцій білків, знаючи тільки первинна послідовність не дозволяє вирішити більшість проблем. Які білки взаємодіють один з одним і скільки? Чи змінить функцію амінокислоти? Як видалити побічні ефекти з лікарського білка або збільшити його ефективність? Ці питання звертаються до сфери біоінформатики, що розробляє алгоритми моделювання просторової форми білків та їх взаємодій.



7. Про нас De novo збірка траноми (Artem Kasyanov, MIPT)
[Відео] [Slides]

У зв’язку з значним зниженням вартості та продуктивності технологій, значно зросла кількість проектів, присвячених виведенню геномів немодельних організмів. У деяких випадках, де б ніхто не відступає і складання геному складно, наприклад, у випадку його великого розміру. У таких випадках вдаються до вивчення траноми. У разі вивчення видів з великою кількістю альтернативно-послідовних генів, так як навіть при наявності геному досить складно визначити повний перелік ізоформ.

Лекція присвячена створенню транографічних даних при відсутності геному. Розглянуто такі теми, як рельєфні графіки, тринність та новібрендові програми, порівняння та аналіз зборів, складання транскриптомів поліплеїдних організмів.

8. У Еволюція алгоритмів складання геномів (Антон Банкевич, СПБАВ РАС)
[Відео] [Slides]

Є кілька поколінь методів стискування ДНК. Але нові технології несуть без алгоритмів обробки їх результатів. Постійно з'являються нові методики висихання. Однією з найважливіших завдань є складання геному. Лекція присвячена еволюції методів та алгоритмічних підходів до складання геномів, які з’явилися і продовжують з кожним кроком цієї еволюції.

Р

9. Вступ до молекулярної біології та генетики (Павель Добринін, СПбУ)
[Відео] [Slides]

Лекція присвячена структурі та організації ДНК в прокаріотах та екуаріотах, молекулярних механізмах, відповідальних за збереження та відтворення генетичного матеріалу. Проаналізовано основні механізми генетичної мінливості та варіантів реалізації генетичного матеріалу.

10. Проблема множинного локального вирівнювання та побудови синтівних блоків (Ілля Мінкін, Пенсільванський державний університет)
[Відео] [Slides]

Лекція вивчає дві аналогічні алгоритмічні проблеми у порівняльній геноміці: багаторазове локальне вирівнювання та будівництво синтезованих блоків. Ці алгоритми відіграють вирішальну роль у порівнянні з повною послідовністю геному. Про встановлення завдань і про основні ідеї, на яких будуються сучасні алгоритми.



11. Чому і як зробити презентації (Анрі Афанасьєв, iBinom)
[Відео] [Slides]

Лекція обговорює види презентацій, чому вони дійсно потрібні, і розповідає, як виконувати так, щоб слухачі зрозуміли все і не падають, а також які помилки слід уникати і від кого взяти приклад під час підготовки мовлення.

12. Бізнес в біоінформатиці (Андрі Афанасьєв, iBinom)
[Відео] [Slides]

Лекція описує, які компанії біоінформатики існують в Росії та світі, які створили їх та які вони роблять гроші.
Розглянуто плани основних гравців і трендів галузі.

У фінальній частині лекції Андрей надає можливість подумати про організацію власного стартапу або вибору нової роботи.

13.00 р. Перспективи і проблеми системної біології (Ілля Серебриський, Фокс-Чеза Центр)
[Відео] [Slides]

Лекція призначена для надання загальної ідеї системних властивостей біологічних об’єктів. Ілля Сергійович розповідає про основні компоненти біології систем, про взаємодіоміка та модельне будівництво, про основні проблеми системної біології та спроби їх вирішення. Розглядаються деякі досягнення в системах біології (головно з області онкології). Розглядаються також наявні ресурси для системної біології (TCGA/cBioPortal, CCLE).

Р

14. Системи Біологічної лабораторії (Ілля Серебриський, раковий центр Фокса)
[Відео] [Slides]

Урок присвячений створенню мереж взаємодії на основі загальнодоступних баз даних. Використовуються бази даних та веб-послуги, такі як Entrez, GeneMANIA, BioGRID та інші. Розглянуто різні методи візуалізації мереж взаємодії, зокрема, за допомогою програми Cytoscape.

15.00 р. Метагеноміка (Alla Lapidus, SPbAU RAS)
[Відео] [Slides]

Микроби всюди, мікроби правила світу, але не всі вони ми можемо зустріти в лабораторії. Переважна більшість з них ми не знаємо, як виростити, що означає, що вони повинні якось витягуватися з природного середовища – землі, води, коріння дерева тощо, де вони живуть у великих групах.

Метагеноміка допомагає в цих дуже складових дослідженнях. І допомагає годувати, погріти, лікувати людей і ловити злочинців. Всі ці та біоінформатика в метагенології були присвячені цій лекції.



16.00 р. Проблема тестування багатьох статистичних гіпотез (Антон Коробєніков, СПБУ, СПБАВ РАС)
[Відео] [Slides]

Лекція працює з класичною проблемою тестування декількох гіпотез одночасно. Ці види завдань придумують весь час, наприклад, у пошуку геномної асоціації або аналізі даних мікрочіпів. Розглянуто можливі розчини цієї проблеми, починаючи від класичного підходу Bonferroni до методів, які дозволяють контролювати FDR (фальшивий рівень відкриття).

17.00 р. Як правильно використовувати статистику та невірно (Nikita Alekseev, Санкт-Петербургський університет, Джордж Вашингтонський університет)
[Відео] [Slides]

Лекція присвячена похибкам у заяві статистики та як їх запобігти. Зокрема, відповідь на питання надається: в яких ситуаціях можна використовувати стандартні критерії для порівняння типових зразків, а що робити, якщо стандартні критерії не підходять?



18 років Математичні моделі регуляції експресії генів (Мрія Самосонова, СПбСПУ)
[Відео] [Slides]

Розуміння тонких механізмів регулювання діяльності гена є необхідною умовою для дешифрування механізмів захворювання у людини. На жаль, на сьогоднішній день це розуміння не вистачає: ми не можемо задовільно пояснити, як групи транскриптових чинників взаємодіють один з одним, з хроматиновими білками, іншими протеїнами адаптора та комплексом поліпази РНК, а не як і чому конкретна область послідовності ДНК може контролювати складний, просторовий та часовий шаблон експресії гена.

Математичне моделювання допомагає зрозуміти механізми регулювання гена механічно і кількісно описувати цей процес. Лекція присвячена обговоренню двох найбільш поширених підходів до моделювання експресії генів – на основі нелінійних рівнянь реакції-дифузії та термодинамічної рівноваги. Наведено етапи побудови таких моделей і приклади їх використання для створення нових знань.

р.

19. Вирівнювання напівлокальної та місцевої послідовності (Олександр Тискін, Університет Warwick)
[Відео] [Slides]

Узгоджуючи найдовший поширений субсекент (LCS) двох рядків є одним з класичних алгоритмічних проблем, які мають широке застосування як в комп'ютерній наукі, так і обчислювальній біології, де відомий як «лобальне вирівнювання послідовності». Багато додатків вимагають узагальнення цієї проблеми, яку ми називаємо напівлокальними LCS (Smi-local LCS) обчислення, або «Smi-local вирівнювання.» У цьому випадку потрібно розрахувати ЛКШ між рядком і усіма підрядками іншої лінії, а/або між усіма префіксами однієї лінії і всіма суфіксами іншого. На додаток до важливої ролі даної узагальненої проблеми в рядкових алгоритмах, вона має несподівані зв'язки з напівгрупою алгебра і обчислювальною геометрією, з порівнянням мереж, а також практичними додатками в обчислювальній біології. Крім того, проблема напівлокальних ЛКС може бути використана як гнучкий і ефективний підхід до локального вирівнювання біологічних послідовностей.

Лекція презентує ефективне рішення задачі обчислення напівлокальних ЛКС та дає огляд основних результатів супроводження та додатків. Серед них є динамічна підтримка ЛКС; швидкий розрахунок натискань в деяких спеціальних графіках; швидке порівняння стиснених ниток; паралельні розрахунки на рядках.



20. Аналіз сімей молекулярних послідовностей (Sergei Nurk, SPbAU RAS)
[Відео] [Slides]

При розв’язанні різних завдань, з пошуку нормативних мотивів до прогнозування функцій білків, біоінформатики повинні працювати з цілими «сімами» еволюціонально пов’язаних нуклеотидних або амінокислотних послідовностей. Лекція присвячена обговоренню різних способів представлення таких сімей, які використовуються в популярних інструментах біоінформатики та базах даних. У статті описано, як розшифрувати шаблон PROSITE і інтерпретувати логотип послідовності, що є різницею профілю HMM і PSSM, а також як уникнути помилок у їх будівництві та аналізі результатів.



21. Епігномічність, РНК та всі, що (Анрі Миронов, IPPI RAS)
[Відео] [Slides]

Лекція забезпечує огляд епігенетики. Розглянуто рівні структурної організації хроматину, описано різні епігномічні модифікації: модифікації гітону, метилювання мотивів CpG. Розглянуто їх вплив на експресію гена.
Розглянуто роль епігномічних модифікацій у селлінгі, відбитку та ін.

Система XIST (X-інактивація специфічної транскрипції), антисенс РНК, селлінг, РНК-залежне регулювання.
Також розглядаються моделі для вивчення епігномічних модифікацій.

22. Костянтин Okonechnikov, Інститут біології інфекції Макс Планк
[Відео] [Slides]

Лекція присвячена поширенню помилок, характерних для технології НГС. Прикладами таких помилок є посилення ПЛР, послідовно-специфічні помилки читання, нерівномірний розподіл складу ГК та інші. Проаналізовано різні методи оцінки цих помилок і з урахуванням їх у аналізі. Питання практичних рішень та наявних програмних засобів будуть торкнутися.



23. НГС Контроль якості даних, семінар (Константин Оонечников, Інститут біології інфекції Макс Планк)
[Відео] [Slides]

Під час семінару учасники дізналися, як застосувати навички програмування для контролю якості даних NGS. Розглянуто формати даних BAM/SAM, бібліотеки pysam та pyplot, основні концепції. Зокрема, проаналізовано приклади підрахунку складу ГК, що забезпечує частоту дублікатів, розподілу довжини вставки, розрахунок покриття в вікнах.

24. РНК осаду (Інститут інфекційної біології)
[Відео] [Slides 1] [Slides 2]

Практична проблема аналізу даних РНК.
У форматі презентації та практики обговорювалися методи: вирівнювання редукцій, початковий контроль якості, трубопроводи для вивчення експресії генів DESeq та Cufflinks, пошук ізоформ транскриптів, пошук гібридних генів.



25. Біоінформатичні підходи до дослідження та лікування раку на прикладі раку легенів (Марія Шутова, Іоген RAS)
[Відео] [Slides]

Рак є одним з найбільш поширених і небезпечних захворювань. Це називається «природним захворюванням» для величезного внеску накопичених і нових мутацій до його виникнення і розвитку. Відомо, що не тільки стан геному, але і транскриптовий і навіть епігенетичний стан первинних ракових клітин, а також комплексний гомеостаз вирощування пухлини безпосередньо впливає на його властивості і, головне, схильність до терапії. Єдиним способом зрозуміти цей трикутник міжзалежних факторів є біоінформатика. Лекція обговорює основні питання, пов’язані з вивченням новоутворення та можливими способами відповіді на них за допомогою біоінформатичних підходів.

р.

26. Нова оміка в біології людини: метаболіка і ліпідоміка (Філіп Гейтович, Сколтех)
[Відео] [Slides]

Розкопка геном людини, вивчення генетичних варіацій людини, осаду метагеном людини, траномичного аналізу тканин людини – всіх цих біологічних методів у застосуванні до «великих даних» дали вчені велику кількість цінної інформації про те, що відрізняє людину від інших тварин.

Ця лекція присвячена новим «омікам», що дозволяє відповісти на питання про людське тіло при вивченні головного мозку та інших тканин - метаболоміка та ліпідоміка.



27. Геномічна Асамблея: погляд на завтра (Андрей Пшибелський, СПБАВ РАС)
[Відео] [Slides]

В останні роки в Україні запроваджено нові технології, які виробляються на ринку: ІонТоррен і Тихоокихо Біонауки, і Ілюміна створили низку нових протоколів. Але, як це виходить, все це недостатньо для розгляду проблеми збирання геном вирішується. З видобутку ДНК до повного геному, зазвичай займає десятки різних фахівців, сотні тисяч доларів і років роботи. Тому сьогодні це завдання залишається актуальним як з точки зору біотехнології, так і з точки зору біоінформатики. Лекція присвячена обговоренню останніх проривів у методах складання геному, новітніх типів даних, які можуть прийняти це завдання на новий рівень, а перспективи геноміки в найближчому майбутньому.

Кількість
Ще 28 лекцій з року до останнього (перший) літньої школи з біоінформатики можна побачити ... з якоїсь причини на мегабразині. Також був звіт від одного з учасників школи. Про те, як були організовані наукові проекти.

Дуже дякую. Всі біоінформатики!

3250Р. 3700Р.



Джерело: geektimes.ru/company/spbau/blog/249038/