
×
Script zu Teilen der Bioinformatik
Vorlesung des 5.Semesters Medizin
von Rainer Schmidt, Matthias Brandt, Melina Schellhorn und Georg FüllenDie erste Fassung dieses Skripts wurde von Matthias Brandt (Student im WS 2011/2012) erstellt. Überarbeitet und erweitert wurde es von Dr. Rainer Schmidt und Prof. Dr. Georg Füllen. Im Winter 2011/2012 wurde das Script von Melina Schellhorn (zu Kürzesten Wegen, Maximum Likelihood und Single Nucleotide Polymorphismen) erweitert.
Das Skript ist angelehnt an die Vorlesung zur Bioinformatik von Prof. Füllen, die ein Teil der gemeinsam mit Prof. Kundt gehaltenen Vorlesung „Epidemiologie, Medizinische Biometrie und Medizinische Informatik“ ist.
Der erste Teil der Vorlesung basiert teilweise auf dem Buch „Algorithmen und Datenstrukturen - Eine Einführung mit Java“ von Saake/Sattler und auf Materialien von R. König aus Heidelberg (mit freundlicher Genehmigung).
Der vierte Teil des Skripts „Biomarker-Finden mit R“ basiert teilweise auf dem Buch „Applied Statistics for Bioinformatics using R“ von Wim P. Krijnen. In diesem Teil erfolgt auch eine Einführung in die Programmiersprache „R“, mit der nicht nur viele Tests im Bereich der Bioinformatik durchgeführt werden, sondern auch die typischen Tests für medizinische Promotionen im Bereich Biostatistik/Biometrie möglich sind.
Auf den folgenden Seiten soll es um der Bioinformatik gehen. Angelehnt an die Vorlesung haben wir uns mit den Folien (siehe: http://www. ibima. med. uni-rostock. de/IBIMA/ unter „Teaching1“) auseinandergesetzt und versucht, jeweils zu erklären, worum es geht. Somit sollte es mit diesem Script möglich sein, den hier behandelten Teil der Vorlesung eigenständig nachzuvollziehen. Doch vorweg erst einmal die Antwort auf die zwei wichtigsten Fragen zu diesem Thema:
Was geht mich das an? Im Rahmen heutiger Fragestellungen, bei denen es nicht mehr nur darum geht, ob z. B. ein Medikament wirkt oder nicht, sondern auch danach gefragt wird, wo es wirkt (Rezeptoren, Carrier, …) und wie genau es dort angreift, kommt man an der Visualisierung und Berechnung derartiger Zusammenhänge einfach nicht mehr vorbei. In vielen Fällen sind die Datenmengen, die mit modernen Geräten gewonnen werden, so groß, dass sie ohne vorherige Sortierung und Organisierung gar nicht greifbar (und somit auswertbar) sind. Jede Information ist immer nur soviel wert wie der Zusammenhang, in den sie gesetzt wird. Genau hier greift die Bioinformatik an und versucht mit Hilfe von Berechnungen Ordnung ins Chaos zu bringen. Dass uns dies noch nicht täglich in der Klinik begegnen wird ist klar. Wenn es jedoch darum geht, Forschung zu betreiben oder zu verstehen, woher die Daten von Genanalysen stammen und was damit gemacht werden kann, ist es recht hilfreich, einen Einblick bekommen zu haben.
In diesem Sinne hoffen wir, dass wir all jenen weiterhelfen können, die Probleme mit dem Themengebiet haben!
Bearbeitet werden hier nur die Inhalte der 1. Vorlesung sowie des 1. Seminars, und die Themen ‚Maximum Likelihood Phylogenie’ und ‚SNPs’.
Am Ende der Kapitel befinden sich Übungsaufgaben. Hierbei handelt es sich um Multiple-Choice-Aufgaben, bei denen jeweils nur eine Antwort richtig ist. Die Lösungen zu den Übungsaufgaben befinden sich im Anhang.
Das Skript ist angelehnt an die Vorlesung zur Bioinformatik von Prof. Füllen, die ein Teil der gemeinsam mit Prof. Kundt gehaltenen Vorlesung „Epidemiologie, Medizinische Biometrie und Medizinische Informatik“ ist.
Der erste Teil der Vorlesung basiert teilweise auf dem Buch „Algorithmen und Datenstrukturen - Eine Einführung mit Java“ von Saake/Sattler und auf Materialien von R. König aus Heidelberg (mit freundlicher Genehmigung).
Der vierte Teil des Skripts „Biomarker-Finden mit R“ basiert teilweise auf dem Buch „Applied Statistics for Bioinformatics using R“ von Wim P. Krijnen. In diesem Teil erfolgt auch eine Einführung in die Programmiersprache „R“, mit der nicht nur viele Tests im Bereich der Bioinformatik durchgeführt werden, sondern auch die typischen Tests für medizinische Promotionen im Bereich Biostatistik/Biometrie möglich sind.
Auf den folgenden Seiten soll es um der Bioinformatik gehen. Angelehnt an die Vorlesung haben wir uns mit den Folien (siehe: http://www. ibima. med. uni-rostock. de/IBIMA/ unter „Teaching1“) auseinandergesetzt und versucht, jeweils zu erklären, worum es geht. Somit sollte es mit diesem Script möglich sein, den hier behandelten Teil der Vorlesung eigenständig nachzuvollziehen. Doch vorweg erst einmal die Antwort auf die zwei wichtigsten Fragen zu diesem Thema:
Was geht mich das an? Im Rahmen heutiger Fragestellungen, bei denen es nicht mehr nur darum geht, ob z. B. ein Medikament wirkt oder nicht, sondern auch danach gefragt wird, wo es wirkt (Rezeptoren, Carrier, …) und wie genau es dort angreift, kommt man an der Visualisierung und Berechnung derartiger Zusammenhänge einfach nicht mehr vorbei. In vielen Fällen sind die Datenmengen, die mit modernen Geräten gewonnen werden, so groß, dass sie ohne vorherige Sortierung und Organisierung gar nicht greifbar (und somit auswertbar) sind. Jede Information ist immer nur soviel wert wie der Zusammenhang, in den sie gesetzt wird. Genau hier greift die Bioinformatik an und versucht mit Hilfe von Berechnungen Ordnung ins Chaos zu bringen. Dass uns dies noch nicht täglich in der Klinik begegnen wird ist klar. Wenn es jedoch darum geht, Forschung zu betreiben oder zu verstehen, woher die Daten von Genanalysen stammen und was damit gemacht werden kann, ist es recht hilfreich, einen Einblick bekommen zu haben.
In diesem Sinne hoffen wir, dass wir all jenen weiterhelfen können, die Probleme mit dem Themengebiet haben!
Bearbeitet werden hier nur die Inhalte der 1. Vorlesung sowie des 1. Seminars, und die Themen ‚Maximum Likelihood Phylogenie’ und ‚SNPs’.
Am Ende der Kapitel befinden sich Übungsaufgaben. Hierbei handelt es sich um Multiple-Choice-Aufgaben, bei denen jeweils nur eine Antwort richtig ist. Die Lösungen zu den Übungsaufgaben befinden sich im Anhang.