Multiple Sequence Alignment
Här kan man under de närmaste veckorna följa mitt projektarbete i fortsättningskursen för algoritmer på Chalmers. Arbetet ska behandla genanalys, hur man effektivt kan sätta ihop flera mindre DNA-bitar till en längre sekvens.
 

Det enklaste sättet att sätta ihop protein-bitar är att sätta ihop dem parvis, detta kallas för pairwise sequence alignment. Hur man gör detta kommer kortfattat beskrivas under det här projektet, den stora vikten kommer dock att läggas på s.k. multiple sequence alignment(MSA), dvs. när man vill slå ihop fler en två sekvenser. Här uppstår det dock ett problem om man använder sig av samma metod som för pairwise sequence alignment. Om man försöker gruppera fyra sekvenser med längden 50, där en parvis gruppering av två stycken av sekvenserna tar en sekund, tar det sekunder, vilket är lite drygt två och en halv timme. Tiden skenar iväg ordentligt och redan vid 16 sekvenser av längden 50 så kommer ingen lösning hittas innan solen slocknar.

För att kunna lösa detta finns det andra metoder att ta till, det är dessa som kommer att beskrivas här. De vanligaste metoderna kommer att förklaras översiktligt, varav en kommer att förklars lite djupare. Det kommer även att tillverkas en applikation för att kunna beräkna multiple sequence alignment. Applikationen kommer att använda sig av den metod som beskrivs djupare. Applikationen kommer, när den är klar att läggas ut här så att det ska gå att ladda ner den. Målet är att skriva i språket C++ mha STL (Standard Template Libraries), detta för att jag ska få en djupare kunskap hur biblioteket används.

 

Detta ska göras:

  • Beskriva metod för Pairwise Sequence Alignment
  • Beskriva metoder Multiple Sequence Alignment
  • Djupare analys av en MSA-metod
  • Implementering av en MSA-applikation
  • Fördjupa kunskapen i STL

Länkar:

Kursens hemsida
Projektbeskrivning
MCB416/516