Inlämning av Examensarbete / Submission of Thesis

Sandra Olandersson MCS-2003:12, pp. 62. Inst. för programvaruteknik och datavetenskap/Dept. of Software Engineering and Computer Science, 2003.

The work

Författare / Author: Sandra Olandersson
sandra.olandersson@spray.se
Titel / Title: Evaluation of Machine Learning Algorithms for Classification of Short-Chain Dehydrogenase/Reductase Protein Sequences
Översatt titel / Translated title: Evaluering av Maskininlärningsalgoritmer för Klassificering av Short-Chain Dehydrogenase/Reductase Proteinsekvenser
Abstrakt Abstract:

The classification of protein sequences is a subfield in the area of Bioinformatics that attracts a substantial interest today. Machine Learning algorithms are here believed to be able to improve the performance of the classification phase.

This thesis considers the application of different Machine Learning algorithms to the classification problem of a data set of short-chain dehydrogenases/reductases (SDR) proteins. The classification concerns both the division of the proteins into the two main families, Classic and Extended, and into their different subfamilies. The results of the different algorithms are compared to select the most appropriate algorithm for this particular classification problem.

Populärvetenskaplig beskrivning / Popular science summary: Klassificeringen av proteinsekvenser är ett område inom Bioinformatik, vilket idag drar till sig ett stort intresse. Maskininlärningsalgoritmer anses här kunna förbättra utförandet av klassificeringsfasen.

Denna uppsats rör tillämpandet av olika maskininlärningsalgoritmer för klassificering av ett dataset med short-chain dehydrogenases/reductases (SDR) proteiner. Klassificeringen rör både indelningen av proteinerna i två huvudklasser, Classic och Extended, och deras olika subklasser. Resultaten av de olika algoritmerna jämförs för att välja ut den mest lämpliga algoritmen för detta specifika klassificeringsproblem.
Ämnesord / Subject: Datavetenskap - Computer Science\Artificial Intelligence

Nyckelord / Keywords: Machine Learning algorithms, Bioinformatics, Sequence analysis, SDR proteins

Publication info

Dokument id / Document id:
Program:/ Programme Magisterprogram Datavetenskap, 40 poäng/Master programme Computer Science
Registreringsdatum / Date of registration: 09/16/2004
Uppsatstyp / Type of thesis: D-Uppsats/Magister/Master

Context

Handledare / Supervisor: Paul Davidsson
paul.davidsson@bth.se
Examinator / Examiner: Rune Gustavsson
Organisation / Organisation: Blekinge Institute of Technology
Institution / School: Inst. för programvaruteknik och datavetenskap/Dept. of Software Engineering and Computer Science
Inst. för Programvaruteknik och Datavetenskap S-372 25 Ronneby
+46 455 38 50 00
http://www.ipd.bth.se/
I samarbete med / In co-operation with: Karolinska Institutet
Anmärkningar / Comments:

Sandra Olandersson
Blåbärsvägen 27
372 38 Ronneby
home: 0457-12084

Files & Access

Bifogad uppsats fil(er) / Files attached: ml_classification.pdf (869 kB, öppnas i nytt fönster)