УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта


јвтор:  √ришин ≈.ћ.
Ќазвание:  ќценочные методы в протеомике
¬ыпуск:  95
–убрика:  ”правление в медико-биологических и†экологических системах
√од:  2022
Ѕиблиографи€:  √ришин ≈.ћ. ќценочные методы в протеомике // ”правление большими системами. ¬ыпуск 95. ћ.: »ѕ” –јЌ, 2022. —.47-61. DOI: https://doi.org/10.25728/ubs.2022.95.3
 лючевые слова:  протеомика, задача о рюкзаке, метод ветвей и границ, параллельные вычислени€
 лючевые слова (англ.):  proteomics, the knapsack problem, the branch and bound method, parallel computing
јннотаци€:  —овременные математические методы исследовани€ белка, такие как database search и de novo, имеют свои недостатки. ѕри помощи database search невозможно определить белок, который отсутствует в базах данных. ћетоды de novo позвол€ют идентифицировать новые белки, но при этом €вл€ютс€ очень ресурсоемкими (требуетс€ использование суперкомпьютера). ¬†рамках данного проекта был разработан комплексный подход приближенного анализа исследуемого белка, проводимый на персональном компьютере. «адача качественного и количественного определени€ исходной последовательности (белка) состоит из трех подзадач. ѕерва€ Ц устранение шумов и выделение пиков по данным масс-спектрометрии. Ѕыл разработан алгоритм, сочетающий метод скольз€щего среднего и технологию вычислительной фотографии HDR. ¬тора€ подзадача Ц идентификаци€ пиков. ќна была сведена к†задаче о рюкзаке и решена при помощи метода ветвей и границ. ѕоследн€€ подзадача Ц восстановление исходной последовательности по набору фрагментов (пики и их интенсивности). ƒанна€ подзадача была решена при помощи построени€ двоичных деревьев и поиска пути максимальной длины. ¬се вычислени€ проводились на ѕ  с применением технологии параллельных вычислений CUDA.
јннотаци€ (англ.):  Modern mathematical methods for protein analysis, such as database search and de novo methods, have their own drawbacks. It is not possible to identify proteins that are not included in databases using database search. The de novo methods allow us to identify new proteins but they are very computationally demanding (requiring the use of a supercomputer). In this project a complex approach of approximate protein analysis conducted on a personal computer was developed. A problem of qualitative and quantitative determination of initial sequence (protein) consists of three subproblems. The first one is noise cancellation and peak identification using mass spectrometry data. An algorithm combining a sliding average method and computational photography HDR technology was developed. The second subproblem is peak identification. It was reduced to a knapsack problem and solved using the branch and bound method. The last subproblem is initial sequence reconstruction using a set of fragments (peaks and their intensities). This subproblem was solved by constructing double trees and searching for a path of maximum length. All calculations were performed on a PC using CUDA parallel computing technology.

в формате PDF

ѕросмотров: 229, загрузок: 55, за мес€ц: 5.

Ќазад

»ѕ” –јЌ © 2007. ¬се права защищены