Ідентифікація селеноцистеїн кодуючих ділянок РНК

Автор: та

Анотація: У даній статті розглядаються питання не однозначності кодування селеноцистеїна в складі білків еукаріотичних організмів. Враховуючи особливості включення неканонічної амінокислоти до складу білків, зроблена спроба вирішення проблеми неоднозначності кодування селеноцистиїна. За допомогою алгоритму Нуссинів методом динамічного програмування з використанням класичних алгоритмів пошуку підрядка в рядку створений програмний продукт, що дозволяє вирішити проблему неоднозначності кодування триплетом TGA.

Бібліографічний опис статті:

та . Ідентифікація селеноцистеїн кодуючих ділянок РНК//Наука онлайн: Міжнародний електронний науковий журнал - 2017. - №11. - https://nauka-online.com/publications/biology/2017/11/identifikatsiya-selenotsistein-kodiruyushhih-uchastkov-rnk/

Стаття опублікована у: : Наука Онлайн No11 листопад 2017

Біологія

УДК 575

Полєщук Євгеній Олександрович

студент-спеціаліст

Національного технічного університету України

«Київський політехнічний інститут ім. Ігоря Сікорського»

Полещук Евгений Александрович

студент-специалист

Национального технического университета Украины

«Киевский политехнический институт им. Игоря Сикорского»

Polieshchuk Yevhenii

Student-Specialist of the

National Technical University of Ukraine

“Igor Sikorsky Kyiv Polytechnic Institute”

Науковий керівник:

Кисляк Сергій Володимирович

Старший викладач

Національний технічний університет України

«Київський політехнічний інститут ім. Ігоря Сікорського»

ІДЕНТИФІКАЦІЯ СЕЛЕНОЦИСТЕЇН КОДУЮЧИХ ДІЛЯНОК РНК

ИДЕНТИФИКАЦИЯ СЕЛЕНОЦИСТЕИН КОДИРУЮЩИХ УЧАСТКОВ РНК

IDENTIFICATION OF SELENOCYSTEINE ENCODING SECTORS IN RNA

Анотація. У даній статті розглядаються питання не однозначності кодування селеноцистеїна в складі білків еукаріотичних організмів. Враховуючи особливості включення неканонічної амінокислоти до складу білків, зроблена спроба вирішення проблеми неоднозначності кодування селеноцистиїна. За допомогою алгоритму Нуссинів методом динамічного програмування з використанням класичних алгоритмів пошуку підрядка в рядку створений програмний продукт, що дозволяє вирішити проблему неоднозначності кодування триплетом TGA.

Ключові слова: Селеноцистеїн, синтез білка, РНК, SECIS-елемент, вторинна структура РНК, біологічні послідовності.

Аннотация. В данной статье рассматриваются вопросы не однозначности кодирования селеноцистеина в составе белков эукариотических организмов. Учитывая особенности включения неканонической аминокислоты в состав белков, предпринята попытка решения проблемы неоднозначности кодирования селеноцистеина. С помощью алгоритма Нуссинов методом динамического программирования с использованием классических алгоритмов поиска подстроки в строке, создан программный продукт, позволяющий решить проблему неоднозначности кодирования триплетом TGA.

Ключевые слова: Селеноцистеин, синтез белка, РНК, SECIS-елемент, вторичная структура РНК, биологические последовательности.

Summary. This article deals with the non-uniqueness selenocysteine ​​coding in the composition of proteins of eukaryotic organisms. Taking into account the peculiarities of the noncanonical amino acid inclusion in the protein composition, an attempt was made to solve the problem of ambiguity in the coding of selenocysteine. Nussinov algorithm with the dynamic programming method can use classical substring search algorithms in a string. A software product that has been created, allows to solve the problem of the ambiguity of encoding with a TGA triplet.

Key words: Selenocysteine, protein synthesis, RNA, SECIS, secondary structure RNA, biological sequences.

Постановка проблеми. В останні роки з розвитком технологій секвенування нуклеотидних послідовностей кількість інформації в біологічних базах даних зростає з великою швидкістю. Аналіз таких баз даних дозволяє ідентифікувати нові, раніше невідомі гени, та встановити їх кінцеві продукти. Пошук нових селеновмісних білків ускладнюється тим, що при автоматичному комп’ютерному анотуванні прочитаних геномів, TGA кодони розпізнаються відповідними програмами ( наприклад UGENE, EMBOSS ), як стоп кодони.

Аналіз останніх досліджень. Історично селен розглядався як токсичний агент, але це уявлення радикально змінилося за останні 50років. Увага біологів та лікарів селен привернув в 1930 роки, коли з’ясувалося, що відсутність цього елементу викликає у людей важкі захворювання. Вперше у 1970 році кардіоміопатія дітей була пов`язана з дефіцитом селену [1]. В 1986 р. стало відомо, що неканонічна амінокислота сіленоцистеїн може бути вставлена в синтезовані ферменти глутатіонпероксидази мишей [2] та форміатдегідрогеназу Escherichia coli [3] в ході трансляції. Цікавим є той факт, що ця амінокислота кодується кодоном UGA в мРНК обох ферментів. Відповідно до [4] у монометиламінметилтрансферазі архебактерії Methanosarcina barkeri була ідентифікована раніше невідома амінокислота пірролізин, яка вставляється в білок протягом процесу трансляції при участи іншого стоп-кодону UAG. Невідомим залишається процес, в ході якого відбувається переключення відповідної програми генетичного коду.

Актуальність. Особливий інтерес вчених викликає роль селену в профілактиці злоякісних новоутворень. Фахівці з Корнельського і Арізонського університетів в США, спостерігаючи протягом кількох років за 1300 особами, зробили висновок, що споживання 200 мкг цього мікроелемента кожного дня, знижує ризик раку передміхурової залози на 63%, товстої кишки – на 58%, легень – на 46%, а в цілому всіх невиліковних видів раку – на 39%.

Мета дослідження. Розробити програмний продукт, що дозволяє ідентифікувати гени, що кодують селеноцистеїнвмісні білки.

Виклад основного матеріалу.

Механізм трансляції селеноцистеїнвмісних білків. Амінокислоти є субстратами для синтезу білка. Щоб цей процес став можливим, йому передує аміноацилювання. Аміноацилювання тРНК – процес активації амінокислот. Він відбувається на першому етапі біосинтезу білка – двадцять різних амінокислот приєднуються фосфодиефірним зв’язком до відповідних тРНК під дією двадцяти різних активуючих ферментів, які називаються аміноацил-тРНК-синтетазами. Кожен фермент специфічний по відношенню до певної амінокислоти і до відповідної тРНК. Аміноацилювання складається з двох стадій, що проходять в каталітичному центрі ферменту. На першій стадії в результаті взаємодії АТФ з амінокислотою утворюється проміжна сполука – аміноаціладенілат. На другій стадії аміноацільний залишок переноситься з аміноаціладенілата, пов’язаного з ферментом, на відповідну специфічну тРНК [5].

Селеноцистеїнова тРНК ацилюється за рахунок серинової аміноацил-тРНК-синтетази, після чого, до неї приєднується серин. Триплет UGA може зв’язуватись із специфічною тРНК, яка активована серином, потім серин замінється селеноцистеїном. Після такої модифікації, тРНК транспортується до рибосоми за допомогою білка SelB, що є продуктом гена selB.

У прокаріот, еукаріот, архей – фрагмент нуклеотидної послідовності, який пов’язує білок SelB із селеноцистеїновою тРНК, знаходиться не в кодуючій області, а далеко в 3′-нетрансльованій області мРНК. Модуль, який розпізнається представлений стабільною вторинною структурою РНК, в основі якої міститься UGA кодон. Таку ділянку зазвичай називають SECIS (selenocysteine insertion sequence) [6].

SECIS – елемент. SECIS – це послідовність РНК довжиною приблизно 60 нуклеотидів, що має характерну вторинну структуру. У відомих селенопротеїнових генах елементи SECIS розташовані в некодуючих областях зі сторони 3′-кінця, що знаходяться за триплетом UGA. Віддалений елемент SECIS також може функціонувати при вставці Sec (селеноцистеїну), за умови, що він є просторово близьким до триплету UGA. У бактерій SECIS – елемент знаходиться близько до кодону UGA, на який безпосередньо впливає. Якщо розглядати еукаріоти та археї, то характерною особливістю є той факт, що SECIS – елемент може впливати на декілька UGA – кодонів мРНК.

SECIS – елемент характеризується характерною вторинною структурою типу «шпилька». Ця структура формується парами комплементарних основ (A-U, G-C), між якими виникають водневі зв’язки. Також були встановлені і неканонічні пари основ A-G, що визначають функціонування цієї структури [7].

Вторинна структура РНК. Вторинна структура РНК стабілізується за рахунок водневих зв’язків між комплементарними парами азотистих основ. Відомими елементами цієї структури є шпильки та псевдовузли. Шпилька утворюється, коли дві послідовності одного ланцюга являються комплементарними одна одній, а також з’єднані одна до одної. Псевдовузол складається з двох шпильок, причому половина стебла однієї шпильки розташована між двома половинами стебла іншої шпильки.

Вторинна структура SECIS, представляє собою «шпильку». Передбачити наявність цього елементу можна враховуючи паттерн TGAAAGA, що зазвичий зустрічається в структурі SECIS елементів [7]. Він знаходиться після триплету UGA з 3′ кінця некодуючої області послідовності. У випадку, коли цей паттерн ідентифікований, UGA, в такому випадку, не є стоп кодоном, та дана послідовність РНК кодує амінокислоту, що містить селеноцистеїн. Структуру SECIS – елементу можна побачити на рисунку 1.

Рис. 1. SECIS – елемент у різних організмах [7]

Враховуючи особливості кодування селеноцистеїну та механізми «переключення» програми кодування амінокислот, необхідною умовою вирішення проблеми неоднозначності кодування триплетом UGA є передбачення вторинної структури мРНК з наступною ідентифікацією SECIS елементу, який відповідає за включення селеноцистеїну до білкової молекули на етапі трансляції.

Вторинну структуру можна передбачати для одиничної послідовності або аналізувати множинне вирівнювання сімейства родинних мРНК [8]. Для передбачення вторинної структури був використаний алгоритм Нуссинів методом динамічного програмування.

Алгоритм Нуссинів. Система визначення вторинної структури відповідно до алгоритму Нуссинів. Перший етап заповнення матриці динамічного програмування пов’язаний з ініціалізацією матриці (рис.2).

Рис. 2. Програмний продукт (заповнення матриці) [розробка автора]

При цьому комірки для та  для  приймають нульові значення. Для заданої послідовності нуклеотидів РНК довжиною L рекурсивно заповнюється матриця динамічного програмування. На кожному кроці отримання ваги комірки вибирають максимальне значення, що відповідає одному з чотирьох варіантів оптимальних структур. Алгоритм не враховує такі елементи вторинної структури, як псевдовузли. Процедуру зворотного проходу необхідно виконувати від комірки в правому верхньому куті матриці, що відповідає максимальній кількості стабілізуючих водневих зв’язків вторинної структури. Цікавим є той факт, що отримання оптимальної структури не завжди пов`язано з одним маршрутом, відповідно до процедури зворотного проходу. Існують альтернативні шляхи, що дозволяє відновити оптимальну вторинну структуру з максимальною кількістю водневих зв`язків та їх необхідно враховувати [8]. Програмний продукт дозволяє проаналізувати всі альтернатівні структури, що стабілізуються за рахунок максимальної кількості водневих зв`язків (рис.3). Для зручності аналізу та пошуку маркерної послідовності SECIS – елементу, вторинні структури візуалізуються за допомогою кругової діаграми. При визначенні однієї оптимальної структури, серед декількох альтернативних варіантів, враховується паттерн TGAAAGA, що зустрічається у SECIS регуляторному елементі селеноцистеїн кодуючої мРНК.

Рис. 3. Програмний продукт (графічне відображення структур) [розробка автора]

Висновки. Існують нестандартні амінокислоти, що кодуються триплетами, які зазвичай виступають стоп кодонами. Ці триплети можуть визначати кодування неканонічних амінокислот, в залежності від наявності чи відсутності особливих вторинних структур в некодуючій області зі сторони 3′ кінця. Для дослідження SECIS – елементу необхідно визначити вторинну структуру мРНК. Для цього запропоновано використовувати алгоритм Нуссинів, з урахуванням всіх альтернативних структур.

Розроблений програмний продукт визначає оптимальну вторинну структуру SECIS регуляторних елементів мРНК та дозволяє контролювати процес заповнення матриці динамічного програмування. При виконанні процедури зворотного проходу враховуються всі альтернативні структури РНК та обирається найбільш оптимальна. При визначенні оптимальної структури селеноцистеїн кодуючої мРНК запропоновано враховувати паттерн TGAAAGA. Знайдений SECIS-елемент дозволяє частково вирішити проблему неоднозначності кодування стоп триплетами.

Література

  1. Lukashenko N. P. Expanding Genetic Code: Amino Acids 21 and 22, Selenocysteine and Pyrrolysine. Published in Genetika, 20 10, Vol. 46, No. 8. – 1013–1032.
  2. Chambers, J., Frampton, J., Goldfarb, P., et al., TheStructure of the Mouse Glutathione Peroxidase Gene:The Selenocysteine in the Active Site Is Encoded bythe “Termination” Codon TGA, EMBO J., 1986,vol. 5, pp. 1221–1227.
  3. Zinoni, F., Birkmann, A., Stadtman, T.C., and Bock, A.,Nucleotide Sequence and Expression of the SelenocysteineContaining Polypeptide of FormateDehydrogenase (Formate-Hydrogen-Lyase-Linked) from Escherichia coli, Proc. Natl. Acad. Sci. U.S.A. , 1986,vol. 83, pp. 4650–4654.
  4. Srinivasan, G., James, C.M., and Krzycki, J.A., Pyrrolysine Encoded by UAG in Archaea: Charging of a UAGDecoding Specialized tRNA, Science, 2002, vol. 296, pp. 1459–1461.
  5. Berg JM, Tymoczko JL, Stryer L. BiochemistryH. Freeman and Company, 2007. – pp. 27-34.
  6. Voet D., Voet J.G. (2011). Biochemistry(вид. 4th). Wiley, – с.67-80.
  7. Heiko Mix, Alexey V. Lobanov and Vadim N. Gladyshev. SECIS elements in the coding regions of selenoprotein transcripts are functional in higher eukaryotes / Nucleic Acids Research. – 2007. – Vol. 35.
  8. Дурбин Р., Эдди Ш., Крог А., Митчисон Г. Анализ биологических последовательностей. – М. – Ижевск: «Регулярная и хаотическая динамика», Институт компьютерных исследований, 2006. – 480 с.

Перегляди: 1490

Коментарі закрито.

To comment on the article - you need to download the candidate degree and / or doctor of Science

Підготуйте

наукову статтю на актуальну тему, відповідно до роздлів журналу

Відправте

наукову статтю на e-mail: editor@inter-nauka.com

Читайте

Вашу статтю на сайті нашого журналу та отримайте сертифікат