גנומיקה חישובית

גנומיקה חישובית (לעיתים נקראת גנטיקה חישובית) היא שימוש בניתוחים סטטיסטיים וחישוביים על מנת להסיק מסקנות ביולוגיות מהרצף הגנומי וממידע רלוונטי נוסף, הכולל רצפי דנ"א ורנ"א יחד עם מידע "פוסט-גנומי" (מידע ניסויי שהושג על ידי טכנולוגיות הדורשות ריצוף של הגנום, לדוגמה מערך דנ"א גנומי). מידע זה, בשילוב עם גישות חישוביות וסטטיסטיות, משמש להבנת תפקוד גנים וניתוח אסוציאציות סטטיסטיות. תחום זה נקרא גם גנטיקה חישובית וסטטיסטית או גנומיקה חישובית וסטטיסטית. גנומיקה חישובית נחשבת לתת-תחום של הביואינפורמטיקה, אולם היא ממוקדת יותר בכך שהיא משתמשת בגנומים שלמים (לעומת שימוש בגנים בודדים) על מנת להבין את עקרונות הדרך בה דנ"א של מין מסוים שולט על הביולוגיה שלו ברמה המולקולרית ואף מעבר לה. כיום, כאשר ישנו שפע של מאגרי מידע ביולוגיים גדולים, מחקרים חישוביים הפכו לאחת הדרכים החשובות לגילויים ביולוגיים.

היסטוריה

עריכה

שורשי הגנומיקה החישובית משותפים לאלו של הביואינפורמטיקה. במהלך שנות השישים של המאה העשרים, מרגרט דייהוף וחברים נוספים ב-National Biomedical Research Foundation יצרו מאגר מידע של רצפי חלבונים הומולוגיים לשם מחקרים אבולוציוניים. המחקר שלהם פיתח עץ פילוגנטי, שבהסתמך על רצף חומצות האמינו, קבע את השינויים האבולוציוניים הנדרשים לחלבון מסוים על מנת להפוך לחלבון אחר. תוצאות אלו הביאו אותם ליצור טבלת ציונים שהעריכה את הסבירות של חלבון מסוים להיות קשור לחלבון אחר.

החל משנות ה-80 הופיעו מאגרי מידע של רצפים גנומיים, אולם אלו הציגו אתגר חדש - חיפוש במאגרים אלו והשוואת מידע על גנים בין מאגרי מידע שונים. שלא כמו באלגוריתמים לחיפוש-טקסט שבהם משתמשים באתרים כמו גוגל או ויקיפדיה, חיפוש מקטעים בעלי דמיון גנטי דורשים מציאת מחרוזת שאינה זהה לחלוטין, אלא דומה. בעיה זו הובילה לפיתוח אלגוריתמים לעימוד רצפים כמו אלגוריתם נידלמן-וונש, שהוא אלגוריתם תכנות דינמי המשווה בין רצפי חומצות אמינו תוך שימוש בטבלאות ציונים שנגזרו ממחקרה המקורי של דייהוף. בהמשך, פותח אלגוריתם BLAST לשם ביצוע חיפושים מהירים במאגרי מידע של רצפי גנים. BLAST ונגזרותיו הם ככל הנראה האלגוריתמים הנפוצים ביותר לפתרון בעיה זו.

צמיחתו של המונח "גנומיקה חישובית" עולה בקנה אחד עם הזמינות של רצפים גנומיים מלאים לקראת אמצע-סוף שנות ה-90. הפגישה הראשונה של הכנס השנתי בנושא גנומיקה חישובית אורגנה על ידי מדענים מהמכון למחקר גנומי (TIGR) בשנת 1998 וסיפקה במה להתמחות זו לצד הפרדת תחום מחקר זה מתחומים כלליים יותר של גנומיקה וביולוגיה חישובית. השימוש הראשון במונח זה בספרות המדעית לפי התקצירים המפורסמים בMEDINE היה רק כשנה לפני, בכתב העת המדעי Nucleic Acids Research.[1] כנס הגנומיקה החישובית האחרון התקיים ב-2006, כאשר הנואם הראשי היה זוכה פרס נובל בארי מרשל, אחד ממגלי הקשר בין ההליקובקטר פילורי וכיבי קיבה. החל משנת 2010, הכנסים המובילים בתחום כוללים את הכנסים Intelligent Systems for Molecular Biology (ISMB), RECOMB, והכנסים "Biology of Genomes" ו-"Genome Informatics".

התפתחות השילוב בין מתמטיקה לכלים חישוביים (תוך שימוש בכלים כמו Mathematica ו-MATLAB) עזרה למהנדסים, מתמטיקאים ומדעני מחשבים לפעול במרחב זה, וישנו גידול באוסף הציבורי של מחקרים והדגמות בתחום, החל מהשוואות של גנומים שלמים ועד לניתוח ביטוי גנים. מחקרים אלו הציגו רעיונות שונים, וכללו עקרונות של מערכות ובקרה, תורת המידע, תאוריית המיתרים וכריית מידע. ניתן לחזות ששיטות חישוביות ייהפכו לתחום סטנדרטי למחקר ולימוד, היוצר סטודנטים השולטים היטב בשני התחומים.

תרומתו של המחקר בתחום הגנומיקה החישובית לביולוגיה

עריכה

תרומתו של המחקר בתחום הגנומיקה החישובית כולל:

  • גילוי תבניות ברצפים גנומיים
  • הצעת מסלולי אותות תאיים
  • הצעת מנגנוני אבולוציה גנומית
  • חיזוי מיקומים מדויקים של כל הגנים האנושיים תוך שימוש בטכניקות של גנומיקה השוואתית במספר מינים של יונקים וחולייתנים
  • חיזוי אתרים גנומיים שמורים הקשורים להתפתחות עוברית מוקדמת
  • גילוי קשרים פוטנציאליים בין מוטיבים רצפיים חוזרניים וביטוי גנים ספציפי ברקמה
  • מדידת אזורים גנומיים שעברו אבולוציה מהירה בצורה חריגה

ההתפתחויות האחרונות (החל מ-2012)

עריכה

המודל הממוחשב הראשון של אורגניזם

עריכה

מאמץ משותף של אוניברסיטת סטנפורד ומכון קרייג ונטר (JCVI) יצרו את תוכנת הסימולציה הראשונה של אורגניזם שלם. לאורגניזם החופשי הקטן ביותר, מיקופלסמה גניטליום, 525 גנים הממופים במלואם. עם מידע שמקורו ביותר מ-900 מאמרים מדעיים על החיידק, חוקרים פתחו את המודל תוך שימוש בגישת תכנות מונחית עצמים. הם יצרו סדרת מודלים המחקים תפקודים תאיים שונים שלאחר מכן שולבו ליצירת סימולציה של האורגניזם השלם. הסימולציה רצה על שילוב של 128 מחשבים ומשחזרת את תוחלת החיים המלאה של תא ברמה המולקולרית, מייצרת אינטראקציות של מולקולות בתהליכים תאיים כמו מטבוליזם וחלוקה תאית. צירוף מקרים מעניין הוא שזמן ריצת הסימולציה מתפרש על כ10 שעות, שהוא בערך זמן החיים של תא חי בסביבתו הטבעית. 'תא הסיליקון' יפעל כמעבדה ממוחשבת שתוכל לבצע ניסויים שקשה לבדוק על אורגניזם אמיתי, או שתוכל לבצע הליכים בצורה מהירה יותר. היישומים יכללו סריקה מהירה יותר של תרכובות חדשות והבנה של עקרונות והתנהגות תאית בסיסית.

ראו גם

עריכה

קישורים חיצוניים

עריכה

הערות שוליים

עריכה
  1. ^ A Wagner, A computational genomics approach to the identification of gene networks., Nucleic Acids Research 25, 1997-09-15, עמ' 3594–3604