גלקסי (ביולוגיה חישובית)
גלקסי (Galaxy) - היא תוכנה אינטרנטית חינמית לעיבוד וניתוח נתונים בתחום הביולוגיה החישובית, שנועדה להנגיש את המחקר למדענים חסרי רקע בתכנות מחשבים. התוכנה פותחה עבור מחקר גנומי, אך משמשת כלי למגוון תחומי מחקר בביולוגיה החישובית.
מפתח | המרכז לגנומיקה השוואתית וביואינפורמטיקה באוניברסיטת המדינה של פנסילבניה ובאוניברסיטת אמורי יחד עם תרומות מהקהילה |
---|---|
מחזור חיים | 2004–הווה (כ־20 שנה) |
גרסה אחרונה | 23.0 (11 באפריל 2023) |
מערכת הפעלה | מערכת הפעלה דמוית יוניקס |
נכתבה בשפות | פייתון, JavaScript |
סוג רישיון | AFL[1] |
קוד מקור | https://github.com/galaxyproject/galaxy |
GalaxyProject.org | |
שימושים
עריכההתוכנה מאפשרת ליצור רצף של שלבי אנליזה חישוביים, כמעין מתכון עבודה אותו ניתן להפעיל על נתונים רבים. ניתן לעשות זאת באמצעות ממשק גרפי המסייע לבחור את הנתונים עליהם יופעל המתכון, איזה שלבים כדאי להכניס ובאיזה סדר.
גלקסי מאפשרת שילוב של נתונים ממאגרי מידע שונים. התוכנה תומכת בהעלאת נתונים מהמחשב האישי, מ-URL וממקורות רבים ברחבי המרשתת (כמו הדפדפן הגנומי של אוניברסיטת קליפורניה, BioMart ו-InterMine).
גלקסי תומכת במגוון פורמטים האופייניים לתוכנות ביואינפורמטיות, ובהמרה בין הפורמטים השונים. התוכנה כוללת ממשק המאפשר לעשות מניפולציות לטקסט. דבר זה מאפשר לחוקרים לסדר נתונים כראות עיניהם ללא צורך בתכנות מחשבים.
גלקסי כוללת כלים למניפולציה על אינטרוולים, שבאמצעותם ניתן לעשות פעולות תאורטיות מוגדרות במרווחים (כגון חיתוך ואיחוד נתונים).
פורמטים רבים של תוכנות ביולוגיות כוללות מידע גנומי אינטרוולי (למשל שם כרומוזום, קואורדינטות על גבי כרומוזום) שניתן לעבוד עליו באמצעות גלקסי.
גלקסי גם תומכת בעיבוד וניתוח ארוכי טווח, אשר ממשיכה לחשב גם כאשר התוכנה אינה פתוחה במחשב האישי, וכן בפרסום הנתונים.
כדי להשתמש בתוכנה, יש ליצור שם משתמש. באמצעות המשתמש ניתן לבצע פעולות רבות שיתוארו להלן.
מטרות המיזם
עריכהנגישות
עריכהביולוגיה חישובית הוא תחום מחקר הדורש לרוב הבנה בתכנות מחשבים. גלקסי שואף להנגיש את כלי המחקר למדענים שאינם בעלי רקע בתכנות מחשבים. גלקסי עושה זאת באמצעות מתן דגש על ממשקים ידידותיים למשתמש על פני היכולת לבנות מתכוני עבודה מורכבים. העדפה זו מאפשרת ליצור מתכוני עבודה פשוטים בקלות, אך מקשה על האפשרות לבנות תכנוני עבודה מורכבים.
שחזור
עריכהבמחקר מדעי ישנה חשיבות רבה לשחזור. כאשר מתפרסמות תוצאות של מחקר מדעי, יש לספק מספיק נתונים כדי שאחרים יוכלו לחזור על הניסוי ולקבל את אותן התוצאות. לאחרונה הושקעו מאמצים רבים כדי לאפשר זאת בתחומי מחקר חישוביים ("מעבדה יבשה") ולא רק מניסויים במעבדה ("מעבדה רטובה").[2]
גלקסי תומכת בשחזור הפעולות שנעשו על ידי מידע שנצרב בכל שלב ושלב, כך שניתן לעשות בדיוק את אותו הניתוח בכל עת. דבר זה כולל מעקב אחר כל הקלט, שלבי הביניים, מערכי הנתונים הסופיים, הפרמטרים שהופעלו עליהם וסדר הפעולות שנעשו.
שקיפות
עריכהגלקסי תומכת בשקיפות במחקר המדעי, על ידי-כך שהתוכנה מאפשרת שיתוף פריטים עם הציבור או עם משתמשים ספציפיים. ניתן לבחון פריטים משותפים, להריץ מחדש, להתאים לדרישות חדשות ועוד.
פריטי גלקסי: היסטוריות, תכנוני עבודה, סדרות נתונים ודפים
עריכהפריטי גלקסי כוללים כל דבר שניתן לשמור ולשתף דרך התוכנה.
- היסטוריות
- היסטוריות הם סדרת ניתוח חישובית (מתכון עבודה) המורץ עם קלט של סדרות נתונים, שלבים חישוביים מוגדרים ופרמטרים מסוימים. היסטוריות כוללות את כל שלבי הביניים וכן את הפלט הסופי.
- מתכוני עבודה
- מתכוני עבודה הם סדרת ניתוח חישובית הכוללת שלבים חישוביים מוגדרים ופרמטרים מסוימים, אך אינה כוללת סדרות נתונים. מתכוני העבודה משמשים להפעלת אותו ניתוח על סדרות נתונים שונות.
- סדרות נתונים
- סדרות נתונים כוללים כל סדרה של קלט, תוצר ביניים או פלט שבו משתמשים או שמופק במהלך האנליזה.
- דפים
- היסטוריות, מתכוני עבודה וסדרות נתונים יכולים לכלול הסברים שהוזנו על ידי משתמשים. גלקסי מאפשר יצירת עמוד וירטואלי המתאר את האיך והלמה של שלבי הניסוי. שילובם של היסטוריות, מתכוני עבודה וסדרות נתונים עם הדפים הווירטואליים תומכים במטרה זו.
זמינות
עריכהגלקסי זמינה:
- כשרת אינטרנט ציבורי חינמי[3], הנתמך על ידי מיזם גלקסי[4]. שרת זה כולל כלים ביואינפורמטיים רבים אשר עושים בהם שימוש נרחב במחקרים גנומיים. ניתן ליצור שם משתמש, ולשמור היסטוריות, מתכוני עבודה, סדרות נתונים ודפים, אותם ניתן לשתף עם משתמשים אחרים.
- כתוכנת קוד פתוח שניתן להוריד, להתקין ולהתאים לצרכים ספציפיים. ניתן להתקין בצורה מקומית וכן על מחשוב ענן.
- כשרתי אינטרנט ציבוריים בחסות ארגונים שונים[5]. חלק מהארגונים בחרו להפוך את השרתים שלהם זמינים לאחרים.
- כחלק מיוזמת GenomeSpace.
יישום
עריכהגלקסי היא תוכנת קוד פתוח המיושמת באמצעות שפת תכנות פייתון. היא פותחה על ידי צוות גלקסי[6] באוניברסיטת המדינה של פנסילבניה ובאוניברסיטת אמורי ועל ידי קהילת גלקסי.
ניתן להרחיב את השימוש בגלקסי על ידי שימוש בממשק שורת פקודה. אותה ניתן לשלב ולשתף באמצעות ארגז הכלים של גלקסי (Galaxy ToolShed). דוגמה להרחבה כזו היא Galaxy-P, אשר הותאמה לניתוח נתונים המתקבלים מספקטרומטר מסה על ידי המכון למחשוב-על באוניברסיטת מינסוטה.
קהילה
עריכהגלקסי היא מיזם קוד פתוח והקהילה כוללת משתמשים, ארגונים, מפתחי גלקסי ומפתחי כלים ביואינפורמטיים. למיזם הגלקסי יש רשימות תפוצה[7], ויקי קהילתית[8] ומפגשים שנתיים[9].
גלקסי הושקה לראשונה ב-2004 כפרויקט משותף בין מעבדות באוניברסיטת המדינה של פנסילבניה ובאוניברסיטת אמורי. מקור השם הוא במאגר מידע בשם (GALA (Genome Alignment and Annotation שהוסיפו לו את האותיות XY. התוכנה נכתבה בשפת התכנות פרל. לתוכנה זו היו פונקציות בסיסיות, ביניהן האפשרות לייבא מידע מהדפדפן הגנומי של אוניברסיטת קליפורניה שנעשתה ללא אישור מצדם. בהמשך הדפדפן הגנומי של אוניברסיטת קליפורניה הוסיפו את האפשרות לייצא נתונים בפורמט המתאים לגלקסי. באמצע 2005 הושקה התוכנה כמבוססת על שפת התכנות פייתון. פריצת דרך משמעותית חלה בשנת 2006 כאשר ה-NSF תמכה בפיתוח ממשק חדש ונגיש יותר, שהיווה את הצעד המשמעותי הראשון במילוי מטרות המיזם. בשנת 2010 צוות הגלקסי מנה כ-80 עובדים, וב-2011 עמד המספר על 150 עובדים. בשנים אלו החלו לתת דגש על פיתוח התוכנה אשר ניתן להתאים אותה לצרכים שונים על פני האתר, בד בבד עם העלייה באיכות והירידה במחיר של הרצפה, דבר המצריך ניתוח של תוצאות הקריאה. התחזית היא שלכל בתי החולים תהיה הטכנולוגיה הזו, ועקב כך יתרחב השימוש בשירותי התוכנה. ב-1.1.2014 המעבדה באוניברסיטת אמורי בראשות ג'יימס טיילור עברה, יחד עם צוותה אל אוניברסיטת ג'ונס הופקינס ומשם היא פועלת כיום (2014).
קישורים חיצוניים
עריכה- אתר האינטרנט הרשמי של גלקסי (באנגלית)
- אתר גלקסי
הערות שוליים
עריכה- ^ http://wiki.galaxyproject.org/Admin/License
- ^ Ioannidis, J. P. A.; Allison, D. B.; Ball, C. A.; Coulibaly, I.; Cui, X.; Culhane, A. N. C.; Falchi, M.; Furlanello, C.; Game, L.; Jurman, G.; Mangion, J.; Mehta, T.; Nitzberg, M.; Page, G. P.; Petretto, E.; Van Noort, V. (2008). "Repeatability of published microarray gene expression analyses". Nature Genetics 41 (2): 149–155. doi:10.1038/ng.295. PMID 19174838
- ^ http://usegalaxy.org/
- ^ http://wiki.galaxyproject.org/GalaxyTeam
- ^ http://wiki.galaxyproject.org/PublicGalaxyServers
- ^ http://wiki.galaxyproject.org/GalaxyTeam
- ^ http://wiki.galaxyproject.org/MailingLists
- ^ http://wiki.galaxyproject.org/
- ^ http://wiki.galaxyproject.org/Events
- ^ https://wiki.galaxyproject.org/Events/GCC2011 הרצאה (Introduction to Galaxy) העוסקת בעבר, הווה ועתיד של גלקסי שניתנה ב-2011