Kaggle
Kaggle היא חברה שמתפעלת קהילה מקוונת של מדעני נתונים ומתרגלי למידת מכונה. Kaggle מאפשר למשתמשים למצוא ולפרסם מערכי נתונים, לחקור ולבנות מודלים בסביבת מדעי נתונים מבוססי אינטרנט, לעבוד עם מדעני נתונים ומהנדסי למידת מכונה אחרים, ולהיכנס לתחרויות כדי לפתור אתגרי מדעי הנתונים.
נתונים כלליים | |
---|---|
מייסדים | אנתוני גולדבלום |
תקופת הפעילות | אפריל 2010 – הווה (כ־14 שנים) |
חברת אם | חברת גוגל |
מיקום המטה | סן פרנסיסקו |
ענפי תעשייה | מדע הנתונים |
יו"ר | מקס לבצ'ין |
מנכ"ל | אנתוני גולדבלום |
www | |
Kaggle החלה את דרכה בשנת 2010 על ידי הצעת תחרויות למידת מכונה וכעת היא מציעה גם פלטפורמת מאגרי נתונים ציבורית, שולחן עבודה מבוסס ענן למדעי נתונים וחינוך לבינה מלאכותית. אנשי המפתח שלה היו אנתוני גולדבלום וג'רמי הווארד. ניקולס גרואן היה יו"ר המייסד שהחליף אותו מקס לבצ'ין. הון עצמי גויס ב-2011 שהעמיד את שוויה על 25 מיליון דולר. ב-8 במרץ 2017, גוגל הודיעה שהיא רוכשת את Kaggle.[1][2]
קהילת Kaggle
עריכהביוני 2017 הודיעה Kaggle שהיא עברה 1 מיליון משתמשים רשומים, או Kagglers,[3] ונכון לשנת 2021 יש לה למעלה מ-8 מיליון משתמשים רשומים.[4] הקהילה משתרעת על פני 194 מדינות. זוהי קהילה מגוונת, החל מאלו שרק התחילו את דרכם ועד החוקרים מהידועים בעולם.[5]
תחרויות Kaggle מושכות באופן קבוע למעלה מאלף קבוצות ויחידים. לקהילה של Kaggle יש אלפי מערכי נתונים ציבוריים וקטעי קוד (הנקראים "גרעינים" או kernels ב-Kaggle). רבים מהחוקרים הללו מפרסמים מאמרים בכתבי עת שנבדקו בסקרי עמיתים בהתבסס על ביצועיהם בתחרויות Kaggle.[6]
עד מרץ 2017, קרן Two Sigma Investments ניהלה תחרות על Kaggle לקוד אלגוריתם מסחר.[7]
השירותים של קגל
עריכה- תחרויות למידת מכונה: זה היה המוצר הראשון של Kaggle. חברות מפרסמות בעיות ולומדי מכונה מתחרים על בניית האלגוריתם הטוב ביותר, בדרך כלל עם פרסים כספיים.
- Kaggle Kernels: שולחן עבודה מבוסס ענן למדעי נתונים ולמידת מכונה. מאפשר למדעני נתונים לשתף קוד וניתוח ב-Python, R ו-R Markdown. למעלה מ-150K "גרעינים" (קטעי קוד) שותפו ב-Kaggle המכסים הכל, מניתוח סנטימנטים ועד זיהוי אובייקטים.
- פלטפורמת מערכי נתונים ציבוריים: חברי הקהילה חולקים מערכי נתונים זה עם זה. יש מערכי נתונים על כל דבר, מצילומי רנטגן של עצמות ועד לתוצאות מקרבות אגרוף.
- Kaggle Learn: פלטפורמה לחינוך בינה מלאכותית ב"נתחים" ניתנים לניהול.
איך פועלות תחרויות Kaggle
עריכה- מארח התחרות מכין את הנתונים ותיאור הבעיה.
- המשתתפים מתנסים בטכניקות שונות ומתחרים זה בזה כדי לייצר את הדגמים הטובים ביותר. העבודה משותפת בפומבי דרך Kaggle Kernels כדי להשיג רף טוב יותר וכדי לעורר רעיונות חדשים. ניתן לבצע הגשות דרך Kaggle Kernels, באמצעות העלאה ידנית או באמצעות ה-Kaggle API . עבור רוב התחרויות, ההגשות מקבלות ניקוד מיידי (בהתבסס על דיוק הניבוי שלהן ביחס לקובץ פתרונות נסתר) ומסוכמים בלוח הישגים חי.
- לאחר חלוף המועד האחרון, מנחה התחרות משלם את כספי הפרס בתמורה ל"רישיון עולמי, תמידי, בלתי הפיך וללא תמלוגים [...] לשימוש ברשומה הזוכה", כלומר האלגוריתם, התוכנה והקניין הרוחני הקשור שפותחו, שהוא "לא בלעדי אלא אם צוין אחרת".[8]
לצד התחרויות הציבוריות שלה, Kaggle מציעה גם תחרויות פרטיות המוגבלות למשתתפים המובילים ש Kaggle. וכן מציעה כלי חינמי למורים למדעי הנתונים להפעיל תחרויות למידת מכונה אקדמיות, Kaggle In Class . [9] בנוסף, Kaggle גם מארחת תחרויות גיוס שבהן מתחרים מדעני נתונים על הזדמנות להתראיין בחברות מובילות בתחום מדעי הנתונים כמו פייסבוק, Winton Capital ווולמארט.
ההשפעה של תחרויות Kaggle
עריכהKaggle ריצה מאות תחרויות למידת מכונה מאז הקמת החברה. התחרויות נעו בין שיפור זיהוי מחוות עבור Microsoft Kinect [10] ליצירת בינה מלאכותית של כדורגל עבור מנצ'סטר סיטי ועד לשיפור החיפוש אחר בוזון היגס ב- CERN.[11]
תחרויות הובילו לפרויקטים מוצלחים רבים, כולל קידום הטכנולוגיה המתקדמת בחקר ה-HIV,[12] דירוגי שחמט[13] וחיזוי תנועה.[14] במיוחד נודעים ג'פרי הינטון וג'ורג' דאל שהשתמשו ברשתות עצביות עמוקות כדי לזכות בתחרות בהנחיית Merck. ולאד מני (אחד מתלמידיו של הינטון) השתמש ברשתות עצביות עמוקות כדי לזכות בתחרות בהנחיית אדזונה. זה עזר להראות את הכוח של רשתות עצביות עמוקות והביא לכך שהטכניקה נלקחה על ידי אחרים בקהילת Kaggle. טיאנקי צ'ן מאוניברסיטת וושינגטון השתמשה גם ב-Kaggle כדי להראות את הכוח של XGBoost, שמאז השתלטה על היער האקראי כאחת השיטות העיקריות שבהן השתמשו כדי לזכות בתחרויות Kaggle.
כמה מאמרים אקדמיים פורסמו על בסיס ממצאים שנעשו בתחרויות Kaggle. מפתח לכך הוא ההשפעה של ה-Leaderboard בשידור חי, המעודד את המשתתפים להמשיך לחדש מעבר לשיטות העבודה הטובות ביותר הקיימות.[15] השיטות הזוכות נכתבות לעיתים קרובות בבלוג Kaggle, Kaggle Winner's Blog .
קישורים חיצוניים
עריכההערות שוליים
עריכה- ^ Lardinois, Frederic; Mannes, John; Lynley, Matthew (8 במרץ 2017). "Google is acquiring data science community Kaggle". Techcrunch. אורכב מ-המקור ב-9 במרץ 2017. נבדק ב-9 במרץ 2017.
Sources tell us that Google is acquiring Kaggle [...] the official announcement could come as early as tomorrow.
{{cite web}}
: (עזרה) - ^ "Google buys Kaggle and its gaggle of AI geeks". CNET (באנגלית). 2017-03-08. נבדק ב-2018-06-01.
- ^ "We've passed 1 million members". Kaggle Winner's Blog (באנגלית אמריקאית). 2017-06-06. נבדק ב-2018-08-19.
- ^ https://www.kaggle.com/tunguz/unique-kaggle-users
- ^ Markoff, John. "Scientists See Advances in Deep Learning, a Part of Artificial Intelligence" (באנגלית). נבדק ב-2018-08-19.
- ^ "Google Scholar". scholar.google.com. נבדק ב-2018-08-19.
- ^ Wigglesworth, Robin (8 במרץ 2017). "Hedge funds adopt novel methods to hunt down new tech talent". The Financial Times. United Kingdom. נבדק ב-29 באוקטובר 2017.
{{cite news}}
: (עזרה) - ^ Kaggle. "Terms and Conditions - Kaggle".
- ^ Kaggle. "Kaggle in Class". אורכב מ-המקור ב-2011-06-16. נבדק ב-2011-08-12.
- ^ Byrne, Ciara (12 בדצמבר 2011). "Kaggle launches competition to help Microsoft Kinect learn new gestures". VentureBeat. נבדק ב-13 בדצמבר 2011.
{{cite news}}
: (עזרה) - ^ "The machine learning community takes on the Higgs". Symmetry Magazine. 15 ביולי 2014. נבדק ב-14 בינואר 2015.
{{cite news}}
: (עזרה) - ^ Carpenter, Jennifer (בפברואר 2011). "May the Best Analyst Win". Science Magazine. נבדק ב-1 באפריל 2011.
{{cite news}}
: (עזרה) - ^ Sonas, Jeff (20 בפברואר 2011). "The Deloitte/FIDE Chess Rating Challenge". Chessbase. נבדק ב-3 במאי 2011.
{{cite news}}
: (עזרה) - ^ Foo, Fran (6 באפריל 2011). "Smartphones to predict NSW travel times?". The Australian. נבדק ב-3 במאי 2011.
{{cite news}}
: (עזרה) - ^ Athanasopoulos, George; Hyndman, Rob (2011). "The Value of Feedback in Forecasting Competitions" (PDF). International Journal of Forecasting. Vol. 27. pp. 845–849.