שיחת ויקיפדיה:נתונים סטטיסטיים

תגובה אחרונה: לפני 5 שנים מאת ראובן מ. בנושא הערכים הנצפים ביותר בשנת 2018

קובץ הסטטיסטיקות

עריכה

מעניין לראות את הסטטיסטיקות של האתר שלנו כ-CHARTS

ברור כי:

  • מספר התורמים (וויקיפדים) הוא קטן, ולא תפס תנופה החל מתחילת הפרויקט, סה"כ יש 23 פעילים ממש והתחלנו ב-20.
  • יש בסה"כ 2 תורמים "כבדים" (עם יותר מ-100 לחודש)
  • סופרים שם מאמרים עם לינק אחד לפחות ו/או יותר מ-200 תווים
  • הגידול בנפח ה-DB קצת נעצר. (אם כי אין עדיין קו מגמה, אחרי 3 חודשים)

מסקנה יש לשאוף ולפרסם יותר את וויקי שלנו - כדי שיווספו עוד תורמים משמעותיים למאמרים. ^^ דוד1 04:04, 16 אוק' 2003 (UTC)


אם יורשה לי לעודד-
אצל בני דודנו שהתחילו עימנו המצב יותר גרוע: רק 4 מתוך מאות מליונים.
והנורא מכל אצל היוונים, 2 במשך שנה תמימה. אימפריה שקרסה באופן מושלם.
לעומת זאת, החב'רה מאספרנטו עושים עבודה נפלאה. מעולם לא היו חסידי זמנהוף כה פעילים. השפה הזו לא מתה אלא צומחת ומתחדשת.
בן הטבע.

אז אם הם חלשים, זה צריך לתת לנו מנוחה? למה אתה לא מסתכל "למעלה"? תראה מה עשו באנגלית, תבדוק את הקצב המדהים של הצמיחה שלהם - פשוט לא יאומן. ואפילו באספרנטו כפי שציינת יש תנופה.
וזה לא אומר שיש לי טענות על קצב או רמת הכניסה לעבודה בוויקי שלנו. אבל צריך לעודד ו"לגייס" עוד כוחות.
^^ דוד1 21:14, 17 אוק' 2003 (UTC)

איך סופרים מאמרים בוויקי

עריכה

או מה נחשב בוויקי כמאמר

הועבר מויקיפדיה:מזנון/ארכיון 4

כתשובה להרבה שאלות שהופיעו כאן בדקתי ו"גיליתי" כי
מאמר הוא דף שאינו הפנייה (REDIRECT) או דף משתמש, או דף שיחה, ושיש לו לפחות קישור (LINK) אחד
בקישור הבא הסבר מלא ומפורט: http://meta.wiki.x.io/wiki/Article_count_reform ^^ דוד1 21:00, 18 אוק' 2003 (UTC)

חששתי שזו תהיה התשובה. מאמר כדבריך הוא בפועל כמעט כל ערך שנפתח.

רשימת הוויקי עם קצב הגידול הגדול ביותר

עריכה

בערך הסטטיסטי של וויקי בשפות שונות בפרק: Fastest Growing Wikipedias, אנו מופיעים במקום ה-6 בקצב הגידול (נראה לי שסופרים מספר מאמרים) בחודש אוקטובר 2003 - 48%.
אז נכון שחלק מזה נובע מהגודל הקטן יחסית שלנו, אך מאידך מצביע על עבודה ניכרת ומשמעותית, שנעשתה כאן.
הקרדיטים ו"הידד" לתורמים ה"כבדים" של מאמרים חדשים.
הערה: שימו לב שאנחנו בסטט. "ליד" הצ'כים (מבחינת מספר הערכים), שהתחילו הרבה לפנינו בנוב. 2002 (ה-DB שלנו 3MB גדול כמעט פי 3 משלהם)
^^ דוד1 08:35, 21 אוק' 2003 (UTC)

יש לי כרגע כמה עשרות מאמרים עם למעלה מעשר שורות. אם אתם מתעקשים, אני אוכל להעלות אותם היום ולהביא אותנו לאלף. אם כי אין לי חשק שמישהו בטעות יתחיל לשחק לי איתם. לדעתי, המטרה היא לא האלף (עד כמה שסמלי הדבר) אלא 2000 ונראה לי שנגיע לשם עד ראשית 2004. בן הטבע.
שאלה: לגבי 'הזרמת מאמרים' יש דרך אוטומטית להכניס למערכת, כלומר ללא שימוש ב USER INTERFACE פה (ישירות ל DB)?
שאלה נוספת: האם נבדקה האפשרות לשיתוף פעולה מצד אתרים חופשיים אחרים בעברית? למשל האנצ' של מט"ח, או דעת, או אחרים, הרי יש ברשת המון חומר כתוב עברית ובעצם צריך רק לרכז ולקטלג אותו ? זהר אביטל 09:34, 21 אוק' 2003 (UTC)
כל המקורות לגיטימיים ובתנאי שאתה משכתב אותם, כלומר גורע או מוסיף מן הכתוב ומעניק את הסגנון שלך. אי אפשר לדעת הכל בדייקנות הכל ומבחינתי זה מקובל. אם אתה מדביק קטע מסויים ממקור אחר ואתה בדיוק עובד עליו, אז רשום הערה בנושא: נלקח מ... ועובר עיבוד על ידי. הערך יושלם לא יאוחר מ...
אתה חייב לזכור שלא פעם תיתקל במקור שהוא בעצמו העתיק אותו מילה במילה ממקום אחר. נאמר שלגבי זכויות יוצרים, קטע כתוב שנמצא חופשי לכל דורש ואפילו העתקת אותו, הוא הבעיה הכי זעירה בנושא זה ברשת: ראה MP3 בקאזאה, הורדות סרטים. אם מישהו מעלה לרשת ספר של מישהו, זה כמובן אסור בהחלט. אולם אם לקחת שורה או שתיים ממט"ח, אז אם בא להם שפשוט יכנסו וימחקו את זה. הרי הם יכולים. בעיקרון, אני ממליץ כפי שאני עושה לחבר ערכים בכוחות עצמך ולבטח שלא לתרגם. אנו רוצים אנציקלופדיה מקורית ולא מתורגמת. לגבי שכתוב קטע מסויים, די בכמה שינויים כמו שימוש במילים נרדפות וכדומה, כדי שזה יהיה שלך מעתה. זה אולי מגוחך אבל כך זה עובד. יצירה מקורית, יש מאין באנציקלופדיה היא נדירה למדי בימינו. מי שטוען כך בפשטות כנה אותו: מתחסד. בן הטבע.
לגבי הזרמה ישירה של מאמרים, פנה ישירות לבן הטבע. נדמה לי שהוא יודע / מצא דרך כזו לטעינה של כל הערכים, שהוא בונה לעצמו "בצד". בכל אופן, לדעתי קיים אם כי אני לא יודע איך עושים זאת. נ.ב. אולי אלעד יודע, נדמה לי שהוא רצה לטעון את הנתונים של כח ישובי ישראל "במכה" אחת מנתוני הלמ"ס.
לגבי שת"פ - היו כאן ניסיונות בהתחלה. זה לא הלך (בלשון המעטה). ראה ויקיפדיה:מזנון/ארכיון 2 ואולי גם בארכיון 3. זה לא אומר, שצריך להרים ידיים אבל. ובכלל העיקרון שלי אומר מה שיש זמין, באינטרנט אל תעתיק לכאן, רק הפנה לשם
^^ קוראים לי להסיע 80.179.193.235 11:43, 21 אוק' 2003 (UTC)

סטטיסטיקת המילים למאמר

עריכה

בויקיפדיה האנגלית יש את סטטיסטיקת המילים למאמר. אולי אפשר לעשות את אותו הדבר גם אצלנו? גילגמש 15:33, 23 מאי 2004 (UTC)

זה אמור להיות קיים בטבלאות או בגרפים המפורטים.
מאיר מ 18:15, 23 מאי 2004 (UTC)

היה מאוד מעניין לראות גרף של גודל ויקיפדיות ביחס למס' דוברי השפה. אולי זה קיים?

קצת סטטיסטיקה שעשיתי

עריכה

הרצתי 74 פעם "בחר מאמר אקראי" וזה מה שיצא:

40 מאמרים סבירים (54%) 20 קצרמרים (27%) 4 מאמרי תאריכים 3 מאמרי רשימות 3 מאמרים המכילים נתונים טכניים על ערים 2 מאמרים שהם לא קצרמרים, אבל הם בלתי סבירים בעליל (אחד מהם היה מלחמת העצמאות של ארצות הברית) 1 מאמר המכיל נתונים טכניים על יסוד כימי 1 מאמר שהוא בעצם שורת סיווג של בן הטבע (להערכתי מאמרי בן הטבע הם יותר מאחוז ורבע מהמאמרים, אבל לא מצאתי יותר מאחד ב-74 החיפושים האקראיים)

אם זה מייצג, סימן שיש כרגע יותר מ-5,000 מאמרים של ממש בויקיפדיה. טוב משחשבתי. שן שש זעם

אני רואה שמשעמם לך :-) אגב, אני לא בטוח שזה מייצג כ"כ, אבל אני לא סמכות. גם לי שעמם קצת, אז חזרתי על הניסוי, והתוצאות זהות כמעט לחלוטין:

56 מאמרים סבירים

30 קצרמרים

6 דפי יום/שנה

6 רשימות

3 ערכי נתונים טכניים על ערים

5 מאמרי בן-הטבע

סה"כ 106, ככה שמבחינת אחוזים שתי התוצאות כמעט זהות...

לא קיבלתי יסודות, ודברים בלתי סבירים. הייתה לי רק בעיה אחת, והיא שאלת הסיווג: האם יש להסווג את מכבי בזק בינלאומי תל אביב כקצרמר או רשימה? סיווגתי כרשימה, למרות שזו לא רשימה באופן מובהק כמו רשימת החלקיקים. תורת היחסות הכללית אינה מסווגת עם הודעת קצרמר, אבל היא לא מכילה כמעט שום מידע. בערכים קצרים מאוד אבל בלי הערת קצרמר התלבטי, ובסוף סיווגתי גם אם זה לא כתוב, לכן לדעתי יצאו לי כ"כ קצרמרים. להפתעתי, לא קיבלתי מונחונים וכיו"ב. המצב באמת טוב--[[משתמש:Roybb95|רועי | (שיחה) |]] 08:54, 22 אוג' 2004 (UTC)

ככל שויקיפדיה תגדל, כך יצטמצם מספרם היחסי של דפי היום/שנה ונתוני הערים. נשאלת השאלה מה אנו רוצים לעשות עם הרשימות. האם הן עדיין הכרחיות, עכשיו משהקטגוריות הנהדרות הוכנסו לשימוש? גדי אלכסנדרוביץ' 10:14, 22 אוג' 2004 (UTC)

אני מאמין שכן. קטגוריה מציגה רק את השם, ואילו ברשימה ניתן להכליל הסברים, ואולי אפילו סידורים שונים מאשר סדר אלפבתי. ראה לדוגמא את ההבדל האדיר בין רשימת החלקיקים לcategory:פיסיקת חלקיקים. הבדל של שמיים וארץ - כל אחד משמש למטרה אחרת, וכל אחד טוב בדיוק בשבילה.--[[משתמש:Roybb95|רועי | (שיחה) |]] 10:20, 22 אוג' 2004 (UTC)
קצת סטטיסטיקה שעשתה התוכנה: מספר המאמרים המופיע בעמוד הראשי (כרגע, 9,439) אינו כולל קצרמרים, הפניות, דפי שיחה וכו'. כלומר, הבדיקה האקראית שלכם כנראה שאינה מייצגת, ומספר המאמרים ה"אמיתיים" גדול בהרבה מ-5,000. Tal Cohen 04:52, 23 אוג' 2004 (UTC)
טל, אני לא בטוח שהמשפט הזה נכון. לפי מה שהבנתי מדף הסטטיסטיקות, הרשימה מונה כל ערך שיש בו לפחות קישור פנימי אחד. אני לא חושב שהמנגנון בנוי להשמיט קצרמרים. ישנה רשימה נוספת שמשמיטה גם ערכים בלי 200 אותיות ולפיה יש 8000+ ערכים כרגע בויקיפידה. שן שש זעם

רשימות ודומיהן

עריכה

רשימות, כידוע אינן ערכים אנציקלופדיים. אך לצערינו הויקיפדיה מחשיבה אותם ככאלה, הרי הן לא סומנו כקצרמרים או פירושונים. מה יש לעשות עם מפתח רשימות וכל נגזרותיה? ומה עם נגזרות נגזרותיה? הרי אין ערך של ממש בתוך אנשי צבא ומדינה, אלא עוד רשימות. הרי מדובר במאות "מאמרים", אולי החבר שן שש זעם צודק בערכתו לכך שאנו שואפים ל5000 מאמרים? הדוקטור המשוגע (שיחה) 17:58, 27 ספט' 2004 (UTC)

הערכים נספרים ללא קשר אם סווגו בקצרמרים או לא. הספירה היא אוטומטית. כל ערך בעל יותר מ-200 תוים נראים ולפחות קישור פנימי אחד נספר. לכן אין טעם לפתוח במבצע הוספת קצרמרים לכל רשימה ורשימה. גילגמש 18:10, 27 ספט' 2004 (UTC)
שן שש צודק, ואני לא חושב שיש מישהו שמטיל בכך ספק. הרשימות הללו מנפחות את הסטטיסטיקה באופן ברור. גם אתה צודק בקביעתך שאין טעם ברשימות אלו, אך אין מה לעשות - בן הטבע החליט לצאת במשימתו המוזרה ליצור את כל הרשימות האומללות הללו, שחלקן מכילות בסך הכל קישור אדום מסכן אחד, וזה כמובן סותם את הגולל על כל דיון אפשרי. כיום, בעידן הקטגוריות והפורטלים, אין שום טעם ברשימות: גם הטיעון לפיו הרשימות יכולות להוות "מחזיקי-מקום" לערכים עתידיים הנו חסר בסיס, כיוון שבפורטלים יש אזור מיוחד לערכים מבוקשים. אך אין טעם בפתיחת דיון שלם בנידון, כי עם בן הטבע אי אפשר להתווכח. מקסימום אפשר לכתוב דפי שיחה באורך הגלות, ובזה הרי אין טעם.
עצה ידידותית - רד מהעניין. דיונים על כל הדברים האלו כבר נערכו מפה ועד להודעה החדשה, ועוד דיון שכזה לא יקדם את העניין במאומה.--[[משתמש:Roybb95|רועי | (שיחה) |]] 18:12, 27 ספט' 2004 (UTC)
אני מוותר על העניין רק נקודה לגילגמש לפי מיוחד:Statistics ישנם למעשה כ22 אלף אך לאחר ניקוי ניפוי וזריקת הזבל הקצרמרי והפירושוני נשארם כ10.5 אלף. --הדוקטור המשוגע (שיחה) 18:24, 27 ספט' 2004 (UTC)

קצת סטטיסטיקה: מדי פעם אני עובר על מאמרים אקראיים בכדי למצוא כאלו הדורשים עבודה. ספרתי באילו מאמרים נתקלתי ב-60 המאמרים האקראיים האחרונים שהגעתי אליהם. אז מתוך 60 מאמרים יש:

  • 19 קצרמרים (32%)
  • 14 מאמרים קצרים, כלומר מאמרים שהם ארוכים מספיק בכדי לא להחשב קצרמרים, אבל עדיין קצרים למדי ודורשים הרחבה (23%)
  • 19 מאמרים ראויים מבחינת היקפם (32%)
  • 6 מאמרים הם רשימות יום ושנה (10%)
  • 2 רשימות שהיו יכולות להפוך לקטגוריה (3%)

אם 60 מאמרים מספיקים בכדי ללמוד משהו על התפלגות הערכים בויקיפדיה, 55% מהערכים הם באמת מאמרים "אמיתייים". אני גם חושב שערכי רשימות הם מיותרים וצריך להחליף אותם לקטגוריות - אבל מבחינה סטטיסטית לא מדובר בתופעה משמעותית. --סלע 21:07, 27 ספט' 2004 (UTC)

הרשימות הן לא בעיה, הקצרמרים הם בעיה קטנה וערכי הקשקוש והעלגות הן הבעיה הגדולה.
לגבי הנושא של האם קצרמרים נמנים, אולי יעשה איתנו אחד ממפעילי המערכת חסד סוף סוף וימחק את הטענה הלא נכונה שמופיעה בדף שאליו הפנה הדוקטור המשוגע (תודה על העבודה במוזיאון!). כל ערך (לא דף שיחה) שיש בו קישור חיצוני אחד נמנה. בנוסף, קיימת רשימה של ערכים שיש בהם קישור חיצוני ולפחות מאתיים תווים והיא מונה בערך 9,000 ערכים. זו אינה הרשימה הרשמית שעליה אנו מבססים את טקסינו וחגיגותינו.

האנציקלופדיה העדכנית בעולם

עריכה

האם לא הגיע כבר הזמן לעדכן את גרף הגידול במספר הערכים?


סטטיסטיקה: השחתות פר כניסות

עריכה

האם קיימת סטטיסטיקה לגבי מספר ההשחתות ביחס למספר הכניסות לאתר? האם קיימת השוואה לויקיפדיה האנגלית? או הגרמנית? עלומים 17:39, 9 מרץ 2006 (UTC)

הפרכת המיתוס על אורך הערכים בויקיפדיה העברית

עריכה

גיליתי עובדה מעניינת (יותר נכון מדכאת). כתבתי את הדף משתמש:Harel/ניסיון ראשון שהכיל את המחרוזת "אחת שתיים שלוש" ואת הדף משתמש:Harel/ניסיון שני שהכיל את המחרוזת "one two three". כמה אותיות יש בכל אחד מהם? בראשון 12 + 2 רווחים - סה"כ 14 תווים. בשני 11 + 2 רווחים - סה"כ 13 תווים. אלא שבגלל נפלאות unicode, תו עברי תופס שני בתים (בייטים), ואילו תו אנגלי, וכן רווח תופסים רק בית (בייט) אחד. לכן בבתים גודליהם יהיו 26 ו-13 בתים בהתאמה (כפי שדף מיוחד:Newpages למרחב שם "משתמש" שמח לאשר). ובאופן כללי, ערך בעברית יהיה ארוך, בבתים, פי שניים מאחיו האנגלי. הסטטיסטיקה המפורסמת שמוכיחה שהערכים שלנו הכי ארוכים משתמשת בנתון של "אורך בבתים", והרי לכם סיבה ללכת לישון עצובים הערב. ערב טוב שיהיה. Harel - שיחה 21:10, 3 מאי 2006 (IDT)

להיפך, זאת סיבה לשמוח. זאת הוכחה מצוינת לעליונות היהודית! גילגמש שיחה 21:12, 3 מאי 2006 (IDT)
או שלא הבנת אותי או שלא הבנתי אותך. המשמעות היא שההובלה שלנו בסטטיסטיקה היא שקרית, סתמית, ונגרמת בגלל עיוות טכני שאותו הסברתי לעיל. אנחנו לא מובילים באורך באמת. Harel - שיחה 21:14, 3 מאי 2006 (IDT)
אני הבנתי אותך היטב. היופי בכך שצלחנו להנדס את הסטטיסטיקה לטובתנו. גילגמש שיחה 21:16, 3 מאי 2006 (IDT)
חחחח. אין לשכוח שבאופן כללי הכתיבה העברית קצרה יותר מהכתיבה האנגלית. לדוגמה:
"I went to the Kindergarten"
"הלכתי לגן"
Yonidebest Ω Talk 21:20, 3 מאי 2006 (IDT)
תשומת לבכם לנאמר בתחתית דף סטטיסטיקות ויקיפדיה:
"הויקיפדיות מסודרות לפי מספר הקישורים הפנימיים שבהן (למעט דפי הפניה). נראה שזהו בסיס הוגן יותר להשוואת המאמץ הכולל שהושקע בהן, מאשר מספר המאמרים או גודל מסד הנתונים; מספר המאמרים אינו משמעותי כל כך מכיון שויקיפדיות מסוימות מכילות בעיקר מאמרים קצרים, או ערכים רבים שנוצרו באופן אוטומטי, ואילו ויקיפדיות אחרות מכילות מאמרים מעטים אבל ארוכים יותר, שנכתבו כולם ידנית. גם גודל מסד הנתונים עשוי להטעות, כיון שהוא תלוי בקידוד (תוי Unicode עשויים לתפוס מספר בייטים) ובמידת המשמעות שמכיל כל תו (למשל, תוים בסינית הם מילים שלמות)."
מלח השמים שיחה 21:29, 3 מאי 2006 (IDT)

ליתר דיוק, לא יוניקוד, אלא UTF-8. ישנן גם שיטות קידוד אחרות (ראו את הרשימה מימין ב-w:en:Unicode). אולי מתישהו יטרחו לתת סטטיסטיקות של פסקות, שורות, מילים ותוים. בינתיים אפשר להעתיק כל מאמר אופן אופיס, ולקבל את הנתונים שם. ‏conio.h‏ • ‏שיחה‏ 21:48, 3 מאי 2006 (IDT)

אני חושב שהנקודה שהעלה יוני גם היא נכונה. באופן כללי משתמשים בעברית בפחות תווים מאשר בשפות אחרות. עכשיו תראו בבקשה כמה מילים וכמה תווים נדרשים באנגלית עבור המילה העברית היחידה הבאה "וכשבהתנפליותכם", ואם כבר אני שם אני חיב להזכיר את העובדה המשעשעת שניתן בעברית לכתוב מילה בת 4 אותיות כולן זהות. אביהו 22:13, 3 מאי 2006 (IDT)
יש לציין שדף הסטטיסטיקה פשוט לא מעודכן, לפני כחצי שנה עברו כל הוויקיפדיות ל-UTF-8 (למעט אלו במזרח הרחוק שמשתמשות ב-UTF-16), כך שאין לכך משמעות בהשוואה מול מרבית הוויקיפדיות.
בכל מקרה, אני תמיד התלהבתי מהמילה וווו (=וגם הוו שלו) למרות שאינני יודע האם אביהו התכוון דווקא אליה. טרול רפאים 22:18, 3 מאי 2006 (IDT)
או זה או חחחח צהוב עולה 22:20, 3 מאי 2006 (IDT)

אמרו את זה כבר קודם... ויקיפדיה:מזנון/לא תעשה לך קצרמר#סימון כקצרמרים שימו לב לשאלה :"האם כתיבה בעברית תופסת מקום זהה לכתיבה באנגלית?" (שלא נענתה) --איש המרק 22:34, 3 מאי 2006 (IDT)


הראל -- לפי בדיקותי אתה ככל הנראה צודק וגם קצת טועה. ביצעתי חלוקה של מספר המלים בכל המאמרים במספר המאמרים, וויקיפדיה העברית נמצאת בצמרת הגבוהה עד גבוהה מאוד, עם כ-363 מלים למאמר.
'כולל אנגלית גרמנית צרפתית יפנית הולנדית איטלקית ספרדית עברית
299 363 348 326 361 252 231 350 363
בהשוואה לאנגלית, שלה מספר זהה של מלים למאמר, מצבה של העברית טוב, שכן מלל בעברית קצר בממוצע בכ-30 אחוז ממלל באנגלית (הנתון הזה מסתמך על כעשר שנות עבודה כמתרגם, כך שהוא פחות-או-יותר מדויק).
הנתון היותר מעניין (לדעתי) הוא מספר העורכים הפעילים מאוד בויקי העברית (52 נכון לדצמבר 2005). המספר הזה הוא, פחות או יותר, בקו אחד עם הנתונים של ויקיפדיות אחרות (ביחס אוכלוסיה/עורכים): באנגלית יש כאלפיים, בגרמנית כשש מאות, וכן הלאה, מה שמצביע על כך שזה מאפיין כללי של ויקיפדיה (משהו כמו עורך אחד ל-150 אלף דוברי השפה). נתון מעניין אחר הוא מספר התורמים הכללי (כל האנשים שתרמו לפחות עשר פעמים) שהוא בערך ביחס של 1:20 למספר העורכים הפעילים מאוד. כלומר, אחד מעשרים אנשים שטעמו "נתפס" לעניין באופן רציני יותר. רלף פון שוונץ 00:40, 4 מאי 2006 (IDT)
אגב, לפי הסטטיסטיקות המעודכנות יותר שייצר rotemliss‏ (כאן), עכשיו יש כמאה ויקיפדים פעילים מאוד, ודומני שמספר דוברי העברית לא גדל פי שניים מאז דצמבר. כך שהנתון הזה מאוד מרשים. Harel - שיחה 09:08, 4 מאי 2006 (IDT)
אפרופו וווו, יש לי הרגשה שבדיוק מה שאתה מתכוון כותבים כך: ווו. חוץ מזה... באנגלית גם כותבים XXX (גם מילה... אם מסתכלים על זה מכיוון מסויים..) שזה קרוב למה שיש לנו (איזה מילה מוזרה זו: ממממנו... מהמממן שלו....) אם כן, עם ישראל הצליח לגייר את הוויקיפדיה ולשתול בה סמים ממריצים... אבל זה באמת משתווה כשחושבים כמה מילים צריך בשביל להביע משהו אחד... או כשחושבים שיש להם לא רק את ארה"ב אלא גם את קנדה ואוסטרליה ובריטניה (מה הם עושים עם אנגלית של אירים?) וכל שאר המדינות דוברות האנגלית... וגם זה בעייה שלהם שהם והנוצרים המיסיונריים שלהם גייסו לשורותיהם אנשים שיצר הוויקיפדיזציה (זה תופס יותר תווים באנגלית........) אינו טבוע בדמם.. שילמדו לא לכפות על ילידים טבילה לנצרות. הספרדים האלה.. והפורטוגלים.. והצרפתים והאנגלים... וכל האנטישמים.. (איך הגענו לזה?!?)D_N_A 00:55, 4 מאי 2006 (IDT)
אכן, 89 (המספר הנקוב ל-26 בנובמבר) הוא נתון מרשים. צריך רק לקוות שהשפע הזה (שקשור, ניתן לשער, לוולהפדיה) יחזיק מעמד. רלף פון שוונץ 16:23, 4 מאי 2006 (IDT)

לראשונה מאז התחלנו לרדת...

עריכה

הנתונים הסטטיסטים בויקי האנגלית כבר מזמן לא מעודכנים, ובכל זאת, נראה שויקי שלנו ירדה לראשונה מאז דצמבר 2003 אל המקום ה-18 בדירוג (הסלובקית חלפה על פנינו אתמול...). למרות זאת, בקצב הנוכחי אנחנו אמורים לעבור את הדנית והאספרנטו תוך כמה חודשים (נדמה לי שהן השפות היחידות המדורגות מעלינו כרגע שמספר הדוברים אותן קטן ממספר דוברי העברית). נריה 08:58, 23 מאי 2006 (IDT)

ומהצצה ב"ערך אקראי" שם תוכל גם להבין מדוע. קל מאוד לטפס בסולם כשמקדישים, נאמר, 8,000 ערכים לכל גרם שמים מתועד. צריך רק סקריפט מתאים. רלף פון שוונץ 12:25, 23 מאי 2006 (IDT)

למה לא מעדכנים עמוד זה?

עריכה

מאיפה אפשר לעדכן את זה? ואם גם אני הפשוט יכול לעשות זאת? • עידו ••• שיחה 00:13, 11 יולי 2006 (IDT)

סטטיסטיקה

עריכה

הצצתי היום בדף m:List of Wikipedias, שבו יש השוואה בין ויקיפדיות בשפות שונות, וגיליתי שני נתונים מעודדים:

  • הטבלה כוללת מדד בשם Depth, שמלמד, באופן גס, עד כמה הערכים בוויקיפדיה מסוימת מושקעים. מבין 52 הוויקיפדיות הגדולות (מעל 10,000 ערכים), העברית נמצאת במקום השלישי לפי מדד זה (אחרי האנגלית והווייטנאמית).
  • ויקיפדיה העברית עשירה מאוד בתמונות. אף שהיא במקום ה-19 מבחינת מספר הערכים, היא במקום ה-8 מבחינת מספר התמונות. מבחינת היחס בין מספר התמונות למספר הערכים, ויקיפדיה העברית נמצאת במקום הראשון (מעט לפני האנגלית, והרבה לפני כל ויקיפדיה גדולה אחרת). דוד שי 22:26, 12 בדצמבר 2006 (IST)תגובה
מה שאני מרוצה ממנו הוא שהגענו למצב שאתה אומר "הרבה לפני כל ויקיפדיה גדולה אחרת", ואני לא יודע אם ה"אחרת" מתייחס לוויקיפדיה באנגלית או לוויקיפדיה העברית. בוויקיפדיה העברית נעשו כמעט 2.5 מיליון עריכות, מספר הדומה למספר העריכות בוויקיפדיה הרוסית (עם 121 אלף ערכים). זו הוויקיפדיה היחידה שיש בה פחות מ-100,000 ערכים ויותר מ-2.1 מיליון עריכות, ועוד אין לנו 50,000 ערכים! בקצב הזה, בערך ה-100,000 יהיו לנו 5 מיליון עריכות, נתון שיש היום רק לוויקיפדיות בעלות מעל 222,000 ערכים! לעומת זאת יש לנו רק 34 מפעילים - בוויקיפדיה הסינית לדוגמה יש רק פי שניים יותר ערכים מאיתנו, פי 1.5 יותר עריכות מפה אבל 84 מפעילים. צהוב עולה 22:36, 12 בדצמבר 2006 (IST)תגובה
ביחס למספר המפעילים הסטטיסטיקה איננה חד משמעית, ולכן לא הבאתי אותה. בוויקיפדיה היפנית, למשל, יש פי שישה ערכים מבעברית, פי ארבעה עריכות, אבל רק פי שניים מפעילים. דוד שי 22:47, 12 בדצמבר 2006 (IST)תגובה
אצל האיטלקים למשל - כמדומני - יש עשרות בירוקרטים, לך תבין למה. ‏Harel‏ • שיחה 22:48, 12 בדצמבר 2006 (IST)תגובה
תראה. הם איטלקים. הם חייבים להיות לא מסודרים מטבעם - זה בגנים. או שאולי הם זוכרים מה קרה כשהיה רק דוצ'ה אחד... (בצחוק, כמובן. דוד, אתה מונארך נהדר!) לב - שיחה 22:51, 12 בדצמבר 2006 (IST)תגובה
אני לא מתרגש כל כך מכמות התמונות שיש לנו. הרי כמות נכבדה מהן היא תמונות בשימוש הוגן. לאחרונה מחקנו שלוש רשימות פרקים, בעקבותיהן נמחקו כמה עשרות תמונות (מאות במקרה של הסימפסונס). האם זה אומר שהערך שלנו ירד? זהר דרוקמן - אהמ 23:16, 12 בדצמבר 2006 (IST)תגובה
התמונות הם מדד להשתתפות ועשיה ולא רכוש שנצבר. מעבר לכך נראה שבכל הויקיות יש תמונות רבות בשימוש הוגן, במיוחד באנגלית שם נתקלתי בלא מעט שכאלו.--אפי ב.שיחה10:15, 13 בדצמבר 2006 (IST)תגובה
נתון התמונות הוא נתון בעל חשיבות - הוא מעיד על כך שבכל ערך (כמעט) יש תמונה. אני חסיד גדול של תמונות ותרשימים בערכים (תמונה שווה אלף מילים), ואין כל בושה בשימוש בתמונות שימוש הוגן (עדיף כמובן שימוש חופשי), אבל כל עוד אין תמונות המפרות זכויות יוצרים מצבנו טוב.
נתון יותר חשוב בעיני הוא אורך הערכים - 31% מהערכים שלנו הם מעל 2K [1]. אנחנו במקום שביעי בין כל הויקיפדיות בעניין זה (אחרי האנגלית, הגרמנית, הצרפתית, ההולנדית, הספרדית והויטנאמית). לעניין אחוז הערכים מעל 0.5K אנחנו עם 72% [2] - הרבה מעל ויקיפדיות גדולות מאיתנו כמו היפנית, הנורווגית, והשוודית (הסינית לא נחשבת כי שם כל אות מסמנת מילה). נתונים אלה הם תוצאה של מחיקת אולטרא קצרמרים ומניעת יצירתם. דרור 10:43, 13 בדצמבר 2006 (IST)תגובה
זה ארטיפקט הנובע מהעובדה שתויים בעברית מקודדים בשני בתים ביוניקוד ואילו תווים לטינים מקודדים בבית אחד. הסברתי את זה פעם בדיון במזנון. הסיפור על כך שהערכים שלנו ארוכים במיוחד הוא די מיתוס (אם כי האפקט שתיארתי מקוזז במידת מה על ידי כך שהעברית היא שפה מאוד קומפקטית במספר האותיות). ‏Harel‏ • שיחה 10:49, 13 בדצמבר 2006 (IST)תגובה
העברית גם קומפקטית במספר המילים המרכיבות משפט (יחסית לאנגלית). גברת תרדשיחה 15:13, 13 בדצמבר 2006 (IST)תגובה
מספר התמונות הוא אינדקס בעייתי, שכן ויקיפדיות יכולות היום להשתמש בתמונות מקומונס, אשר לא יספרו לזכותן, אבל יכללו בערכים המופיעים בהן. באותו אופן יכול להיות שיש ויקיפדיות שבהן המשתמשים "ממושמעים" יותר ומקפידים להעלות תמונות לקומונס ובאחרות פחות. ערןב 12:50, 13 בדצמבר 2006 (IST)תגובה
בתוספת לדבריו של ערן, שהבהיר יפה את הנקודה שלי, אבקש לחדדה שוב: האם ירדה קרנה של ויקי העברית בעקבות המחיקות הרבות של התמונות מרשימות הפרקים? הרי ירדנו בלפחות 300 תמונות - האם זה הופך אותנו לויקיפדיה פחות טובה? מדד התמונות איננו משמעותי כלל וכלל, כיוון שאיננו משקף באמת כמה תמונות ויקיפדיה כלשהי שמה בערכים אלא כמה תמונות העלו אליה. אכן, טוב מאוד שרבים מהערכים שלנו מלאים באמצעים ויז'ואלים להמחשת הטקסט היבש, אבל ספירה עיוורת של אותן תמונות איננה כלי מהימן לקביעת איכות מדורגת. זהר דרוקמן - אהמ 21:53, 13 בדצמבר 2006 (IST)תגובה
לא מדוייק. ומחיקת התמונה זניחה ביחס למספרן. דרור 23:14, 13 בדצמבר 2006 (IST)תגובה

מאה אלף

עריכה

מישהו יכול לחשב מהסטטיסטיקות תוך כמה זמן יהיו 100 אלף ערכים? קקון 02:27, 25 בדצמבר 2006 (IST)תגובה

כיוון שזה יותר מעניין מלפתור תרגילים בתרמודינמיקה, הכנסתי כמה נקודות ציון לתוכנה וביצעתי התאמה אקספוננציאלית, ברמת דיוק טובה (R2=0.99982). לפיה, הערך ה-100,000 יכתב בערך ביום ה-1,860 לקיומה של ויקיפדיה, או בשנה השישית לקיומה, ביום ה-34. כלומר, בערך ב-12 באוגוסט, שנת 2008. הניתוח מתבסס על 7 נק' ציון, החל מהערך ה-1,000, ועד הערך ה-50,000 (שנכתב בערך ביום ה-1,260 להיווסדה של ויקי העברית). עופר קדם 09:35, 25 בדצמבר 2006 (IST)תגובה
תודה לך. אני מהמחשבים ככה שאקספוננציאלי לא נשמע לי טוב. קקון 09:39, 25 בדצמבר 2006 (IST)תגובה
מה רע באקספוננציאלי? זה נראה לי מתאים למקרה שלנו, ויש אחלה התאמה. עופר קדם 12:20, 25 בדצמבר 2006 (IST)תגובה
אקספוננציאלי לא מתאים, גם אם אפשר ל"אנוס" אותו להתאים על סט הנתונים הנוכחי. קצב כתיבת הערכים לא יכול להיות אקספוננציאלי. משיקולי אנרגיה, לא ייכתבו פה מיליוני ערכים ביום על ידי בני אדם בעוד זמן סביר כלשהו, למעשה בשום זמן שהוא. קצב כתיבת הערכים הוא פולינומיאלי, להערכתי מסדר שני. ‏Harel‏ • שיחה 20:39, 25 בדצמבר 2006 (IST)תגובה
בוודאי שמספר הערכים לא יגיע לאינסוף, וקצב כתיבתם לא יגדל לאינסוף, אבל אין לנו מידע אודות אותו זמן עלום, בו ישתנה אופי הפונקציה. על פי הנתונים שבידינו, ניתן לקרב את הפונקציה בטווח זה לאקספוננט. אין זו שגיאה, כל עוד מודעים לכך שמדובר בקירוב. בדומה, פונ' פולינומית כלשהי יכולה להתנהג כפונ' לינארית סביב האפס, וכולי.
הקירוב לאקספוננט מוגבל - לא ניתן להפעילו על כל מספר. השאלה "מתי יכתב הערך ה-200 מיליון?" מן הסתם לא תענה על ידי הקירוב הנ"ל. אך תחזית לטווח הקרוב, הערך המאה אלף, נראית סבירה יותר, במיוחד כשלוקחים בחשבון שתוצאת הקירוב נותנת פרק זמן שגדול רק במחצית מזמן חייה של הויקיפדיה, כך שאין אנו מסתכלים לעתיד הרחוק. בנוסף, מאה אלף ערכים נראה מספר סביר, בהתחשב במספר הערכים הגדול שחסר לנו, כך שקשה לחשוב שנגיע לרוויה או לשינוי דרסטי בקצב הגידול לפני מספר זה.
לסיכום - מדובר בקירוב טוב בהתחשב בנתונים העומדים לרשותנו, והוא תקף רק לטווח מסוים, אך זה הקירוב הכי טוב אליו נוכל להגיע, בהעדר ידע נוסף (ידע נוסף, אגב, יכול להיות בחינה מדוקדקת של הויקיפדיה האנגלית, או ויקיפדיות אחרות גדולות מאיתנו). עופר קדם 22:42, 26 בדצמבר 2006 (IST)תגובה
ולי R^2=0.99982 נשמע בלתי אפשרי. (אפשר להציץ בנתונים שלך?) עוזי ו. 10:20, 25 בדצמבר 2006 (IST)תגובה
זה מה ש-Origin אומרת לי... הנתונים בטבלה הבאה:
ימים ערכים
105 1000
160 1500
365 7850
750 23000
1090 40000
1177 45000
1261 50000
(יש לציין שאני לא מבין כלום בסטטיסטיקה. הידע שלי מסתכם בלהזין נתונים לתוכנות כמו אוריג'ין ואקסל, ולקוות לטוב). עופר קדם 10:38, 25 בדצמבר 2006 (IST)תגובה
אפשרי כאשר התוכנה בוחרת פונק' שתתאים ככל האפשר. לי יצאה תוצאה דומה עם מאקרו באקסל. לא מדובר כאן בהתאמה אקראית אחרי הכל. קרני שיחהזה הזמן ל... 12:21, 25 בדצמבר 2006 (IST)תגובה
כמובן, לזה התכוונתי - לא התאמה לנוסחא שרירותית, אלא לפונ' מיטבית, כמו רגרסיה לינארית. עופר קדם 13:05, 25 בדצמבר 2006 (IST)תגובה
 
מספר הערכים, וקו רגרסיה

משמאל מוצג גרף של מספר הערכים (לפי הטבלה לעיל), יחד עם קו הרגרסיה המתאים. מקדם המתאם הוא  , וזה בעיקר לקח למי שמשתמש במקדם המתאם כדי להצדיק אקסטרפולציה. לפי הקו הזה, הערך ה-100000 יכתב ביום ה-2929, כלומר בעוד כ-4.5 שנים. לפי קו רגרסיה שמתחשב רק בשלושת הנתונים האחרונים, הנס הזה יתרחש עשרה חודשים מוקדם יותר, ביום ה-2627. עוזי ו. 18:00, 25 בדצמבר 2006 (IST)תגובה

מה זה בדיוק קו רגרסיה? ***מתבייש*** אביעד המקורי 18:05, 25 בדצמבר 2006 (IST)תגובה
זה לא פלא. אין לזה ערך בעברית. הנה באנגלית. עידן ד 18:15, 25 בדצמבר 2006 (IST)תגובה
כן, נתקלתי במספיק מקרים ש-R נראה מבטיח, אבל הרגרסיה גרועה (למרות ש-R^2=0.9900 זה לא טוב במיוחד). אבל בתחזית שלי הפונ' האקספוננציאלית יצאה מותאמת (ויזואלית, לפחות) באופן נפלא לכל הנקודות שלקחתי, אז אני מאמין שהמצב יותר טוב. הרגרסיה ששמת סוטה באופן ברור מערכי האמת, מכיוון שתוצאות האמת פשוט אינן לינאריות. עופר קדם 19:57, 25 בדצמבר 2006 (IST)תגובה
ההסבר פשוט, הפונקציה אינה לינארית, ואינה מעריכית (עברי דבר עברית) ואינה פולינום. אלא מורכבת יותר. יש כאן 2 תהליכים לפחות ששולטים בפונקציה. האחד הוא משוב חיובי מערכי- ככל שיש יותר כותבים וערכים יותר אנשים שומעים על ויקיפדיה ואחוז מסויים מתוכם מתחיל לכתוב. היות והתהליך הוא שערכים באופן ממוצע לא הופכים להיות גרועים יותר התהליך מושך אנשים במנגנון של משוב מחזק. (כך שפונקציה לינארית לא מתאימה וגם לא פולינום). אבל כפי שעופר אמר, יש מספר מוגבל של אנשים בעלי הדרישות המתאימות (בעלי זמן פנוי, נכונות ויכולת לתרום וכו', יודעי עברית) ולכן הפונקציה המעריכית אינה ממשיכה לגדול אלא משלב מסויים מתחילה לדעוך ובסך הכל מתקבלת פונקציה דמויית S.
פונקציה דומה מתקבלת לדוגמה לכניסה של מוצר בעל טכנולוגיה חדשה - בתחילה קונים אותו רק גיקים , אחר כך (בהנחה שהוא מוצר טוב) קונה אותו אוכלוסיה גדולה בהרבה כאשר הגידול הוא מעריכי בגלל אפקט פרסום רשת, ולבסוף חוזרים לגידול איטי היות ומעטים הם הצרכנים הפוטנציאלים שאין להם את המכשיר החדש. לפי הגרף ששורטט אנחנו אי שם בשלב המעריכי של הפונקציה, ובהמשך יבוא שלב האטה בקצב (הקצב של גידול מספר המשתמשים החדשים התורמים, לאו דווקא קצב התרומות). (עוד שלב או תהליך הוא שלב של של דעיכה שבו ויקיפידה כבר תהיה מקום בו רוב הערכים ה"חשובים" כבר יהיו כתובים, והמוטיבציה להשתתף בה תרד - אבל שלב זה יקרא בעתיד הלא נודע).האזרח דרור 12:35, 26 בדצמבר 2006 (IST)תגובה
בלי להיכנס לנכונות הניתוח שלך, שהוא ספקולטיבי לגמרי, מדוע אתה חושב שפונקציה דמוית S אינה פולינום? שמעת על טור טיילור? ‏odedee שיחה 12:41, 26 בדצמבר 2006 (IST)תגובה
שמעתי , וגם על קירובים אחרים. אבל אלו קירובים. ובוודאי שלא מדובר על פולינום מסדר שני. האזרח דרור 16:37, 26 בדצמבר 2006 (IST)תגובה
יש לציין, שאני לא אמרתי דבר אודות "מספר מוגבל של אנשים בעלי הדרישות המתאימות" וכו'. אולי הראל?
ואולי "עברי דבר עברית", אך "מדען דבר אנגלית". עופר קדם 22:50, 26 בדצמבר 2006 (IST)תגובה
 
מספר הערכים, והתאמה מעריכית

לי דווקא נראה שעקומה מעריכית מתאימה בינתיים, ולפי זה יהיו מאה אלף ערך ביום ה-1991, 131 ימים אחרי ההערכה של עופר קדם. והרבה לפני ההערכה של עוזי ו.. בברכה, אבינעם 18:22, 28 בדצמבר 2006 (IST)תגובה

(לא ברור למה התכוון המשורר; מקדם הרגרסיה נכון, אבל הגרף שבציור בוודאי אינו קו הרגרסיה של הנתונים). עוזי ו. - שיחה 21:32, 1 בנובמבר 2015 (IST)תגובה

שבירה - מדד אחר

עריכה

אני חושב שהמדד של ערכים חדשים אינו נכון למדידת התקדמות והייתי מציע את המדד של מספר ערכים בעלי אורך של לפחות 4K שאינם מסומנים לעריכה ולשכתוב. על פי מדד זה יש בויקיפדיה קרוב ל-7000 ערכים. מתי נגיע לעשרת אלפים? יעקב בויקי 18:41, 25 בדצמבר 2006 (IST)תגובה

מהיכן הנתון? --איש המרק 23:38, 25 בדצמבר 2006 (IST)תגובה
מסכים בהחלט. ראו את הערך המביש 1904 בארכיאולוגיה. יוסאריאןשיחה 13:55, 26 בדצמבר 2006 (IST)תגובה
זוועת עולם. לדעתי יש לאחד את הערכים האלה לעשורים, ממילא מחקר ארכאולוגי אינו עניין של חודשיים, זה לא סרט קולנוע. ‏odedee שיחה 14:26, 26 בדצמבר 2006 (IST)תגובה
כדאי לאחד את קטגוריית שנים בארכיאולוגיה עם קט' שנים במדע. לא ברור מה גרם להבחנה בינהם מלכתחילה. כרגע שמתי תבנית חשיבות על הקטגוריה. לדעתי אפשר פשוט לאחד, אבל נדמה לי שצריך מפעיל בשביל זה. יוסאריאןשיחה 15:13, 26 בדצמבר 2006 (IST)תגובה
כפי שנאמר כאן לא מזמן בנושא קרוב, כיוון שעברית משתמש בשני בתים עבור כל תו - גם מדד זה מעט מעוות. זהר דרוקמן - אהמ 21:40, 26 בדצמבר 2006 (IST)תגובה
זהר, אתה בטוח שהגבת במקום?... קובי - לא צריך מפעיל אלא אם כן יש צורך למחוק ערך ואינני חושב כך. ‏odedee שיחה 21:46, 26 בדצמבר 2006 (IST)תגובה
התגובה במקום הנכון, ההזחה לא. קורה :/. בכל מקרה, תגובתי הייתה להודעתו המקורית של יעקב בויקי. זהר דרוקמן - אהמ 21:49, 26 בדצמבר 2006 (IST)תגובה

ראשית תודה שאתה מגיב. בחרתי ב 4K כי זה מופיע בדף הסטטיסטיקות וזה מספיק גדול כדי שיהיה אפשר לקרוא לזה ערך. לא מדובר כאן על השוואה לשפות אחרות (שבעייתית במקצת) אלא מדד פנימי של העברית. אני חושב שבמקום לרוץ אחרי עוד ועוד ערכים אנו צריכים להרחיב את הערכים שכבר יש. מדד של 4K יכול אולי לתת תמריץ לכיוון הזה. יעקב בויקי 23:56, 26 בדצמבר 2006 (IST)תגובה

הנתונים לא עודכנו זה כשנה וחצי

עריכה

מישהו מוכן להרים את הכפפה ולעדכן את הגרפים? חגי אדלר 04:17, 7 בינואר 2007 (IST)תגובה

כמה נתונים מעודדים

עריכה

נכון שהנתון הסטטיסטי הבולט ביותר (דירוג ע"פ מספר ערכים) לא ממש מחמיא לויקיפדיה העברית כיון שמשיא של החזקה במקום ה-14 אנחנו יורדים בהתמדה, כרגע במקום ה-25 לאחר גל של ירידות בחודשים האחרונים (גל שהסתיים בינתיים, כנראה, כי הויקיפדיות שמתחתינו שומרות על קצב דומה לשלנו, הקרובה ביותר בהפרש של 10,000 ערכים). בכל זאת, בוקר שקט של יום שישי הביא אותי לשוטט במרחבי דפי הסטטיסטיקות ולספק כמה נתונים מעודדים אחרים:

  • 100 אלף ערכים (במשפחת השפות השמיות...) - טוב, נכון שזה לא רק אנחנו אבל בחלוקה למשפחות של שפות, אנחנו צפויים לעבור בחודש הקרוב את מחסום 100 אלף הערכים, יחד הויקיפדיה הערבית, המלטית ועוד איזו שפה ניאו-ארמית...
  • עריכות/ערכים - בממוצע העריכות לערכים ויקיפדיה העברית נמצאת במקום השלישי (מבין הויקיפדיות בעלות 1000 ערכים ויותר) עם 45.63 עריכות לערך, קרוב מאוד לויקיפדיה הגרמנית הנמצאת במקום השני (46.63), ולא יותר מדי רחוק מהענק האנגלי (54.09). במקום הרביעי, הרחק מאחור, ויקיפדיה הספרדית עם 33.2 עריכות לערך. זה אולי אחד הנתונים החשובים ביותר המלמדים על "עומק" הויקיפדיות השונות.
  • עומק - בהגדרה אחרת של עומק, מכפלת עריכות/ערכים בלא ערכים/ערכים, ויקי העברית נמצאת במקום השני, אחרי האנגלית.
  • ערכים/דוברים - ביחס שבין מספר הערכים לבין מספר דוברי השפה, ויקיפדיה העברית נמצאת אמנם סביב המקום ה-40 (הגרמנית סביב ה-50 והאנגלית סביב ה-70, לשם השוואה), אך אם ננפה את כל האנציקלופדיות הקטנות מ-10,000 ערכים, ויקי שלנו נמצאת במקום ה-22 כשלמעשה, מעליה נמצאות רק 8 ויקיפדיות גדולות ממנה, בראשן האספרנטו עם קרוב ל-90,000 ערכים ו-2 מיליון דוברים (לעברית כ-7 מיליון דוברים וכ-60,000 ערכים).
  • במגרש של הגדולות - נתונים יבשים אחרים מלבד מנין הערכים מלמדים גם הם שויקיפדיה העברית נמצאת במגרש של הגדולות והותיקות: מקום 16 במספר הדפים הכולל (כלומר שכנראה אנחנו מברברים יותר על מדיניות וכו' אך גם בעלי אחוז גבוה יחסית של שיחות אודות הערכים), מקום 13 במספר העריכות הכולל, מקום 16 במספר המפעילים (טוב, אין לי מושג מה זה אומר), ומקום 9 במספר התמונות.
  • משתמשים רשומים - כאן אנחנו במקום ה-19 שזה טוב (גבוה ממיקומנו, מודעות גבוהה יחסית) ולא טוב (תוצרת דלה יותר מכל משתמש).

עד כאן דברינו להפעם. נריה 12:18, 3 באוגוסט 2007 (IDT)תגובה

ונדמה לי שגם לגבי אורך הערכים הממוצע אנחנו ממוקמים לא רע. ניתן לבדוק זאת? נוי 14:05, 3 באוגוסט 2007 (IDT)תגובה
אורך הדף מטעה, שהרי אות עברית תופסת 2 בתים, ולא אחד. ‏Yonidebest Ω Talk 02:34, 4 באוגוסט 2007 (IDT)תגובה
יש לציין שהוא הדין גם בשפות אחרות שאינן נכתבות באותיות לטיניות (בשפות מסוימות, האותיות תופסות שלושה ואפילו ארבעה בתים), וכן בכל אות שאינה ב-ASCII (למשל תווים עם סימנים, כגון é). ‏– rotemlissשיחה 04:38, 4 באוגוסט 2007 (IDT)תגובה
בנוסף, תווי הרווחים, סימני הפיסוק והשורות החדשות תופסים כל אחד בית אחד, כמוהם ככל תו המצוי ב-ASCII. ‏– rotemlissשיחה 04:39, 4 באוגוסט 2007 (IDT)תגובה

ויקיפדיה כאן ועכשיו

עריכה

האנציקלופדיה העברית הוגדרה על ידי עורכיה כ"כללית, יהודית וארצישראלית". ויקיפדיה העברית אימצה לפחות את שני המאפיינים האחרונים...התוצאה היא ויקיפדיה של בעיקר כאן ועכשיו.

ערכתי סקירה קצרצרה של 500 הערכים המקושרים ביותר בויקיפדיה העברית ומיפיתי אותם על פי קטגוריות שונות. התוצאות לפניכם. אעיר רק כי אני מודע לכך שהבדיקה הזו בעייתית מכמה סיבות שניסיתי לנטרלן - "הרצת מניות" באמצעות תבניות (תבניות ברוך הבא, לוחות שנה, תקצירי עלילה וכו'. כך הופך למשל ספויילר לאחד הערכים הנוכחים אצלנו) וכן שינויי כתיב (מלחמת העולם השניה ומלחמת העולם השנייה) או קיומם של כמה שמות המפנים לאותו ערך (בריטניה והממלכה המאוחדת, ישראל ומדינת ישראל). ובכל זאת, הנה הנתונים המעובדים מעט, הנכונות שלהם תקפה להיום בלבד...:

נריה 14:59, 28 באוגוסט 2007 (IDT)תגובה

הייתכן כי פברואר הוא החודש הלועזי הכי פחות מקושר, בגלל שהוא החודש הכי קצר? ברור שזה מה שיקרה ככל שיהיו יותר ערכים, אבל לא ציפיתי שזה יקרה כבר עכשיו עם קצת פחות מ־62 אלף ערכים. אגב, שני הקישורים שכתבתי כאן לפברואר נכנסים לסטטיסטיקה? דולבשיחה 15:54, 28 באוגוסט 2007 (IDT)תגובה
תודה לנריה על הסקירה המאלפת, שבוודאי דרשה השקעה רבה. השאלה היא - מה עושים עם זה? מבחינתי האישית עמדתי על מגמות אלו כבר מזמן ובתגובה פתחתי במיזם "לאס קאסס" (בדברי ההסבר ניתן למצוא דברים העולים בקנה אחד עם אבחנותיו של נריה לעיל). אני חושש שאין בכך די ודרוש מאמץ מרוכז ומכוון לכיסוי תחומים נדרשים (וראה את הבחנותיו של עודדי בנושא: לאן מכאן?). אז מה עושים עם תובנות אלו. ואיך בדיוק? אורי שיחה 16:00, 28 באוגוסט 2007 (IDT)תגובה
למיטב הבנתי, כל הקישורים מכל המרחבים נכנסים לסטטיסטיקה. יצוין שהכללת תבניות, תמונות וקטגוריות אינה נספרת (או לפחות, לא אמורה להיכנס אליה), אבל קישורים לדפים אלה כן נספרים. ‏– rotemlissשיחה 02:37, 29 באוגוסט 2007 (IDT)תגובה

מי מרים את הכפפה לעדכן את הגרף?

עריכה

מאוד לא מעודכן... --‏ Itzike שיחה 20:45, 15 בספטמבר 2007 (IDT)תגובה

האם הסטטיסטיקה מספרת לנו את כל הסיפור?

עריכה

התנסיתי בשני מקרים בהם ערכים חדשים שכתבתי לא הופיע בדף הערכים החדשים ואני תוהה האם הם נכללים בסטטיסטיקה הכללית.

במקרה אחד יצרתי ערך חדש, פילטליה, מדף הפניה קיים ובמקרה השני יצרתי ערך שבגלל תקלדה נקרא תשבץ קן, העברתי אותו לתשבץ קו וביקשתי מחיקה של "תשבץ קן" השגוי. שני הערכים, פילטליה ותשבץ קו, לא מופיעים בדף הערכים החדשים. האם יש היודע את התשובה? בברכה. ליש 16:21, 26 בספטמבר 2007 (IST)תגובה

באשר לראשון, ההפניה היא דף קיים, והרחבתו לערך לא נחשבת בעיני המערכת כ"ערך חדש" (למעשה מדויק יותר לקרוא לזה דף חדש ולאו דווקא ערך). עם זאת הפניות לא נספרות במספר הערכים, ולכן לאחר ההרחבה מספר הערכים גדל. באשר לתשבץ קן, נדמה לי שזה באג מוכר ומדווח. ערן 16:26, 26 בספטמבר 2007 (IST)תגובה
תודה על תשובתך. השאלה שבכותרת עדיין תקפה ואני מבין שיכול להיות מצב שאין לה תשובה טובה. בברכה. ליש 16:55, 26 בספטמבר 2007 (IST)תגובה
מבדיקה שלי, שני הדפים נכללים בסטטיסטיקה, הן של הערכים, הן של מספר הדפים הכללי. אין קשר בין מחייב בין מיוחד:Newpages לבין דף הסטטיסטיקה. גם הערך החדש שיצרת מהפניה הפך לערך (קודם הוא לא היה ערך לפי הגדרת הסטטיסטיקה, כיוון שהיה הפניה) ולכן נוסף 1 למניין הערכים. ‏– rotemlissשיחה 19:33, 26 בספטמבר 2007 (IST)תגובה
תודה. זה מבהיר את התמונה. בברכה. ליש 19:50, 26 בספטמבר 2007 (IST)תגובה

האם יש דרך לדעת פופולריות של ערכים?

עריכה

האם יש אפשרות לדעת כמה מבקרים היו בערכים השונים? כי אם כן, כדאי לשקול לדעתי רשימה (עם הפניה מהעמוד הראשי) של "הערכים הפופולריים ביותר" - אני מניח שאלו יהיו ערכים על סלבריטיז, אישים בחדשות ונושאים נפוצים בבחינות בגרות. אביעד המקורישיחהבואו להתפעל 21:54, 7 באוקטובר 2007 (IST)תגובה

אין אפשרות כזאת כי מונה העריכות לא מופעל כתוצאה ממדיניות הקרן. גילגמש שיחה 21:55, 7 באוקטובר 2007 (IST)תגובה
אציין, אם מישהו מעונין להפעיל תכונה כזו באתר פרטי, שהייתה קיימת רשימה כזו בדף הסטטיסטיקות אילו מונה הצפיות היה מופעל. ‏– rotemlissשיחה 21:57, 7 באוקטובר 2007 (IST)תגובה
מייקל לואיס (דג בגופה של ויקיפדיה) שולתתת!1. בברכה, MathKnight הגותי |Δ| (שיחה) 22:01, 7 באוקטובר 2007 (IST)תגובה
קיימת רשימה של הערכים הנערכים ביותר. באתר הסטטיסטיקות של ויקיפדיה. בברכה, --איש המרק 22:03, 7 באוקטובר 2007 (IST)תגובה
היתי שמח מאוד אם מונה העריכות היה מופעל. נורא מסקרן אותי לדעת אם נכנסים בכלל לערכים שכתבתי או שכתבתי אותם לעצמי. גילגמש שיחה 22:05, 7 באוקטובר 2007 (IST)תגובה
מונה צפיות, כן? אגב, רשימת הערכים הנערכים ביותר מופיעה גם כאן (אם כי היא לא עודכנה בזמן האחרון), מעניין מה זה אומר עלינו שמלחמת לבנון השנייה מובילה בפער ניכר. ‏– rotemlissשיחה 22:14, 7 באוקטובר 2007 (IST)תגובה
כן, התכוונתי למונה הצפיות כמובן. גילגמש שיחה 22:15, 7 באוקטובר 2007 (IST)תגובה
מההיבט הטכני, די ברור שהפעלת מונה הצפיות תעמיס בצורה יוצאת דופן על בסיס הנתונים של ויקיפדיה, שהרי בכל פעם שאדם יכנס לויקיפדיה תצטרך להיות פקודת update בטבלה המתאימה. וזה, ידידי, המון פעולות update. מכיוון שקרן ויקימדיה לא עשירה במיוחד, יש לכך משמעות אחת אני מניח - קריסת המערכת כולה. כך שניאלץ להמתין עם מונה הצפיות ליום בו יהיה לקרן יותר כסף.
אם אופציה זו מכבידה כל כך על בסיס הנתונים, מדוע היא מופעלת בויקיפדיה האנגלית [3] ובויקיפדיות גדולות נוספות ? ‏עדיאל09:50, 8 באוקטובר 2007 (IST)תגובה
זה כלי שמופעל על ידי מפעיל אחד, צעיר, מהוויקיפדיה הגרמנית. הדרך הסבירה היחידה לתקשר איתו היא בIRC, מה שניסיתי פעם ולא כל כך הצליח. אנסה שוב. אני לא חשוב שצריכה להיות בעייה בשבילו להוסיף אותנו בכלי הזה. ‏Harel‏ • שיחה 09:57, 8 באוקטובר 2007 (IST)תגובה
כלומר הוא מפעיל אותו משרת אחר ולכן זה לא יעמיס על בסיס הנתונים שלנו? נרו יאיר 10:25, 8 באוקטובר 2007 (IST)תגובה
הו, זה יהיה נהדר! גילגמש שיחה 15:31, 8 באוקטובר 2007 (IST)תגובה
יחי הגרמני הצעיר. לתפוס אותו, ומהר. חגי אדלר ~ כמה קישורים שבורים תיקנת היום? 17:12, 8 באוקטובר 2007 (IST)תגובה
אכן, יחי. אני רודף אותו עד צאת נשמתו בIRC ולא ארפה ממנו הפעם עד שנרים ביחד את הכלי גם בעבורנו. מסיבות מייגעות אי אפשר סתם לבקש ממנו, הוא צריך להדריך אותי מה ואיך לעשות, זה גם עניין של תרגום הודעות וכל מיני צרות כאלה. אבל אני מבטיח - בקרוב אצלנו. בינתיים, קראו ב-meta:WikiCharts איך הכלי הזה עובד באמצעות מדגם סטטיסטי. ‏Harel‏ • שיחה 19:10, 8 באוקטובר 2007 (IST)תגובה
גם אני העברתי מספר אי-מיילים אליו וניסתי לעשות לו כמה אמבושים ב-IRC. לצערי אני זוכה להתעלמות תמידית. העברתי העתקים מהבקשות גם לבריון ושוחחתי גם עם אריק, שאחראי על הסטיסטיקות הכלליות של ויקיפדיה. לצערי כלום, נאדה. הבנאדם מתעלם מכל הבקשות שמגיעות בנושא ויקיפדיה העברית ובשם העמותה. אסון ממש. --‏ Itzike שיחה 01:07, 9 באוקטובר 2007 (IST)תגובה
זה לא מדוייק, צריך פשוט לתפוס אותו בזמנים הנדירים יחסית שהוא מחובר לIRC וגם לדעת איך להירשם לIRC באופן שהוא בכלל יקבל את ההודעות הישירות והן לא ייחסמו בדרך אליו. לא פשוט, אבל אפשרי. ‏Harel‏ • שיחה 15:23, 9 באוקטובר 2007 (IST)תגובה
ראיתם את עשרת הגדולים? הבחורות והסקס שולטים ללא עוררין. מעניין אם גם אצלנו, או שמא ה-D-9 (מרוב עריכות)... חגי אדלר ~ כמה קישורים שבורים תיקנת היום? 17:15, 8 באוקטובר 2007 (IST)תגובה
עכשיו יש סיבה טובה נוספת למבקשים לכתוב על פורנו בוויקיפדיה... :P שמעוןאתנחתה קומית קלה 19:18, 8 באוקטובר 2007 (IST)תגובה
  • 1 545 500 ± 2% 16.8178% 1. Main Page
  • 50 500 ± 12% 0.5495% 2. Wikipedia
  • 40 000 ± 14% 0.4353% 3. United States
  • 34 667 ± 15% 0.3772% 4. List of big-bust models and performers
  • 34 000 ± 16% 0.3700% 5. JonBenét Ramsey
  • 31 167 ± 16% 0.3391% 6. List of sex positions
  • 28 000 ± 17% 0.3047% 7. Wiki
  • 27 667 ± 17% 0.3011% 8. Hurricane Katrina
  • 26 833 ± 17% 0.2920% 9. Pluto
  • 26 500 ± 18% 0.2884% 10. List of female porn stars
מעניין. מישהו אמר ג'נה ג'יימסון ולא קיבל? קרני שיחהמשנה 19:18, 8 באוקטובר 2007 (IST)תגובה
חגי, זו רשימה מלפני שנה. נכון להיום ה-List of big-bust models and performers ירדה למקום ה-474. הנושא הזה כבר לא מעניין את הגולשים. א&ג מלמד כץשיחה 19:22, 8 באוקטובר 2007 (IST)תגובה
אמנם אי אפשר לבסס עבודה אקדמית על מידע מוויקיפדיה אבל הסטטיסטיקות שלה, בעיקר אלו, יכולות לספק חומר לכמה וכמה עבודות דוקטורט במדעי החברה ובכלל. השמח בחלקו (-: הצטרפו למיזם הפורטלים! 20:58, 8 באוקטובר 2007 (IST)תגובה
יש לא מעט מחקרים על ויקיפדיה, כולל במדעים מדויקים (כגון [4]) ועוד רבים בתחומים שונים ומגוונים [5]. ‏עדיאל23:42, 8 באוקטובר 2007 (IST)תגובה
הכלי פועל באופן הבא: יש סקריפט JavaScript שמותקן בוויקיפדיה, וטוען תמונה ריקה מהאתר הזה בצפיה אחת מכל 800 בערך. ‏– rotemlissשיחה 20:42, 9 באוקטובר 2007 (IST)תגובה

סטטיסטיקות מדאיגות

עריכה

הועבר מהמזנון: התפרסמו סטטיסטיקות חדשות עבור ויקיפדיה העברית המעודכנות ל31 באוגוסט[6] ועולה מהן תמונה מאוד מדאיגה, זהו החודש הרביעי (החל במאי) שיש ירידה במספר הויקיפדים החדשים המצטרפים לויקיפדיה (וערכו יותר מ10 פעמים), ובאוגוסט הוא הגיע לשפל שלא הגיע אליו מאז אוקטובר 2005, גם מספר הויקיפדים הפעילים (שערכו יותר מ5 עריכות בחודש) ומספר הפעילים מאוד (יותר מ100 עריכות בחודש) ירד ב4 החודשים הללו, שתי התופעות האלה חריגות מאוד במשך שלהן (4 חודשים רצופים ללא "שיא" חדש), גם מספר הערכים החדשים ליום ירד והגיע לרמה שבה היה ביוני 2006.

בקיצור, נראה כי יש לנו בעיה, ניסיתי לחשוב מה קרה מאז מאי שיכול היה לגרום לתופעה ומצאתי שב14 במאי התקבלה החלטה לחייב תצוגה מקדימה למשתמשים אנונימיים, כמו כן התקבלה ההחלטה על הגבלת זכות ההצבעה (בתחילת יולי), וגם הועלתה ההצהרה על יציאה לדרך חדשה (סוף יוני) שגרמה להקשחה מסוימת בתנאי הסף לערכים בויקיפדיה (לתחושתי), מכל הדברים הללו נראה לי שדווקא חובת התצוגה המקדימה לאנונימיים מונעת ממשתמשים חדשים להתמכר לוויקיפדיה, וכך מדלדלת את תוספת המשתמשים החדשים לוויקיפדיה, מכיוון שעל מנת לצמוח ויקיפדיה זקוקה להזרמה תמידית של "דם חדש" אני מציע לשקול את הסרת ההגבלה ההיא, אף שנראה שהיא צמצמה את כמות ההשחתות. בברכה, --איש המרק 15:05, 9 באוקטובר 2007 (IST)תגובה

זה אכן מעניין ומצריך מחשבה ובדיקה, בכל אופן לתוצאות של החודש האחרון המופיע בנתונים כדאי לא להתייחס, תמיד החודש האחרון - בכל עדכון - מכיל כמה תוצאות מוזרות שנובעות לדעתי משגיאה בדרך החישוב של התוכנה שמייצרת את הנתונים בגלל שהחודש הוא חלקי. ‏Harel‏ • שיחה 15:09, 9 באוקטובר 2007 (IST)תגובה
יש נתונים לגבי הירידה במספר ההשחתות (משהו כמו מספר עריכות ששוחזרו, או משהו כזה)? שנוכל להעריך תועלת מול נזק?
אגב, לגבי הגבלת זכות ההצבעה - אולי נוריד את הרף ל-50 עריכות בשלושה חודשים (במקום 100)? יש תמיכה בשינוי כזה? עופר קדם 15:12, 9 באוקטובר 2007 (IST)תגובה
בהחלט בעד הורדת הרף. א&ג מלמד כץשיחה 15:16, 9 באוקטובר 2007 (IST)תגובה
אני לא חושב שיש קשר לזכות ההצבעה, ואני נגד הורדת הסף, ואין בכלל טעם לדון בזה שוב. מן הסתם התופעה נגרמת בגלל נושא התצוגה המקדימה. אפשר להוסיף עוד טיפ לאנונימיים: "אם תרשמו, תוכלו לשמור ערכים מבלי להציג קודם את התצוגה המקדימה". יש למצוא דרך לבדוק האם נושא התצוגה המקדימה עוזרת במלחמה בהשחתות (אני סבור שכן). אחרי הכל, אנחנו לא הוויקיפדיה היחידה עם הפונקציה הזו. ‏Yonidebest Ω Talk 15:19, 9 באוקטובר 2007 (IST)תגובה
לא הבנתי מה הסיפור הגדול לראות תצוגה מקדימה? שצריך ללחוץ פעמיים?--‏BigJon‏ • שיחה 19:38, 9 באוקטובר 2007 (IST)תגובה
לאנשים בעידן שלנו אין סבלנות. אם הם עושים איזה תיקון, ואז מציגים להם דף לא ממש מובן, שני דברים שליליים עלולים לקרות:
  1. הם יחשבו שהתיקון נעשה (אנשים לא באמת קוראים את כל ההודעות של המערכת), ולסגור את הדף - ואז בעצם אין עריכה.
  2. הם לא יבינו מה רוצים מהחיים שלהם, ויסגרו את הדף - ואין עריכה. עופר קדם 20:03, 9 באוקטובר 2007 (IST)תגובה
לעופר קדם - אפשר להוציא נתונים כאלה מיומן החסימות. לירן (שיחה,תרומות) 15:31, 9 באוקטובר 2007 (IST)תגובה
בסקר המשתמשים הגדול התברר שיש לא-מעט מוסכמות שקוראים רבים אינם מכירים (למשל - המשמעות של הצבע האדום והכחול), וביניהן העובדה שכל אחד יכול לכתוב כאן. יתכן שכדאי לחזור עליו, לערוך רשימה של "סודות" כאלה, ולמצוא דרך לחשוף את הקוראים אליהם. עוזי ו. 16:43, 9 באוקטובר 2007 (IST)תגובה
כבר יש דרך: הצעתי לא מזמן להציג לקוראים טיפים שונים. כבר יישמתי את זה, וכל שצריך לעשות הוא לבחור את הטיפים שאנחנו רוצים להציג להם. ראו שיחת מדיה ויקי:Navtip.js. ‏Yonidebest Ω Talk 21:29, 9 באוקטובר 2007 (IST)תגובה
לא כל משתמש חדש שנרשם תורם, חלק מהרשומים הם גם משחיתים. אנחנו צריכים לחפש משתמשים חדשים בקרב האקדמיה: סטודנטים, דוקטורנטים ואפילו חברי סגל עם זמן פנוי. בברכה, MathKnight הגותי |Δ| (שיחה) 15:39, 9 באוקטובר 2007 (IST)תגובה
נראה לי שגם המצב השתנה לטובה, ולכן קשה להצטרף. פעם יכולת לכתוב ערך על פרה, למשל, ולכתוב בו דברים הכי בסיסיים שכל ילד למד. היום אם רוצים להוסיף משהו זה כבר חייב להיות בתחום ידע שמתמחים בו. בגלל שנכתבו הרבה ערכים ששייכים לבסיס של ידע כללי משותף קשה לפתוח ויקיפדיה ולראות איפה אפשר להצטרף. טל שחר 15:42, 9 באוקטובר 2007 (IST)תגובה
אני לא חושב שההתמחות היא המכשול העיקרי. יש מגוון נרחב של ערכים פופולריים בויקיפדיה שהם קצרמרים, או לא קיימים, וניתן להרחיבם מידע אישי בלבד. בסופו של דבר, ההתרשמות הראשונית של המשתמשים החדשים היא זו שתקבע אם הם ישארו לערוך או לא. אני עצמי כותב בויקיפדיה רק כחודש וחצי (מאז סוף יולי), וכבר מצאתי את עצמי (תוך שיחה על ערך ספציפי) חושב לנטוש את המיזם. ויקיפדיה הפכה עצמה למאוד אליטיסטית, וקובעת קוד התנהגות ושימוש שאינו נהיר לכל אחד. התגובות שכנגד טעויות קלות יכולות בקלות לדרבן אנשים שלא לחזור. ניתן לשנות את המגמה על ידי תמיכה בתורמים חדשים, והרגעת ההיסטריה. Assafsh 16:44, 9 באוקטובר 2007 (IST)תגובה
כל מילה בסלע--‏BigJon‏ • שיחה 20:33, 9 באוקטובר 2007 (IST)תגובה
לא צריך להתרגש. ויקי צומחת היטב ואין סיבה לדאגה. גילגמש שיחה 21:27, 9 באוקטובר 2007 (IST)תגובה
אני הצעתי פעם להוסיף בראש כל הדפים במרחב הערכים הזמנה לעריכה ("ראית טעות בערך? יש לך מה להוסיף? באמצעות לחיצה על הלשונית "עריכה" אפשר לערוך את הערך ולשפר אותו." - או משהו בסגנון) - בזמנו ההצעה הותקפה כליברלית מדי, אבל אולי עכשיו הזמן להעלות אותה שוב. אני יודע לגבי עצמי שבמשך תקופה ארוכה מאוד הייתי רואה ערכים בוויקיפדיה ולא היה לי שמץ של מושג שאני יכול לערוך בעצמי; ואותו דבר שמעתי גם ממשתמשים אחרים. אסור לשכוח שרוב רובם של הגולשים בכלל לא עוברים בעמוד הראשי (ואולי אף לא יודעים על קיומו), אלא מגיעים ישר לדף הערך ממנוע חיפוש. אביעד המקורישיחהבואו להתפעל 00:39, 10 באוקטובר 2007 (IST)תגובה
הרעיון הנ"ל (שראיתי אותו מיושם באיןציקלופדיה בתור הכרטיסייה החמישית) יכול להוריד קצת לחץ מספר האורחים ולסייע לטכנופובים שבכל זאת למדו לגלוש והגיעו לויקיפדיה. אני חושב שאולי צריך לשים באופן בולט הדרכה לגבי הממשק של ויקיפדיה (בsitenotice או ברוצה טיפ?), על מנת שישימו לב שאפשר לערוך ואפשר לכתוב הצעות בדף השיחה (או אפילו לשנות את העיצוב של הממשק על מנת שהכרטיסיות יהיו בולטות יותר).
לגבי ההודעה הראשונה בדיון, כפתור התצוגה המקדימה וזכות ההצבעה שניהם לא קשורים לירידה במספר הערכים החדשים-בשביל כתיבת ערכים לא צריך זכות הצבעה, ומי שהגיע לכתיבת ערך יכול ללחוץ על תצוגה מקדימה לפני שהוא שומר (זה לא מה שיגרום למישהו לסגור את הדפדפן בייאוש).
הבעיה לדעתי היא העלאת הסף-מוחקים מהר מאוד ערכים קצרים שאפשר להרחיב אותם (דמיין ש"השקעת" דקה מזמנך כדי לכתוב ערך ואיזה מפעיל בא ומוחק אותו "ברוב חוצפתו"? ברגע שהם שמים לב שמה שהם כתבו הלך לפח, הם חושבים שדחו אותם, שלא רוצים אותם, הם לא מבינים למה הערך נמחק). לשמור אותם במרחב הערכים כמו שהם אי אפשר, אבל מצד שני, זה דוחה את יצירת הערך בזמן כלשהו (כמה ימים, אולי כמה חודשים).
אפשרות ראשונה לפתרון, מי שנתקל בערך כזה ירחיב אותו לקצרמר על מנת שלא ימחק. אם לא ניתן להרחיבו, לדעתי יש להעביר ערכים כאלו כדפי משנה של ארגז החול או לדף מיוחד לערכים שטרם הבשילו (ויקיפדיה:מדגרה?) ומי שיש לו זמן יגאל אותם וידאג להפוך אותם לקצרמרים.
בעיה נוספת היא מחיקת ערכים שבעיני חלק מהויקיפדים אינם חשובים (כוכבים נולדים למיניהם, למשל). בעיה אחרת היא אנונימיים שמשתעשעים להם בעריכה ואז כשהם מקבלים אזהרה הם נעלבים ועוזבים או מתחילים להשחית ואז נחסמים. בעיה דומה, אולי החמורה מכולן, איך מצליחים להשאיר משתמשים שנרשמו? הפתרון, "הסבר פניך לויקיפד".
אם אנשים עדיין לא יודעים שאפשר לערוך את ויקיפדיה, כדאי לשים קישורים מובלטים בדף הראשי (להדגיש את "כולם יכולים לערוך" בפנייה הראשונה, להוסיף בקישורי הקהילה את הקישור לדף "איך ליצור דף חדש?") או בממשק עצמו (מאחר והרבה מגיעים לערכים בויקיפדיה דרך גוגל ולא דרך הדף הראשי). ‏Hummingbird° יש לך הודעה ° כולי אוזן 02:11, 10 באוקטובר 2007 (IST)תגובה
אירוע נוסף שקרה באפריל ולדעתי הוא הגורם המכריע בירידת מספר האונונימיים הוא התחלת החסימה האוטומטית של פרוסקים פתוחים. דניאל ב. 21:29, 16 באוקטובר 2007 (IST)תגובה

סטטיסטיקות צפייה - סיעור מוחות

עריכה

נכון להיום סיימתי לייצב את כל המנגנון האוטומטי של שליפת נתוני הצפייה ועדכון דפי הסטטיסטיקה השעתית והיומית, כך שלמעשה כל זמן שהמחשב שלי פועל ומחובר לאינטרנט הוא מעדכן את הסטטיסטיקות מידי שעה. מעבר לזה אני גם מאכסן את כל הנתונים הגולמיים בבסיס נתונים על המחשב שלי - כדי לאפשר ניתוח עתידי (למשל סטטיסטיקה חודשית), אבל כיוון שמדובר בהרבה מאד נתונים (סדר גודל של 1-2 ג'יגה בשבוע) אני לא אוכל להחזיק אותם לאורך זמן, ואאלץ לצמצם חלק מהנתונים (למשל - להחזיק התפלגות כניסות שעתית רק לחודש האחרון, ולפני כן התפלגות יומית או חודשית בלבד). הדיון הזה נועד על מנת לנסות לקבל רעיונות לגבי נתונים מעניינים שאולי נרצה להציג - כך שאני אוכל להתאים את מבנה בסיס הנתונים בהתאם ולשמור נתונים מעניינים, ובשאיפה כשיתפנה לי זמן (למשל אחרי תקופת המבחנים של סמסטר א1 ובזמן תקופת הלימודים של סמסטר א2 המדולל) אני אדאג גם ליצירה אוטומטית של הסטטיסטיקות הללו.

מכיוון שהיה מעט בלבול אני אסביר אילו נתונים קיימים - בכל שעה שרתי ויקיפדיה מייצרים קובץ נתונים שמכיל רשימה של כל הדפים שנצפו בויקיפדיה בשעה האחרונה, וכמה פעמים כל אחד מהם נצפה. זה הכל. מה לא כלול?

  • איזה כתובות IP ביקשו איזה דפים, או כל חלוקה אחרת שתאפשר לדעת או לנחש כל מידע שהוא לגבי זהות/כמות המבקרים השונים
  • דפים שאינם מהצורה http://he.wiki.x.io/wiki/XXXXX - כלומר כניסה של ויקיפדים למצב "עריכה", "תצוגה מקדימה", "מחיקה", "הגנה" וכו'...

אני כאמור יודע כרגע לתת מידע (כמה פעמים נצפה) בחתך שעתי לכל ערך, וכמו כן לסכם ערכים/תקופות זמן. ניתן בקלות יחסית לייצר גרפים (כמו זה) אולם כרגע לא באופן אוטומטי - כך שאם יש למישהו עניין מיוחד בגרף הכניסות לערך ספציפי אני יכול לייצר גרף כזה עבורו, אבל אנא אל תציפו אותי בפניות לפני שאני אמצע דרך להפוך את כל התהליך לאוטומטי לחלוטין (ואז בשאיפה אפשר יהיה לקבל גרף תוך שעה פשוט על ידי כתיבת שמו בדף שיוקצה לצורך העניין). לסיכום - אתם מוזמנים להעלות פה כל רעיון או בקשה לפילוח שעולה על דעתכם, ואני אשתדל להתאים את המערכת שלי כך שתוכל לספק את הדרישות. ‏ costello • ‏ שיחה 22:40, 21 בינואר 2008 (IST)תגובה

בעניין גרפים אוטומטיים אני מציע לך לעבור לפייתון ולהשתמש בספריית matplotlib המצויינת. שאלה שמטרידה אותי מאז שעלו הנתונים לאתר הזה היא האם אלו כל בקשות הדפים, של כל המשתמשים, או שזה איזה חתך שמפלה לטובה משתמשים לא רשומים דווקא או כל דבר אחר. רותם חושב שבגלל מבנה הטיפול בבקשות צפייה על ידי השרתים השונים מה שאנחנו רואים פה זה לא ממש כל בקשות הדפים אלא יותר אלו של בלתי רשומים, ויש לי תחושה שזה נכון. יהיה מעניין גם לחכות ולראות איזה כלי תשתיתי מפתח ליאון מהוויקיפדיה הגרמנית להצגה וניתוח של התוצאות. ‏Harel‏ • שיחה 22:43, 21 בינואר 2008 (IST)תגובה
אני דווקא לא בטוח בכך. ייתכן בהחלט שדרך שרתי ה-Squid עוברות כל הבקשות, וכנראה שכולן נרשמות, גם אם חלקן "מועברות הלאה" לשרתי בסיס הנתונים וכיוצא בזה וחלקן לא. ‏– rotemlissשיחה 22:47, 21 בינואר 2008 (IST)תגובה
ראשית, אני לא רואה טעם בפילוח לפי שעה. אפשר לרכז את הנתונים לפי יממה (סביב 4 בבוקר שעון ישראל, נאמר). לכל יממה, כדאי לשמור את מספר הדפים שנצפו פעם אחת, פעמיים, ... , 50 פעם; ורשימה מלאה של הדפים שנצפו 50 פעם או יותר. (את המספר 50 אפשר לכוונן לפי הטעם ולפי נפח הנתונים, כמובן). עוזי ו. 22:45, 21 בינואר 2008 (IST)תגובה
שלום. ראשית לדעתי נתוני הפילוח לפי שעות אינו רלוונטי ביותר עם התיישנותו, וסטטיסטיקה יומית מספיקה (אם כי אם כך יעשה יש לשמור נתונים על יותר מה-100 המבוקשים. שנית, הייתי שמח לו ניתן היה בבחיקה ידנית להסיר דפים מסויימים מהתוצאות. למשל לראות את החיפושים הנפוצים אחרי שהסרתי את שלל מילות החיפוש הקשורות בפורנוגרפיה ומין, שחוץ מהמשמעות המייאשת משהו שלהן על המפעל הזה, אינן מסייעות לי כלל. בברכה, אורי שיחה 22:51, 21 בינואר 2008 (IST)תגובה
כתבתי לפני התנגשות עריכה: אם זה רק קוראים ולא לרשומים זה רק יותר טוב. כך אנחנו יודעים איזה ערכים מעניינים את הקוראים ולא איזה דיונים הכי לוהטים עכשיו. חוץ מזה, רשומים מן הסתם מטים את התוצאות לטובת הפורטלים והקטגוריות אליהם הם מודעים וכך אנחנו לא יכולים לדעת מה רמת החשיפה האמיתית שלהם. ולמשהו אחר, האם אני יכול לבקש לדוגמה מעקב לאחר הערך X, כך שבעוד שבוע תוכל להגיד לי כמה פופולרי הוא? האם אפשר להפריד את כל התוצאות של חיפושים והדפים המיוחדים מהתוצאות של הערכים? והאם אפשר לאחד מופעים כפול של דפים מיוחדים שלפעמים מופיעים בשם הלועזי שלהם ולפעמים בשם עברי? דניאל ב. 22:55, 21 בינואר 2008 (IST)תגובה

מספר תגובות -

  • לעניין אמינות הנתונים - עד כמה שאני מבין את הדברים אלו כל הכניסות (עם הסייגים שהצגתי למעלה) כפי שרותם מציין ההחלטה מאיפה להביא את הדף מתקבלת אחרי השלב הזה.
  • הבהרה כללית - אצלי קיימים נתונים לגבי כל הדפים - אני מעלה לויקיפדיהרק את רשימת "100 הגדולים" רק משום שעדכון רשימה של עשרות אלפי כניסות מידי שעה או מדי יום היא הרבה מעבר למה שאנחנו צריכים. אם יש צורך אני יכול להעלות את החסם ל-200 (או יותר?). באותו עניין - אין צורך להודיע לי מראש על ערך למעקב, אני יכול לספק כבר עכשיו נתונים על הכניסות לכל ערך שתבחר בשבוע האחרון.
  • פילוח לפי שעה - האם גם דף הסטטיסטיקה השעתית מיותר לטעמכם (הוא כן מעניין לטעמי כי הוא מציג מגמות כמעט בזמן אמת) או שרק שמירת הנתונים בפילוח שעתי לאורך זמן?
  • הפרדה בין משתמשים רשומים וקוראים מזדמנים - מדובר על סך כל הכניסות, רשומים ולא רשומים, ואין כל דרך להפריד בינהם.
  • הסרת ערכי מין ופורנוגרפיה - אני לא מעוניין "לצנזר" את הרשימות, אבל אני יכול כאמור להציג רשימות ארוכות יותר כדי שייכנסו אליהן גם יותר חיפושים רלוונטיים.
  • הפרדה בין דפי תוכן לדפים מיוחדים - רעיון טוב.
  • איחוד דפים מיוחדים באנגלית ובעברית - ייתכן שקישורים שונים מובילים לשמות באנגלית ובעברית, ואפשר על פי הסטטיסטיקה הזו לנתח מאיפה מגיעים לדפים הללו, בכל מקרה אני אבדוק אופציה לאיחוד.

costello • ‏ שיחה 23:36, 21 בינואר 2008 (IST)תגובה

רוב תודות! רק הבהרה - לא התכוונתי לצנזר, ולכן ביקשתי כלי ידני. בסופו של דבר להוציא את העניין של מרבית קוראינו באתרים "דומינה" ו"עולם הסקס של ענת" על נדזרותיהם השונות, תוצאות רבות ברשימה פשוט לא מועילות, לפחות לא לי. בברכה, אורי שיחה 23:52, 21 בינואר 2008 (IST)תגובה

מעניין אותי לראות גרף שיציג את כמות הצפיות ביום (או עדיף בשבוע) בכלל הערכים, מן הנצפים ביותר ועד אלה שלא נצפו כלל. באיזו חדות זה יורד - האם יש מעט ערכים שנצפים רבות וזנב ארוך של כאלה שנצפים מעט מאד, או שיש ירידה מדורגת. כמו כן, כמה דפים שונים נצפים מדי יום? מדי שבוע? דב ט. 01:18, 22 בינואר 2008 (IST)תגובה

כמובן אין צורך לשמור באופן קבוע נתונים אלה, על כלל הדפים הנצפים, אלא רק לדגום מעת לעת. דב ט. 01:40, 22 בינואר 2008 (IST)תגובה
בקשר לדפים המיוחדים. אתה אומר שהכלי לוקח דפים מהצורה "http://he.wiki.x.io/wiki/XXXXX" כך שאולי הסיבה לכך שיש מופעים גם של השם הלועזי וגם עברי היא ששורת הכתובת של חלק מהמחשבים מופיע בעברית ובחלק זה סתם ג'יבריש. דניאל ב. 03:40, 22 בינואר 2008 (IST)תגובה

פרמטרים לשמירה

עריכה

זו דעתי... חגי אדלרתבניות בערכים מחכות לך! • ט"ו בשבט ה'תשס"ח • 01:23, 22 בינואר 2008 (IST)תגובה

יחידת זמן ערכים להצגה תקופת שמירה הערות
שעתי 100 חודש -
יומי 500 שנתיים -
חודשי 1,000 לעולם -
שנתי 3,000 לעולם -

סטטיסטיקה על דפוסי כניסות ומסקנותיה

עריכה
הועבר מ-ויקיפדיה:מזנון:

קידום הפורטלים נוכח הסטטיסטיקות האחרונות

עריכה

הסטטיסטיקות האחרונות של קוסטלו מראות כי לפורטלים שלנו מקום נכבד ברשימת הדפים מרובי הכניסות. פורטל ההיסטוריה, לדוגמה, היה ב- 17 לחודש הדף "בעל הבשר" (כלומר, להוציא דפים כמו המזנון ודפי חיפוש) ה-13 בכמות הכניסות, לפי ספירתי, וה-9 ביום שקודם לו. פורטלי הרפואה, המתמטיקה, הביולוגיה וישראל, כמו גם פורטל הפורטלים, מקבלים מקום מכובד אף הם. הנתונים מראים באופן די ברור כי הפורטלים הם אכן יעד נפוץ בקרב גולשינו, ואכן מהווים שער עבור גולשים רבים.
לצערי, השער שנחשף אליהם בחלק מן המקרים הנו לקוי ביותר. פורטל ההיסטוריה - הפורטל הנצפה ביותר - הוא פורטל לשכתוב כבר זמן רב. לפי הסטטיסטיקות, זהו דף בעל פוטנציאל מיוחד מאוד, שלא ממומש. חלק מן הפורטלים האחרים, למשל מתמטיקה וישראל, הם ברובם שילוב בין תוכן מועיל לרשימות ארוכות שלא שונות מהותית מהקטגוריות בנושא. לכן, כשאנו רואים שוב את מרכזיותם של הפורטלים בקרב קהל הקוראים, זוהי הזדמנות להכיר לכולם את מיזם קידום הפורטלים.
לסיכום דברי - הפורטלים הם במידה מסוימת דף השער הבא לעולם הוויקיפדיה אחרי הדף הראשי. חבל מאוד שחלקם לקויים מאוד מבחינה מבנית ועיצובית ושאחרים זקוקים להשלמת תוכן מהותית (למשל, פורטל הכימיה). איש לא היה רוצה שהעמוד הראשי יראה כך, לכן אני קורא: קדמו פורטל! אני, אישית, מוכן לעזור לכל מי שיצטרך עזרה כלשהי, אך רק אדם בעל ידע מקיף בהיסטוריה יוכל לגאול פורטל כה חשוב כמו "היסטוריה" מייסוריו. שמעוןאתנחתה קומית קלה 22:22, 18 בינואר 2008 (IST)תגובה

אני מצטרף כמובן לקריאה של שמעון שכבר הושמעה בעבר אבל מקבלת משנה תוקף לאור הסטטיסטיקות היומיות. כל מי שמעוניין לעזור - חשוב שיעיין גם בויקיפדיה:המדריך לעיצוב פורטלים ויזכור כי פורטלים חייבים בראש ובראשונה להציג תוכן. הגלריות והואספים השונים בפורטלים נותנים ערך מוסף יפה, מעניין וחשוב מאוד אך לא די בהם. לרוב, קל יחסית (וגם די כיף) ליצור אוספים כאלה אך כשערי כניסה אלטרנטיבים למרחב הערכים של ויקיפדיה, חשוב שהפורטלים יציגו פריסה מקצועית והיררכית של הערכים בתחום. קל וחומר כאשר מדובר בפורטלים הראשיים המופיעים בעמוד הראשי. השמח בחלקו (-: 00:18, 19 בינואר 2008 (IST)תגובה
אני מצטרף ובעוד שנה נכניס גם אותו לרשימת השכתובים הישנים... חוץ מדיונים אינסופיים המזנון לא קידם מעולם שום מיזם. חגי אדלרתבניות בערכים מחכות לך! • י"ב בשבט ה'תשס"ח • 00:36, 19 בינואר 2008 (IST)תגובה
אני לא חושב שתבנית השכתוב מוצדקת שם, ואני מעלה זאת במזנון כי מדובר בנושא כללי. מעבר לתוכן הדינמי. פורטל יכול להיות, כמו פורטל אדריכלות, מעין מבוא לתחום כולו, כלומר למעשה דף תוכן לכל דבר. אבל גם הוא אם רק מציג בצניעות את הקטגוריות הרלבנטיות וכן פורטלים קרובים, ובכך מקל על מציאת ערכים בוויקיפדיה, הוא עושה בכך את מלאכתו. ראו למשל את פורטל ההיסטוריה בוויקי באנגלית. פורטל לתפארת? לא, אבל גם לא לשכתוב. דב ט. 11:08, 19 בינואר 2008 (IST)תגובה
הפורטל איננו ממלא אפילו את התפקיד הזה. ארבעת תבניות הניווט שבו דלות ולא מועילות. קו הזמן הפרמיטיבי שלו שיצרתי אתמול ושהחליף תבנית ניווט זהה הוא די חסר תועלת, בגדול, אף הוא. לכן, זהו פורטל לשכתוב. מעבר לזאת, זהו פורטל בעל פוטנציאל ענק, גם אם אף אחד מהמקבילים לא יישם זאת.
לחגי: אני בעצמי שכתבתי בזמנו את פורטל האישים עקב ההסברה של השמב"ח, כך שחסרת תועלת היא לא הייתה.
ולסיום: שופץ פורטל המתמטיקה. כפי שכבר הזכרתי בלוח המודעות, הוא בהחלט זקוק למתנדבים שייצקו בו עוד תוכן. שמעוןאתנחתה קומית קלה 11:57, 19 בינואר 2008 (IST)תגובה
פוטנציאל יש. (אגב, מאז שסומן לשכתוב נוסף הרבה תוכן דינמי שלא היה קיים). עדיין, אין לדרוש מפורטל שיהווה מבוא אינפורמטיבי לנושא עצמו (כלומר ממש ילמד קצת היסטוריה או קצת פיזיקה) אלא רק שיהיה בסיס נוח למציאת ערכים בתחום, לא הרבה יותר מעץ קטגוריות עם קצת שכלולים. דב ט. 12:25, 19 בינואר 2008 (IST)תגובה
אני לא "דורש" דבר מאיש, אבל אני כן חושב שפורטל אמור להיות סוג של "עמוד ראשי" של הנושא. כשם שהעמוד הראשי של וויקיפדיה איננו קטגוריה צבעונית אלא הרבה יותר מכך, כך הפורטל אמור "לשווק" את הנושא, לגרות את הקורא ולתת אפילו מספר כלים לאדם המתעניין בנושא אך איננו בעל בקיאות מיוחדת בו. ניסיתי להוציא לפועל גישה זו בפורטל הפיזיקה, ואני די מרוצה מהתוצאה. שמעוןאתנחתה קומית קלה 12:47, 19 בינואר 2008 (IST)תגובה
יש דרישות: פורטל חייב להיות מסגרת נוחה לניווט והתמצאות בהיצע הויקיפדי בתחום, זו סיבת קיומו. כמובן צריך גם להיות אסתטי. מעבר לכך, תוכן דינמי זה בונוס (אני עצמי השקעתי בכך רבות, בלא מעט פורטלים שיצרתי\הרחבתי להם את גלריות התמונות ורשימת הערכים המומלצים, אבל זה לא בהכרח דבר חשוב בעיניי). גם תוכן סטטי מתוחכם, שמלמד על הנושא, הוא בונוס. דב ט. 13:17, 19 בינואר 2008 (IST)תגובה

בלי קשר לדיון, זה אולי הזמן לציין ולשבח את פועלם של דב ושל שמעון בתחום הפורטלים שבלי קשר לדיבורים הקימו ורחיבו כבר כמה אוספים וגלריות פורטלים בצורה יוצאת מן הכלל! השמח בחלקו (-: 17:35, 19 בינואר 2008 (IST)תגובה

ערך אקראי

עריכה

מעיון בהסטטיסטיקות האחרונות של קוסטלו מתברר גם כי מיוחד:אקראי זוכה לפופולריות רבה בקרב מבקרים כאן ויתכן שדירוגו (מקום רביעי בסטטיסטיקה מאתמול) היה אף גבוה יותר לו היינו יכולים לנפות את הכניסות של חברי קהילה.

לאור זאת אני תוהה האם ניתן לתכנת את הקריאה לערך אקראי כך שתעלה רק ערכים ולא דפי פירושונים?--‏Golf Bravo11:06, 19 בינואר 2008 (IST)תגובה

אני מקליק עליו כל הזמן, עד שאני מגיע לערך אקראי שצריך איזה שיפור (תיקון קישור, ניסוח וכו'). אני מניח שיש גם אחרים כמוני, ושאנחנו גורמים לפופולריות שלו. האם יש סטטיסטיקה על מספר הקוראים הלא-רשומים שהקליקו על קישור זה? ערןב 11:20, 19 בינואר 2008 (IST)תגובה
אין לנו כל דרך להפריד בין גולשים רשומים ללא רשומים, ואפילו לא לנתח כניסות יחודיות. הנתונים הגולמיים מכילים רק מספר בקשות לכל דף בכל שעה - ולא שום פרט מזהה או אחר מעבר לזה. ‏ costello • ‏ שיחה 13:08, 19 בינואר 2008 (IST)תגובה
בעניין דפי הפירושונים - השאלה נשאלת כל הזמן והתשובה גם היא קבועה - הגעה לדף פירושון באמצעות "ערך אקראי" היא זהה במשמעותה להגהה לערך רגיל באמצעות "ערך אקראי" - אתה פשוט בוחר את הערך שאתה רוצה מתוך הפירושון, או ממשיך לחפש באמצעות "ערך אקראי". זה לא מזיק ויכול אף להועיל במקרה ו-וויקיפד נפגש בפירושון שצריך טיפול מסוים. צריך לכתוב את זה איפשהו כי תמיד חוזרים על השאלה הזו. בברכה, ‏Almighty ~ שיחה 04:12, 25 בינואר 2008 (IST)תגובה

לשם מה בעצם צריך את נתוני החיפוש

עריכה

לא הצלחתי למצוא משהו מעניין ברשימות היומיות של חיפושים שנעשו. (לא בדקתי עדיין את הרשימה החצי-חודשית). דב ט. 22:45, 2 בפברואר 2008 (IST)תגובה

בטווח הארוך ולאחר ניפוי הסקס והשטויות, ייתכן שניתן יהיה למצוא רשימת ערכים שהציבור מחפש בעקביות ולא מוצא. בברכה, --איש המרק 00:02, 3 בפברואר 2008 (IST)תגובה

מיון לפי קטגוריות

עריכה

האם זה אפשרי ליצור רשימות של ערכים מבוקשים לפי קטגוריה? אני לא מדבר על רשימה מתעדכנת, או על כל הקטגוריות, אלא על הנפקה חד פעמית של רשימה לפי דרישה ספציפית.
זה נראה לי פרוייקט ישים, גם אם לא פשוט (צריך ליצור רשימה של כל הערכים בתת-הקטגוריות, ואז להתאים נתוני צפייה לכל אחד מהם), אבל לפחות לטעמי הוא בעל חשיבות עליונה. השאלה איזה ערכים סוציולוגיים אנשים מחפשים יכולה להנחות אותי לרכז מאמץ בתחומים מסויימים בצורה יעילה בהרבה מאשר הרשימה הכללית - שבה לרוב הערכים אינני יכול לתרום (ברמת התוכן לפחות). נדב 10:28, 15 בפברואר 2008 (IST)תגובה

אפשרי, אבל לא בטווח הזמן הקרוב. אתה (ואחרים) מוזמן להכין בקשות - בשאיפה לקראת סוף החודש אני אוכל לנפק רשימות כאלו. ‏ costello • ‏ שיחה 14:01, 15 בפברואר 2008 (IST)תגובה
ראה זאת כהזמנה לגבי קטגוריה:סוציולוגיה, על תת-קטגוריותיה. (ד"א, איך אתה שומר את הנתונים? אולי אני אוכל לעזור בנידון) נדב 18:47, 15 בפברואר 2008 (IST)תגובה
אני בטח יורה לעצמי ברגל - אבל הכוונה שלך היא לכל הערכים בכל תת הקטגוריות ברשימה אחת - או רשימה נפרדת לכל תת קטגוריה?
הנתונים מאוכסנים בטבלת mysql פשוטה - עם עמודות לשעה, יום, חודש, שנה, שם דף ומספר צפיות. כיוון שהטבלה הזו כמובן צומחת למימדים מפלצתיים מידי יום אני גם מסכם את הנתונים ומכניס אותם לטבלה זהה ברזולוציה יומית, כך שברגע שבסיס הנתונים יהיה גדול מידי אפשר יהיה לזרוק נתונים פר שעה של החודש הקודם למשל - אבל לשמור על כל הנתונים ברזולוציה של יום. אין ספק שהמבנה הזה רחוק מלהיות אופטימלי - למעשה הוא נבחר בגלל שרציתי יכולת לאגד את הנתונים מהר - וזו הצורה שבה הם מגיעים במקור, אני כרגע שוקל מה היא הדרך הנכונה להחזיק אותם, ברור למשל שאת שם הדף אני אוציא לטבלה חיצונית שתתאים בין שם לבין מזהה מספרי (ובשאיפה גם למזהה המספרי בטבלאות ויקיפדיה - כדי לאפשר חיתוכים קלים עם טבלאות הקטגוריות למשל), אבל מעבר לזה אני לא בטוח אם עדיף לדבוק בשיטה הנוכחית או לעבור למשל למבנה שבו כל שורה תכיל את פירוט הכניסות לדף במשך יום שלם (24 עמודות למספר הצפיות בכל שעה). אם יש לך הצעות/רעיונות/תובנות בעניין אני אשמח לשמוע. ‏ costello • ‏ שיחה 21:13, 19 בפברואר 2008 (IST)תגובה

הפניות נספרות פעם אחת

עריכה

הערה לגבי נתוני הצפייה: כאשר מגיעים לדף כלשהו דרך דף הפנייה, נספר רק דף ההפנייה ואילו הצפייה בדף המופנה אינה נספרת.

כך למשל נתוני הצפייה לחודש מרס של דפי ההפנייה נפוליאון, אליזבת השנייה ופאבל הראשון גבוהים בהרבה מנתוני הצפייה של הדפים, שאליהם הם מפנים.

גוגל אגב מפנה את הגולש לדף ההפנייה נפוליאון ולא לדף נפוליאון בונפרטה. כך שסביר, שהצפיות שנמנו בדף נפוליאון בונפרטה הן כולן של גולשים מתוך ויקיפדיה, שהגיעו דרך ערכים אחרים או תיבת החיפוש.

דב ט. - שיחה 14:13, 19 במרץ 2008 (IST)תגובה

השוואות בינוויקיות

עריכה
  • השוויתי את הצפייה בעמוד הראשי ובערך מדעי מייצג (אטום) בעברית ובכמה שפות, שמספר הדוברים בהן הוא באותו סדר גודל - יוונית, שוודית, דנית, פינית והונגרית. הנתונים בוויקי העברית גבוהים משמעותית. ניסיתי לאמוד בכך את נתוני הצפייה הכוללים בויקיפדיות, באין לי דרך ישירה להשוות.
  • השוויתי את הצפייה בכמה ערכים הנוגעים לישראל בוויקי בעברית ובאנגלית. הופתעתי לראות ששיעורי הצפייה די דומים, ובדרך כלל הערכים נצפים יותר דווקא בוויקי באנגלית. בדקתי כמה ערכי אישים (כמו אהרון ברק) וכמה ערים חדשות (רמת גן, חולון, רמה"ש). בערך אחד שבדקתי על יישוב עם היסטוריה עתיקה (טבריה) צפו הרבה יותר באנגלית.

דב ט. - שיחה 14:13, 19 במרץ 2008 (IST)תגובה

סטטיסטיקה (העברה מלוח המודעות)

עריכה

מלבד הסטטיסטיקה של קוסטלו, כעת זמין גם סטטיסטיקה של הנריק מוויקיפדיה האנגלית. אתם מוזמנים לנסות את שניהם. ‏Yonidebest Ω Talk15:18, 7 במרץ 2008 (IST)תגובה

חצי הכוס הריקה

עריכה

אמנם הסתכלות נגטיבית, אבל אולי זה בכל זאת חשוב - האם ניתן ליצור שליפה שתציג בסוף כל חודש את הערכים הכי פחות נצפים? אני משער שיהיו המון ערכים בעלי 0 צפיות, כך שצריך לחשוב על דרך טכנית ולוגית לממש את זה, אבל מה אתם אומרים על הרעיון הכללי? החשיבות של זה מבחינתי היא שנוכל לאתר כך ערכים ש"נפלו בין הכיסאות", ולמרות חשיבותם אנשים פשוט לא מגיעים אליהם. ואז אולי נוכל לעשות להם קצת "promotion" (על ידי קישורים מערכים אחרים, לדוגמא). מה דעתכם? טוסברהינדי (שיחה) 00:53, 10 באוקטובר 2008 (IST)תגובה

האמת? רעיון מעניין. אביעדוס - שיחה 00:55, 10 באוקטובר 2008 (IST)תגובה
אם אתה באמת כלכך מתעניין אז תסתכל גם על הרעיון הזה. היה יום כיפור פורה... טוסברהינדי (שיחה) 00:58, 10 באוקטובר 2008 (IST)תגובה
ראיתי. מעניין אף הוא. אביעדוס - שיחה 02:29, 10 באוקטובר 2008 (IST)תגובה
התשובה היא לא. כלומר טכנית כן, אבל התוצאות שתקבל יהיו שגויות. זאת משום שישנם כל מיני גורמים עוינים שמפעילים מניפולציות על האתר. הדבר נבלע בקרב בעלי שיעורי הצפיה הגדולים ביותר, אבל בקרב הנצפים פחות הוא מאוד משמעותי ומעוות לחלוטין את התוצאות. יחסיות האמת • י"א בתשרי ה'תשס"ט 06:18:37
למה כוונתך? אביעדוס - שיחה 06:36, 10 באוקטובר 2008 (IST)תגובה
זה דווקא רעיון מעניין. אולי יופיעו שם ערכי הבל שאיש לא שם לב אליהם מעולם. דניאל ב. 06:25, 10 באוקטובר 2008 (IST)תגובה
נכון.. אביעדוס - שיחה 06:36, 10 באוקטובר 2008 (IST)תגובה
כרגע - לא ניתן. הסיבה היא שהנתונים היחידים הזמינים הם לאילו כתובות נכנסו הגולשים, אין בהכרח התאמה בין התנונים האלו לרשימת הערכים, ואין (במבנה הנתונים הנוכחי אצלי) דרך פשוטה למצא ערכים קיימים שאין נתונים לגביהם - כי הם פשוט לא מופיעים ברשימות (בניגוד ל-"מופיעים ברשימות עם מספר צפיות 0"). כבר די הרבה זמן שאני מתכנן שינוי בצורה שבה אני מחזיק את הנתונים - ושינוי כזה יאפשר בין השאר גם שליפה כמו זו שאתה מציע, אבל עד שהוא יבוצע - זה פשוט לא אפשרי. ‏ costello • ‏ שיחה 10:28, 16 באוקטובר 2008 (IST)תגובה
כרגיל - יש על מי לסמוך (גם כשהתשובה שלילית...). המון המון תודה. אשמח לדעת כאשר זה יתאפשר. מועדים לשמחה! :-) טוסברהינדי (שיחה) 11:00, 16 באוקטובר 2008 (IST)תגובה

לא מתעדכן

עריכה

יש סיבה שהנתונים לא מתעדכנים כבר שבוע? tomtom - שיחה 21:55, 12 באוקטובר 2008 (IST)תגובה

כן. קוסטלו יטפל בזה כשיחזור מחופשתו, ב-15 בחודש. טוסברהינדי (שיחה) 22:46, 12 באוקטובר 2008 (IST)תגובה

שאלה של פופולריות - רעיון שעלה במהלך הצום

עריכה
הועבר מ-ויקיפדיה:מזנון:

בואו נניח שבנאדם כותב בוויקיפדיה. ובואו נניח שהוא יוצר כמה וכמה ערכים. ובואו נניח שבאיזשהו שלב הוא מתחיל להטיל ספק ב"חשיבות" הערכים שהוא פותח, או ב"פופולריות" שלהם. הבנאדם פשוט רוצה לדעת כמה צפיות היו לכל אחד מהערכים שהוא יצר, כדי לדעת אם עבודתו אכן מגיעה לעיני הקוראים או שהיא "מיותרת" (בכוונה במרכאות).

נשאלת השאלה: בדומה ל"רשימת המעקב", האם ניתן ליצור רשימה אישית, בה יכליל כל אדם ערכים עליהם הוא מעוניין לקבל סטטיסטיקה של צפיות? כך יוכל כל אדם לראות עד כמה הערכים שכתב אכן תורמים לאנושות, ויוכל לכלכל את דרכיו להבא בנוגע לכתיבת ערכים (יבחר לכתוב ערכים "תורמים" יותר, נניח).

האם אפשרי טכנית ליצור רשימה כזאת? עצרו רגע וחשבו - אני משוכנע שכל אחד מכם ירצה לראות את הפרטים האלה על הערכים אותם כתב. מה דעתכם? נחוץ? אפשרי טכנית? טוסברהינדי (שיחה) 00:49, 10 באוקטובר 2008 (IST)תגובה

אין מונה כניסות לערכים אבל יש אתרי צד שלישי שעושים את העבודה [7], תעקוב שם. הידרו - שיחה 00:54, 10 באוקטובר 2008 (IST)תגובה
אם אין מונה כניסות לערכים, איך יש את ויקיפדיה:נתונים סטטיסטיים? טוסברהינדי (שיחה) 00:57, 10 באוקטובר 2008 (IST)תגובה

הנה תשובה מסוג אחר: ערך שמספר העורכים אותו הוא רב, ושיש בעניינו דיונים (ענייניים, הקשורים לתוכן) בדף השיחה - הוא ערך שנצפה על ידי עורכים רבים. ניתן רק להניח שאותן סיבות שהביאו את העורכים הרבים אל הערך - יביאו גם את הגולשים שאינם עורכים. :-) ‏Danny-w01:42, 10 באוקטובר 2008 (IST)תגובה

אני יכול להוסיף שבדף הגרסאות הקודמות של הערכים יש קישור לאתר סטטיסטיקות צפייה, סטטיסטיקה של הגרסאות הקודמות ואפשרות לחפש מידע בתוך הגרסאות הקודמות. הוספתי את זה לא מזמן. ‏Yonidebest Ω Talk01:55, 10 באוקטובר 2008 (IST)תגובה
כן, באמת יש את הקישור הזה שמאפשר לבדוק דברים כאלה. גילגמש שיחה 05:49, 10 באוקטובר 2008 (IST)תגובה
אתה יוצא מנקודת הנחה שפופולריות גוררת חשיבות אנציקלופדית. זה כמובן לא נכון. למשל, אם נפתח ערך לאיזה שחקנית פורנו שולית ונצרף אליו המון תמונות שלה מתוך הסרטים שהיא כיכבה בהם, אני מבטיח לך שהערך הזה יהיה מאוד פופולרי. האם זה הופך אותו לחשוב? לירן (שיחה,תרומות) 10:41, 10 באוקטובר 2008 (IST)תגובה

תגובותיי:

לירן - מה שאתה אומר הוא נכון. אבל עדיין, בעוד רובנו לא פותחים ערכים על שחקניות פורנו, אלא מנסים להעשיר את האנושות בידע מתחום כזה או אחר, יהיה מעניין מאד לכל אחד לדעת עד כמה ערכיו מגיעים אל הקורא.
יוני - אני מבין שיש קישור, אבל אין ספק שזו לא הדרך הנוחה. אני ממש מצליח לדמיין טבלה כזו, בדיוק כמו טבלת המעקב, בה ליד כל אחד מהערכים שבחרתי יהיו 3 עמודות - צפיות בשבוע האחרון, צפיות בחודש האחרון, צפיות בשנה האחרונה. זה הרבה יותר הגיוני מאשר שליפה ידנית באתר חיצוני (שפשוט לא תיעשה...).
דני-דאבל-יו - גם איתך אני מסכים, אבל מונה צפיות הוא נתון אמין יותר (אני לא בטוח שאת הערך אפקט זימן הרבה אנשים עורכים, כי זה מלא נוסחאות ופיזיקה ואמאל'ה, אבל אני רוצה לדעת כמה קוראים אותו).
ובאופן כללי - אתם חושבים שיש מישהו שיכול להרים את הכפפה וליצור מנגנון כזה? או שאתם לחלוטין מפקפקים בחשיבות של זה? אני אישית חושב שזה באמת יכול לעזור לעורכים לדעת איפה להשקיע את המאמצים שלהם. "ויקיפדיה מוכוונת קורא". טוסברהינדי (שיחה) 12:03, 10 באוקטובר 2008 (IST)תגובה
טוסברהינדי צודק. אם כותבים ערך מומלץ נפלא, גדוש בידע ותמונות, שמוטל כאבן שאין לה הופכין, שגולשים אליו רק שלשה אנשים כל יום, יש כאן פספוס גדול שצריך לראות איך לתקן אותו, או שאין אליו מספיק קישורים, או שהוא כתוב באופן לא טוב שהקריאה בו קשה ומייגעת, או שהנושא כשלעצמו מסובך וקשה, וצריך למצוא דרך לפשט את התוכן ולעשותו מעניין יותר. מעבר לכך, נראה שזה יכול להיות כלי לקדימויות. אם למשל מגלים שערכים שנצפים מאוד הם קצרמרים ודלי תוכן, אפשר להעלות אותם לקדימות בטיפול, לפני קצרמרים אחרים. אתרים החיצוניים נותנים פילוח לפי חודש, אבל לא לפי שנה ולא לפי סה"כ הגלישות. אכן חסר מנגנון כזה מובנה (שהיה והוסר עקב גרימת האטה לויקיפדיה), ואולי מישהו מהאתרים החיצוניים, יקח זאת לתשומת ליבו לתת צפיות בפילוחים כוללים יותר. --אפי ב. • התחברו לרגשותיכם12:54, 10 באוקטובר 2008 (IST)תגובה
חלק מהטיפול המבוקש כאן ניתן במיזם ביקשתם קיבלתם, שבא להבטיח שערכים מבוקשים מאוד יהיו באיכות טובה. באנציקלופדיה יש מקום גם לערכים פחות פופולריים, כולל כאלה שאליהם מגיעים שלושה קוראים ביום. אנו פועלים לחיזוקו של כל ערך, באמצעות קישורים אליו, שיוכו לקטגוריות ולפורטל, יצירת קטעי "הידעת" ו"היום בהיסטוריה" שמקשרים גם לערכים פחות פופולריים מהעמוד הראשי, וגם הקישור "ערך אקראי", שלפניו כל הערכים שווים בחשיבותם. בפראפרזה על מאמר חז"ל אגיד: אין לך ערך שאין לו שעה - גם ערך שאינו מבוקש כעת יכול להפוך למבוקש עקב אירוע חדשותי כלשהו. יעסוק כל אחד בערכים הקרובים ללבו, גם אם אינם המבוקשים ביותר. דוד שי - שיחה 13:34, 10 באוקטובר 2008 (IST)תגובה
שלושה קוראים ביום זה המון. בעיניי - אם נתתי מענה לקורא אחד בחודש, כבר עשיתי משהו. דרור - שיחה 14:13, 10 באוקטובר 2008 (IST)תגובה
דוד, אני מסכים עם טענותיך העקרוניות לחלוטין. ברור לי ש"פופולריות" היא מדד מורכב, שיש למדוד לאורך זמן ובהתאם לנסיבות. דרור, אני מסכים גם איתך לחלוטין, והלוואי שכל ערך שכתבתי ייקרא פעם בחודש. אבל אני מתעקש להחזיר את הסוגיה דווקא למישור הפרקטי. בואו נניח שרשימה שכזו, שתיתן לכל אחד מדד של הצפיות בערכים שכתב (או בכל ערך אחר שהוא מעוניין לדעת מה הצפיות שלו), תתרום לוויקיפדיה. אני אישית חושב שהיא תתרום, ותעזור לכותבים. אני משער שגם אתם לא מתנגדים לרשימה שכזו באופן עקרוני ונחרץ (עובדה שיש לנו את ויקיפדיה:נתונים סטטיסטיים). השאלה היא - האם ניתן לייצר רשימה אישית כזאת? טוסברהינדי (שיחה) 14:42, 10 באוקטובר 2008 (IST)תגובה
לא. ‏Yonidebest Ω Talk17:12, 10 באוקטובר 2008 (IST)תגובה
החלטי. טוב. חבל. אני עדיין חושב שזה רעיון מצויין. :-) טוסברהינדי (שיחה) 18:54, 10 באוקטובר 2008 (IST)תגובה
לדעתי הרעיון המוצע הוא רעיון טוב אבל לא מתאים לויקיפדיה. אולי לבלוג פרטי של מישהו. אם אני מבין נכון כל הרעיון בויקיפדיה (כמו שטוסברהינדי ציין בעצמו) היא הרחבת הידע הכללי, בלי קשר לפופולריות ואם אני מבין נכון גם את הכלים שהוזכרו לעיל, הם אכן משרתים כבר היום את המטרה של "להבין אם ערך כתוב טוב או לא". Lahavcalev - שיחה 19:02, 10 באוקטובר 2008 (IST)תגובה
לא הבנתי את ההתנגדות העקרונית; זה בסה"כ שפצור של מוני הכניסות לערכים, שכבר קיימים. אביעדוס - שיחה 23:33, 10 באוקטובר 2008 (IST)תגובה
אני יכול בקלות יחסית ליצור מתוך קטגוריה (או רשימת קטגוריות) רשימה של הערכים מסודרים לפי מספר הצפיות בהם (לכל תקופה מינואר 2008 ועד היום), ויצרתי כבר בעבר מספר רשימות כאלו לוויקיפדים שונים על פי בקשותיהם ותחומי העניין שלהם (למשל זו, וזו). אם מישהו מעוניין ברשימה דומה על מנת לדעת היכן "למקד מאמצים" בתחום כלשהו שקרוב לליבו - הוא מוזמן לפנות אלי בדף השיחה שלי - ואני אצור עבורו רשימה.
לגבי רשימה אוטומטית - עד כמה שאני מכיר הקרן נמנעת כיום מעיסוק בסטטיסטיקות, הנתונים הגולמיים שעליהם מבוססות כל סטטיסטיקות הצפייה הקיימות כיום מסופקים אמנם מתוך מחשבי הקרן - אבל מאוכסנים על שרת חיצוני ומתוחזקים באופן "פרטי" על ידי אחד המפתחים, וכל שירותי הסטטיסטיקות (כמו אלו שמופיעים אצלנו, או אלו שמקושרים מדף הגרסאות האחרונות) הן יוזמות פרטיות. בעבר הופעלה סטטיסטיקת צפייה כחלק ממערכת מדיה ויקי (התכונות האלו עדיין קיימות בתוכנה - הן לא מופעות משיקולי עומסים) ולכן, עד שיגיעו ימות המשיח (או לפחות עוד איזה 2,000 שרתים חדשים) אני לא חושב שיש סיכוי שנראה סטטיסטיקות שמופעלות בחלק אינטגרלי מוויקיפדיה. ‏ costello • ‏ שיחה 10:23, 16 באוקטובר 2008 (IST)תגובה

מיון

עריכה

בוטלה אפשרות המיון לפי עמודות? שנילישיחה 13:10, 19 ביוני 2010 (IDT)תגובה

עדכון

עריכה

מדוע אי אפשר לראות באתר את "top list" של המאמרים הנצפים ביותר לשנת 2010? לא חודשי ולא יומי?

כמה גולשים מבקרים בוויקיפדיה העברית מדי חודש?

עריכה

הועבר מהדף ויקיפדיה:דלפק ייעוץ

הסתבכתי קצת עם אתר הסטטיסטיקות של ויקימדיה. למישהו יש מושג? תודה! Ranl-WMIL - שיחה 09:48, 25 ביוני 2017 (IDT)תגובה

  לא ניתן להציג את הגרף באופן זמני –
ההרחבה Graph להצגת תרשימים מושבתת כרגע.

יגאל (בקשת עזרה, IKhitron ושיחה) 12:35, 25 ביוני 2017 (IDT)תגובה
IKhitron זה יוניקים? – אסף (Sokuya)שיחה 12:38, 25 ביוני 2017 (IDT)תגובה
רק בני אדם, אני חושב. יגאל (בקשת עזרה, IKhitron ושיחה) 12:42, 25 ביוני 2017 (IDT)תגובה
מדובר בצפיות של רשומים ואלמונים, כאשר כל רשום וכל כתובת IP נספרים לכל היותר פעם ביום בדף כלשהו (לפחות שה מה שהם מספרים לנו), בניקוי זחלנים של מנועי חיפוש וכן הלאה. הסטטיסטיקה הזו היא למחשבים שולחניים וניידים ביחד (גם אפליקציית נייד, אבל אלו מספרים זניחים). מעניין לא פחות לראות את הסטטיסטיקה ממוינת: [8] - מאז ה-4 ביוני 2017 (כלומר 20 ימים אחרונים), קצת פחות מ-33 מיליוני צפיות, שמתחלקות לכמעט 15 מ' שולחני, כמעט 17 מ' נייד, וכמעט מיליון צפיות דרך האפליקציה. קיפודנחש 21:57, 25 ביוני 2017 (IDT)תגובה
Ranl-WMIL, המערכת החדשה מאפשרת לראות נתונים בנוחות, למשל מספר ההתקנים היחודיים במהלך חודש מאי בוויקיפדיה העברית הוא 4,906,210. באותו חודש מספר הדפים הנצפים היה 51,564,647. אפשר לשחק עם הממשק ולהוציא מגמות של חודשים וחיתוכים שונים. --Itzike - שיחה 10:49, 27 ביוני 2017 (IDT)תגובה

סוף העברה

האתר http://stats.grok.se/ לא נפתח לי

עריכה

האם הוא פעיל? הוא מקושר מדף זה (מספר 3). Uziel302 - שיחה 02:09, 4 באוקטובר 2017 (IDT)תגובה

אם אני כבר פה, "אפשרות לתצוגה לפי אזורים בעולם", הקישור מציג תמונות, ולא עריכות כפי שמשתמע מההקשר. Uziel302 - שיחה 02:12, 4 באוקטובר 2017 (IDT)תגובה
לא פעיל גם לי. יש מקור חלופי לראות מידע על דפים ספציפיים?Theshumai - שיחה 20:22, 30 בינואר 2018 (IST)תגובה

המונה הסטטיסטי

עריכה

הועבר מהדף ויקיפדיה:דלפק ייעוץ

הועבר מהדף ויקיפדיה:מזנון
האם מישהו יודע מה קרה למונה? בחודש שעבר היו לי למעלה מ-2500 ערכים, נכון לחודש מאי. עכשיו, נכון לאוגוסט, יש לי 341... לעומת זאת, לעורכים אחרים יש 15,000 או 12,000 וכדומה. מי הזיז את הערכים שלי ולאן?שלומית קדם - שיחה 21:05, 29 בספטמבר 2017 (IDT)תגובה

כאן יש לך 2658 ערכים (כמות נאה מאוד). דוד שי - שיחה 00:30, 1 באוקטובר 2017 (IDT)תגובה
דוד שי, איפה הסטטיסטיקה שלי? תודה, עורך-בורוכוב - שיחה 00:44, 1 באוקטובר 2017 (IDT)תגובה
כן, תודה על ההפניה. לא הכרתי את הדף הזה. אבל מה בכל זאת קןרה במונה העריכות+ערכים? שם יש בלגן שלם.שלומית קדם - שיחה 07:56, 1 באוקטובר 2017 (IDT)תגובה
כאן יש לך 2547 ערכים ו-יותר מ-36000 עריכות. אמא של גולן - שיחה 10:56, 1 באוקטובר 2017 (IDT)תגובה

(דגים/חכה): בתחתית דף התרומות ("תרומות" מן התפריט העליון כדי למצוא את תרומותיך שלך, ו"תרומות המשתמש" מהתפריט הימני בדף המשתמש של מישהו אחר), מופיעים קישורים למספר מוני עריכות. לפעמים מונה זה או אחר שבור, אבל כמעט תמיד לפחות אחד מהם תקין. קיפודנחש 15:05, 1 באוקטובר 2017 (IDT)תגובה

שלומית קדם, את בטוחה שזה באמת מה שרצית להגיד? יגאל (בקשת עזרה, IKhitron ושיחה) 00:13, 2 באוקטובר 2017 (IDT)תגובה
אולי לגולן יש שתי אמהות. Liad Malone - שיחה 01:20, 2 באוקטובר 2017 (IDT)תגובה
עַל אַחַת כַּמָה וְכַמָּה, אימא כְפוּלָה וּמְכֻפֶּלֶת לַגולן עָלֵינוּ... חזרתישיחה 07:22, 2 באוקטובר 2017 (IDT)תגובה
ט.ל.ח. . תודה לאמא של גולן, לדוד שי ולקיפודנחש .הבְּרוֹך תוקן.שלומית קדם - שיחה 09:13, 2 באוקטובר 2017 (IDT)תגובה

סוף העברה
23:02, 10 בדצמבר 2017 (IST)

הערכים הנצפים ביותר בשנת 2018

עריכה
הועבר מויקיפדיה:מזנון

היי
אנו כבר בפתחו של היום הרביעי של השנה האזרחית החדשה וטרם ראיתי פרסום לגבי רשימת הערכים הנצפים ביותר אצלנו בשנה החולפת. אמנם לא שאלתי את איציק לגבי זה, אולם אני מניח שאם הייתה יוצאת הודעה, לפחות כלי תקשורת אחד היה מפרסם את הנתונים.

בעבר היה לנו מקור טוב לסטטיסטיקות בנושא, אבל לצערי הרב, הוא חדל מלספק מידע בסוף 2015. למיטב זכרוני, ההודעה לעיתונות מלפני שנה, על סיכום 2017, לא התבססה על נתונים מדוייקים ברמת אותו שירות ז"ל, אלא על סיכום רשימות הערכים הנצפים ביותר מדי שבוע באותה שנה. אם כך, האם התחדש משהו ב-2018 ונוסף כלי שיספק את הסיכום המיוחל לגבי קוראי העברית? אם כן, אשמח להוספתו לדף "ויקיפדיה:סטטיסטיקה". ערן, יונה, יגאל ושאר המתעדכנים באופן קבוע בחדשות הטכנולוגיות וכדומה, יצא לכם להתקל במשהו? Ldorfmanשיחה 02:16, 4 בינואר 2019 (IST)תגובה

זה כבר קיים יחד עם כל סטטיסטיקה שתעלה בדעתך.... הנה המובילים:
  • עמוד ראשי
  • מדינות לפי אוכלוסייה, שטח, צפיפות, תמ"ג ופיתוח אנושי
  • ישראל
  • פאודה
  • אירוויזיון 2018
  • הבחירות לרשויות המקומיות בישראל (2018)
  • בנימין נתניהו
  • בית הנייר
  • מונדיאל 2018
  • יוטיוב
  • כפולה
  • בשבילה גיבורים עפים (סדרת טלוויזיה)
  • נועה קירל
  • חוק יסוד: ישראל – מדינת הלאום של העם היהודי
  • ארצות הברית
  • נטע ברזילי
  • כריסטיאנו רונאלדו
  • גביע העולם בכדורגל
  • דרגות צה"ל
  • שבאבניקים (סדרת טלוויזיה)
  • גואל רצון
  • ישראל באירוויזיון

בהנאה! בורה בורה - שיחה 04:33, 4 בינואר 2019 (IST)תגובה

מי בדיוק נכנס ל"מדינות לפי אוכלוסייה, שטח, צפיפות, תמ"ג ופיתוח אנושי"? וגם איך "פורטנייט" לא נכנסה לרשימה? :O יאצקין52 - שיחה 04:39, 5 בינואר 2019 (IST)תגובה
פורטנייט, 143 אלף צפיות. בדיוק מתחת לדולנד טראמפ. קישור לחיץ יאצקין52 - שיחה 04:51, 5 בינואר 2019 (IST)תגובה
מדינות לפי אוכלוסייה, שטח, צפיפות, תמ"ג ופיתוח אנושי היא הערך אליו גוגל מפנה כשמחפשים תמ"ג של מדינה. חיפוש די הגיוני למי שמנסה להשוות את העושר של מדינה מסוימת מול אחרת. בברכה, מלא כל הארץ כבודישלח הודעה ל-013-28143 • כ"ט בטבת ה'תשע"ט • 21:18, 5 בינואר 2019 (IST)תגובה
זה אמנם הערך הכי נצפה, אך מבירור מסתבר שרוב הכניסות מגיעות מדסקטופ\זחלנים מה שמראה שכנראה יש שירותים שמשתמשים בעמוד לסריקת נתונים. אלה לא באמת צפיות אמיתיות ולכן כדאי להתעלם מהצפיות בערך הזה. אנחנו נפרסם הודעה לעיתונות בנושא מחר. Ldorfman, פרסמתי בשנה שעברה את רשימת הנצפים ביותר Itzike - שיחה 21:21, 6 בינואר 2019 (IST)תגובה
תודה רבה, בורה.   שימחת אותי מאוד.
איציק, לא טענתי שלא יצאה הודעה לעיתונות בשנה שעברה. ציינתי רק שהיית צריך להתאמץ וששיטת הבדיקה אז הייתה פחות מדוייקת, מכיוון שלא היה לנו את הכלי המדוייק שהובא כעת. נקווה שבניגוד לקודמים, הוא יחזיק מעמד באוויר לשנים רבות. Ldorfmanשיחה 01:18, 7 בינואר 2019 (IST)תגובה
בורה,Ldorfman, בעקבות דיון שניהלנו בצוות התקשורת, הקרן הוסיפה בכלי הרשמי של הסטטיסטיקה יכולת לראות את הנתונים בראייה שנתית, כולל ההסרה של ערכים "חשודים" כפי שציינתי. ראו פה Itzike (שיחה | תרומות | מונה) לא חתם 00:00, 10 בינואר 2000 (IST)תגובה
אני לא יודע מי הם "דסקטופ\זחלנים", אבל אם אפשר לזהות אותם, והם מעוותים את התמונה בנוגע לראשון ברשימה, מדוע לא להניח שהם מעוותים אותה גם בהמשך הרשימה?! הדרך הנכונה היא לספור בלעדיהם. עוזי ו. - שיחה 15:56, 7 בינואר 2019 (IST)תגובה
בעיני הנתון המדהים ביותר הוא אחוז הצפיה בניידים. כ-70% מהצפיות הן מניידים ואנו עוד ממשיכים לערוך ולעצב את האתר ממסכי מחשב... בורה בורה - שיחה 16:57, 7 בינואר 2019 (IST)תגובה
אכן, ועדיין אין גישה לקטגוריות לניידים. Ranbarשיחהבואו לתיאטרון - תהנו מהמזגן 17:17, 7 בינואר 2019 (IST)תגובה
מעולה! תודה, עוזי. Ldorfmanשיחה 16:52, 10 בינואר 2019 (IST)תגובה
(לא עוזי אלא איציק ששכח לחתום). ראובן מ. - שיחה 17:36, 11 בינואר 2019 (IST)תגובה
חזרה לדף המיזם "נתונים סטטיסטיים".