השימוש בבינה מלאכותית בחינוך הולך וצומח, ואיתו החשש מהיכולת לרמות במבחנים ועבודות באמצעות טכנולוגיות מסוג זה. ChatGPT, מערכת עיבוד שפה טבעית (NLP), היא דוגמה לשימוש בבינה מלאכותית שנועדה לקדם את דרכי הלמידה והגישה למקורות מידע. ואולם, היכולת שלה ושל מערכות בינה מלאכותית אחרות לספק תשובות במהלך שיחה מביאה לדאגה מהאפשרות שישתמשו בה כדי לרמות.
את פסקת הפתיחה הזו לא כתב אדם, אלא התוכנה עצמה. בשבועות האחרונים היא הנושא החם ביותר בעולם האקדמיה. באוניברסיטאות ברחבי העולם התכנסו דיוני חירום שעוסקים בהשלכות של השקת ChatGPT לקהל הרחב. "קבוצת הוואטסאפ של חברי הסגל שלנו הומה דיונים בנושא. מאוד ברור שזאת טכנולוגיה שמשנה את כללי המשחק", מספר פרופ' ערן טוך, ראש התוכנית לתואר ראשון להנדסת תעשייה וניהול באוניברסיטת תל אביב.
התוכנה, שבנויה כצ'אט אינטרנטי, פתוחה בשלב זה לשימוש חופשי. צריך רק להירשם לאתר, לסמן וי לצד המשפט "אני לא רובוט" - ואתה בפנים. אפשר לנסות לנהל איתה שיחת חולין, אבל הפוטנציאל העיקרי שלה הוא להיות כלי עבודה יעיל במיוחד, כזה שיכול לייתר מקצועות רבים.
כמעט כל שאלה שתופנה אליה תקבל תשובה: החל מנושאים לימודיים כמו איך עובדים תהליכים בגוף האדם ושלבי מלחמת העולם הראשונה, ועד לשאלות הרות גורל כמו מהן הערים היפות בעולם, והאם גברים ונשים יכולים להיות חברים בלבד. אפשר גם לבקש ממנה לכתוב שיר ראפ או סיפור מדע בדיוני, או להשתמש בה לזיהוי בעיות בקוד. אחת הדוגמאות שנותנת התוכנה לשאלה שתציג את יכולותיה היא "יש לך רעיונות יצירתיים ליום הולדת עשר?".
מאחורי הצ'אטבוט עומדת חברת AI, שבין מייסדיה נמצא אילון מאסק. החברה שכשמה עוסקת בבינה מלאכותית זכתה לאחרונה לפרסום גם דרך תוכנת DALLE-E שיוצרת מטקסט דימויים ויזואליים. כדי להביא את הצ'אטבוט לרמה הנוכחית, החברה העבירה אותו "אימונים" ממושכים שכללו שני סוגים של למידה. הראשון היה למידת חיזוק, בה המתרגלים תגמלו את התוכנה על תשובות טובות דרך דירוג גבוה, ולימדו אותה לתעדף תשובות שיזכו לדירוג גבוה. השני היה למידה מונחית - פתרון בעיות על בסיס פתרונות קודמים. כשהרגישו שהוא מוכן, שחררו אותו לשוק.
לא חלף שבוע עד שהצטרפו אליה יותר ממיליון משתמשים. הסטודנטים קפצו גם הם על המציאה. הפתקים בקלמר, הסיכומים בשירותים והעברת העבודות מדור לדור הפכו ברגע לנחלת העבר - עכשיו הכי קל לרמות עם צ'אטבוט. "מצאתי את עצמי נכנס לתוכנה תוך כדי הרצאות ומחפש שם את החומר. היא מסכמת יותר טוב מהמרצים", סיפר סטודנט למדעי המחשב. "אני מכיר סטודנט שלא ידע שפת קוד מסוימת ולא היה לו כוח ללמוד אותה, אז פשוט כתב בשפה שהוא מכיר וביקש ממנה לתרגם לשפה הנדרשת. אחד השימושים היעילים שלה הוא לזהות בעיות בקוד שכתבת".
"אנחנו מתחילים להשתמש בזה בעצמנו", מודה טוך. "פרופסורים כותבים חוות דעת על מחקרים אחרים וזה תופס חלק עצום מהזמן שלנו. בדרך כלל חוות הדעת מתחילה בתיאור של במה המאמר עוסק. את החלק הזה הצ'אטג'יפיטי עושה בכלל לא רע. אם אנחנו משתמשים בזה אז ודאי שגם סטודנטים".
הסוד לא נשאר בין כותלי המוסדות להשכלה גבוהה. מאז השקת התוכנה הטיקטוק כמרקחה. סרטונים על סרטונים עולים שעוסקים בצ'אט בוט עולים לרשת החברתית וזוכים להמוני לייקים ותגובות. חלקם מלמדים איך להיעזר בה בצורה היעילה ביותר, מראים איך היא מסכמת את החומר ולאיזה שאלות היא עונה הכי טוב. אחרים פשוט מציגים את תשובותיה לשאלות מצחיקות או פניני חוכמה כמו חמישה משפטים על איך זה להתעשר. בני הנוער שומעים את העצות ומנסים ליישם בעצמם.
ההשפעות עשויות להיות מרחיקות לכת. המורים והמרצים התרגלו להסתפק בשאלות גנריות, מובנות מאליהן, לעתים קרובות כאלה שהופיעו בעבודות קודמות. כעת, תלמידים וסטודנטים יוכלו להחזיר עבודה כזו במאמץ של כמה קליקים בטלפון ולקבל ציון מספק. מערכת החינוך העולמית תצטרך להפעיל את היצירתיות שלה - ולדרוש אותו דבר מהצד השני. "כיום, כל הלמידה, גם ביסודי, גם בתיכון וגם באוניברסיטה, הולכת לכיוון של סטנדרטיזציה. אבל הבינה המלאכותית יודעת לחשוב בדיוק ככה ושמה גבול לסטנדרטיזציה", אומר טוך.
יהיו לכך גם השלכות תקציביות. "ההוצאה הכספית תעלה. אי אפשר יהיה לקחת מתרגל שיבדוק הכול, או לקחת שאלון רב-בררה, להכניס לאקסל ושייבדק אוטומטית. השיטות הקלאסיות של עבודות אקדמיות הופכות לפחות יעילות. הרעיון של סטודנט שכותב עבודה, מצחצח פסקאות ומקבל ציון הולך להשתנות".
אז האם נגמרו ימי החיפושים הקדחתניים וההצלבות בין ספרים, סיכומים וגוגל? התשובה היא כנראה עדיין לא. על פניו, הטקסט שמספקת התוכנה נראה הגיונית. המשפטים תקינים, החיבור בין הפסקאות קוהרנטי ושגיאות כתיב לעולם לא יקרו. קשה להבדיל בינה לבין ניסוח של בן אדם, אם הוא בעצמו יודע לכתוב. הדיוק בתוכן הוא כבר סיפור אחר. כל עוד המידע שעליה לספק נמצא באינטרנט בצורה מסודרת, או שהוא טכני כמו כתיבת קוד, התוצאה תהיה מספקת. אך משימה מורכבת יותר לעתים תוביל לטקסטים לא הגיוניים שרק מרגישים כמו תשובה נכונה. עניין נוסף ופתיר יותר הוא שהיא מבוססת על אירועים שהתרחשו עד 2021, כך שלאתגר אותה בחדשות העדכניות לא יעבוד.
"יש בעיה מהותית בפלט שלא הולכת להיפתר", מבהיר פרופ' טוך. "האלגוריתם מסכם את האינטרנט ובמקום תוצאות חיפוש יוצר טקסט חדש. המשמעות היא שאם זה לא באינטרנט זה לא קיים, הוא לא ממציא דברים בעצמו. לפעמים הטקסטים גם מוזרים. הם יכולים לכלול מספרים ספציפיים כי נכתבו בדף אחד באינטרנט. או שהם נורא כלליים ולא מעניינים, או ספציפיים מדי ודורשים הרבה עריכה. עד שתוכל לענות על שאלות בצורה אמינה היא תצטרך לעבור עוד כמה גלגולים".
הסטודנט למדעי המחשב מזדהה עם דבריו. "עשיתי ניסוי: שלחתי לצ'אט מטלה של חמישה עמודים כדי לראות איך הוא עונה. גיליתי שאי אפשר לסמוך עליו 'על עיוור'. "זה עדיין כמו גוגל טרנסלייט - עושה 80% מהעבודה נכון ו-20% שטויות שצריך לתקן".