logo50
המרכז לחקר חדשנות בטכנולוגיות למידה מזמין אתכם.ן לסמינר מחקר

בינה מלאכותית בהערכה:
יישומים, מגבלות, ומניעת הונאות

  
מרצים: ד"ר גיורא אלכסנדרון, ד"ר אלונה סטרוגצקי פקטור, אביגייל גורין-שלייפר
המחלקה להוראת המדעים, מכון ויצמן למדע
Inovation-1
יום שני, כ"ז בטבת תשפ"ה, 27 בינואר 2025, בשעה 14:00
ההרצאה תשודר ב-ZOOM
תקציר
הבינה המלאכותית מעצבת מחדש את תחום החינוך, הן ככלי בידי התלמידים והן כאמצעי להערכה וניתוח תשובותיהם. בהרצאה זו נדון בשני יישומים מרכזיים: שימוש במודלי שפה גדולים (LLMs) לצורכי הערכה ומשוב מותאם אישית בתשובות פתוחות של תלמידים, והיישום של שיטות הערכה, בפרט תיאוריית התגובה לפריט (IRT) לזיהוי שימוש התלמידים במודלים אלו במתן מענה בשאלות רב-ברירה (MCQs).

כאשר LLMs משמשים לניתוח תשובות ולמתן משוב לתלמידים, מתגלה הטיה ביכולתם להבחין בין סוגי טעויות בתשובות שגויות. בעוד שמודלי השפה מצליחים לזהות תשובות נכונות בצורה סבירה, הם מתקשים להבדיל בין פרופילי ידע שונים בתשובות הלא נכונות, הנוטות להיות שונות זו מזו יותר מאשר התשובות הנכונות. קראנו לתופעה זו ״אנה קרנינה של השאלות הפתוחות״, באנלוגיה למשפט הפתיחה המפורסם: "כל המשפחות המאושרות דומות זו לזו, אך המשפחות האומללות - אומללות כל אחת בדרכה". מגבלה זו עלולה להשפיע על הדיוק וההוגנות של מערכות הערכה ממוחשבות, ויש להתייחס להטיה זו במהלך פיתוחן.

מהצד האחר – האם ניתן לזהות שימוש של תלמידים במודלי שפה כדי לענות על שאלות? ובפרט – האם תיאוריות למידה יכולות לסייע בכך? ההנחה שלנו היא שבינה מלאכותית ואנושית יציגו דפוסי תגובה שונים לסדרות של פריטי הערכה MCQ, כיוון שהבינה המלאכותית מושפעת בצורה שונה מלומדים אנושיים בממדים שונים של הבעיות שמציגים הפריטים. לכן, מענה הבינה המלאכותית למבחן ייראה כסטיות מהדפוסים הצפויים של תגובות אנושיות. כדי למדל את הסטיות האלו אנו משתמשים בכלים פסיכומטריים מתחום ה-Item Response Theory  שהוכחו כיעילים לזיהוי הונאות, ומראים שכלים אלו יכולים אכן להבחין בין רצפים של מענים אנושיים לרצפים של מענים שהופקו על ידי גרסאות הפרמיום של שלושת מודלי השפה המובילים – קלוד, ג'מיני ו-ChatGPT 4.
Giora Alexandron: 
Dr. Giora Alexandron is a senior scientist (assistant professor) in the Department of Science Teaching, at the Weizmann Institute of Science, and the PI of the Computational Approaches to Science Education (CASEd) research group. His research centers on AI in education and learning analytics. Giora serves as associate editor of the International Journal of Artificial Intelligence in Education and is the program chair of the 2025 International Conference of Educational Data Mining.
 

Alona Strugatski-Faktor:
Dr. Alona Strugatski-Faktor is a postdoctoral fellow at the Weizmann Institute of Science. Alona's research focuses on cognitive capabilities of AI models and visual scene understanding. She is specifically interested in combining human cognitive research with state-of-the-art AI models. Alona holds a BSc in physics and electrical engineering from the Technion, an MSc in electrical engineering from Tel Aviv University and a PhD in mathematics and computer science from the Weizmann Institute of Science.
 

Abigail Gurin Schleifer:
Abigail Gurin Schleifer is a PhD student at the Weizmann Institute of Science. Abigail’s research focuses on aligning AI with science education and analyzing and closing gaps between Hebrew LLMs and educator assessment. Abigail’s main interest lies in combining computational AI-based models with pedagogically meaningful assessment to support effective personalized student learning. She holds a BSc and MSc in mathematics from the Hebrew University of Jerusalem. Her MSc thesis was in the domain of differential topology.
 

Acknowledgement:
This research is supported by the Israeli Science Foundation, The Ministry of Innovation, Science and Technology, and the Weizmann Institute for Artificial Intelligence. We thank the National Institute for Testing & Evaluation for providing access to psychometric exam data.
zoom-logo1
להצטרפות לרשימת התפוצה של המרכז לחקר חדשנות בטכנולוגיות למידה innovation@openu.ac.il
אם נחוץ הסדר הנגשה, יש לפנות לדוא"ל events_nagish@openu.ac.il עד 10 ימי עבודה לפני מועד האירוע

Powered by Publicators