מקצוע מידע על מקצוע : ניסוי ומיצוי במערכות לומדות - 048843

048843 - ניסוי ומיצוי במערכות לומדות
נקודות
זיכוי
2.0
 
ניתן
בסמסטר
ב
 
עבודת
בית
פרויקט
או סמינר
מעבדה תרגול הרצאה  
        2 שעות
שבועיות

קביעת הציון עפ"י מעקב במשך הסמסטר והגשת עבודת גמר.


  044202 אותות אקראיים       מקצועות קדם


סוכנים אוטונומיים הפועלים בסביבה מורכבת נדרשים לתפקד תחת תנאים מאתגרים של אי-וודאות, הנובעים ממידע חלקי, רועש ומושהה, מאי-ידיעת מודל העולם, מכשלי מערכת וצווארי בקבוק בתקשורת. גישה אפשרית לצורך התמודדות עם בעיות אלה משלבת ניסוי ( exploration )ומיצוי ( exploitation ). באופן גס, מיצוי מאופיין ע"י ניצול ידע קודם שנאגר תוך כדי פעילות כדי לקדם מטרה רצויה, בעוד ניסוי מתמקד בחיפוש אופני-פעולה חדשים בעלי פוטנציאל רווח עתידי. האיזון המיטבי בין ניסוי למיצוי תופס מקום בסיסי בתחומי הבקרה האופטימלית ולמידה ע"י חיזוקים מאז שנות הששים המוקדמות, עם חשיבות גדלה והולכת בשנים האחרונות. למרות זאת, מלבד במקרים מוגבלים, קיימת הבנה חלקית על איזון מושכל ושיטתי בין ניסוי ומיצוי. בקורס זה נתאר את האיזון בין ניסוי למיצוי במגוון מערכות לומדות, מתוך ניסיון לחלץ עקרונות פעולה כלליים, ולפתוח פתח לתכנון מושכל של איזון זה בבעיות מאתגרות בלמידת מכונה.

תוצאות למידה
הבנת האיזון הנדרש בין ניסוי למיצוי במערכות לומדות, שליטה בתאוריה הבסיסית במערכות לומדות פשוטות, יכולת לתכנן איזון מושכל בין ניסוי למיצוי במערכות מורכבות יותר, קריאת הספרות השוטפת.




מערכת שעות לסמסטרים
סמסטר קודם מידע סמסטריאלי לסמסטר 02/2021 , 2021/2022 אביב תשפ"ב


ספרי לימוד
שנת הוצאה מוציא לאור מחברים ספר
1997 wiley gerhart and kurschner calls embryos and evolution
1998 mit press sutton and barto reinforcement learning
2011 world scientific auger and doerr theory of randomized search heuristics

נערך בתאריך 06/10/2022 בשעה 12:53:17