דיוויד סילבר הוא מהדמויות המשפיעות ביותר בעולם הבינה המלאכותית המודרנית. כמי שעומד בראש קבוצת המחקר ללמידה מחוזקת (Reinforcement Learning) ב-DeepMind, סילבר הוביל את הפיתוחים ששינו את תפיסתנו לגבי היכולות של מכונות: החל מ-AlphaGo, התוכנה שהביסה את אלוף העולם במשחק הלוח המורכב "גו", ועד ל-AlphaZero, מערכת גנרית שהצליחה ללמד את עצמה שחמט ומשחקים נוספים ברמת-על תוך שעות ספורות בלבד, מבלי להסתמך על ידע אנושי מוקדם. בשיחה המרתקת עם לקס פרידמן, סילבר צולל אל מאחורי הקלעים של פריצות הדרך הללו. הוא מסביר כיצד שילוב של רשתות נוירונים עמוקות עם אלגוריתמים של למידה מחוזקת מאפשר לסוכנים ממוחשבים לקבל החלטות אופטימליות בסביבות מורכבות. המהפכה של AlphaGo לא הייתה רק ניצחון במשחק; היא הוכיחה כי בינה מלאכותית מסוגלת להפגין "אינטואיציה" ויצירתיות, כפי שניתן היה לראות ב"מהלך 37" המפורסם שזעזע את עולם הגו והותיר גם את המומחים הגדולים ביותר פעורי פה. מעבר לצד הטכני, הפרק עוסק בשאלות המהותיות של עתיד האינטליגנציה. סילבר משתף את חזונו לגבי "השערת הלמידה המחוזקת" (Reward is Enough) – הרעיון המרתק לפיו ניתן להשיג בינה מלאכותית כללית (AGI) פשוט על ידי הגדרת יעדים ותגמולים נכונים, ללא צורך בתכנות מפורש של חוקי העולם. זהו מסע מרהיב אל תוך המנגנונים המאפשרים למחשבים ללמוד מהתנסות, לטעות, ולהשתפר עד לרמה שהיא מעבר להשגת ידו של המוח האנושי. בין אם אתם חוקרי נתונים, חובבי טכנולוגיה או פשוט סקרנים לגבי העתיד שבו מכונות לומדות לחשוב, הפרק הזה מציע מבט נדיר וחד אל תוך אחד המוחות המבריקים בתחום. סילבר ופרידמן דנים בהשלכות האתיות של הטכנולוגיה, במגבלות הנוכחיות של ה-AI, ובדרך הארוכה שעוד נותרה עד ליצירת מכונה שתבין את העולם באותה עומק ומורכבות כמונו.
David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning | Lex Fridman Podcast #86
David Silver leads the reinforcement learning research group at DeepMind and was lead researcher on AlphaGo, AlphaZero and ...
לסרטון זה אין כתוביות זמינות ביוטיוב.
ניתן ליצור תמלול מקורב באמצעות AI על בסיס פרטי הסרטון.




















אנו משתמשים בעוגיות לשיפור החוויה שלך
למידע נוסף ראו את מדיניות הפרטיות