Skip to main content

    David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning | Lex Fridman Podcast #86

    4/19/2026 Lex Fridman - Physics & Consciousness🇮🇱 Subtitled

    Description

    David Silver leads the reinforcement learning research group at DeepMind and was lead researcher on AlphaGo, AlphaZero and ...

    Original title

    דיוויד סילבר: AlphaGo, AlphaZero ולמידה מחוזקת עמוקה | הפודקאסט של לקס פרידמן #86

    מפגש מרתק זה צולל אל עומק פריצות הדרך המשמעותיות ביותר בתחום ה-Artificial Intelligence, דרך עבודתו של David Silver, המדען המוביל את קבוצת המחקר של Reinforcement Learning בחברת DeepMind. השיחה מתמקדת בפיתוחן של מערכות ששינו את פני המחשוב והצליחו לנצח את אלופי העולם האנושיים במשחקים המורכבים ביותר שנוצרו אי פעם. המסע הטכנולוגי מתחיל בסיפורה של AlphaGo, התוכנה שהדהימה את העולם כאשר גברה על Lee Sedol במשחק הלוח האסטרטגי Go, הישג שנחשב בעבר לרחוק עשורים מהשגה. ההיסטוריה של מחקרי DeepMind נפרשת דרך אבני דרך מרכזיות, החל מהאימונים הראשוניים על משחקי Atari ועד ליצירת אלגוריתמים המסוגלים ללמד את עצמם מאפס, ללא צורך בידע אנושי מוקדם או בהדרכה חיצונית. במרכז הדיון עומדים ההבדלים הטכניים בין AlphaGo לבין AlphaZero, והאופן שבו Deep Reinforcement Learning מאפשר למכונה להשתפר מתוך התנסות וטעייה. Silver מסביר כיצד ארכיטקטורות של Neural Networks משתלבות עם חיפוש עץ מונטה קרלו (MCTS) כדי ליצור אסטרטגיות יצירתיות ובלתי צפויות, אשר מאתגרות את תפיסת האינטליגנציה האנושית והמכונה כאחד. השלכות המחקר חורגות הרבה מעבר לעולם המשחקים, ומעלות שאלות פילוסופיות ומדעיות על עתיד ה-General Intelligence והיכולת של בינה מלאכותית לפתור בעיות מורכבות בעולם האמיתי. השילוב בין מדע מדויק לשאיפה אינטלקטואלית חושף כיצד הבנת הלמידה של המכונה עשויה, בסופו של דבר, לשפוך אור חדש על האופן שבו המוח האנושי פועל ומעבד מידע בסביבות משתנות.

    תמלול הסרטון

    לסרטון זה אין כתוביות זמינות ביוטיוב.

    ניתן ליצור תמלול מקורב באמצעות AI על בסיס פרטי הסרטון.

    Related Videos

    Cookies & Privacy 🍪

    We use cookies to improve your experience

    For more information, see our Privacy Policy