Skip to main content
    🛰️NSA Programs

    Dealing with a "Tsunami" of Intercept

    מסמך זה הוא מאמר מניוזלטר פנימי של ה-NSA, SIDtoday. המאמר, שמקורו בחטיבת טכנולוגיות שפה אנושית של ה-NSA, דן בעתיד טכנולוגיות השפה האנושית (HLT) ככלי עזר באיסוף נתונים בכמויות גדולות. נדונות בו שתי תוכניות SIGINT מרכזיות, TURBULENCE ו-TURMOIL, וכן אופי הנתונים הנאספים.

    ~3 min readMay 7, 2026 · 05:13 AM
    Listen to article
    Speed1.0x

    תקציר

    מסמך זה הוא מאמר מניוזלטר פנימי של ה-NSA, SIDtoday. המאמר, שמקורו בחטיבת טכנולוגיות שפה אנושית של ה-NSA, דן בעתיד טכנולוגיות השפה האנושית (HLT) ככלי עזר באיסוף נתונים בכמויות גדולות. נדונות בו שתי תוכניות SIGINT מרכזיות, TURBULENCE ו-TURMOIL, וכן אופי הנתונים הנאספים.

    פרטי המסמך

    יוצר: National Security Agency - Human Language Technology Research

    מפרסם: The Intercept

    תאריך יצירה: 2006-08-29

    תאריך הדלפה: 2015-05-05

    סיווג: TOP SECRET

    תוכניות מעקב: SIGINT Enabling Project

    תיאור מקורי (אנגלית)

    This document is an article from an internal NSA newsletter called SIDtoday. The article, which originated in the NSA's Human Language Technology division, discusses the future of Human Language Technology (HLT) as a tool for big data collection. The article reviews two key SIGINT programs, TURBULENCE and TURMOIL, as well as the nature of the collected data.

    תרגום לעברית

    (U//FOUO) צונאמי של נתונים: טכנולוגיית שפה אנושית (HLT) בעידן ה-Bulk

    (U//FOUO) כפי שרבים מכם יודעים, המשימה שלנו נמצאת תחת מתקפה מתמדת של נפחי נתונים עצומים. הזרם הבלתי פוסק של תקשורת דיגיטלית מהווה אתגר חסר תקדים עבור ה-NSA. כדי להתמודד עם זה, חטיבת Human Language Technology (HLT) בוחנת מחדש את הדרכים שבהן כלים טכנולוגיים יכולים לסייע לאנליסטים לנווט בתוך ה"צונאמי" הזה.

    (U) האיסוף בנפח גדול (Bulk Data) ותוכניות ה-SIGINT

    (U//FOUO) כיום, עיקר המאמצים שלנו מתרכזים סביב ארכיטקטורת המערכות המודרנית. שתי תוכניות מרכזיות מהוות את עמוד השדרה של יכולות ה-SIGINT שלנו:

    • TURBULENCE: מערכת המעבדת את התעבורה בזמן אמת ומאפשרת לנו להתמודד עם המורכבות של רשתות הדור הבא.
    • TURMOIL: רכיב הפסיבי של TURBULENCE, האמון על סינון ואיסוף נתונים בנפחים גדולים (Bulk).

    (U//FOUO) האתגר בנתוני Bulk הוא שהם "רועשים" מטבעם. הם כוללים הכל – החל מתכתובות דוא"ל רלוונטיות ועד לתעבורת אינטרנט שגרתית וחסרת ערך מודיעיני. כאן נכנסת לתמונה ה-HLT.

    (U) תפקיד ה-HLT בעיבוד המידע

    (U//FOUO) המטרה של שילוב טכנולוגיית שפה במערכות כמו TURMOIL היא לא להחליף את המתרגם או האנליסט האנושי, אלא לשמש כ"מכפיל כוח". אנו מתמקדים במספר תחומים טכנולוגיים מרכזיים:

    1. זיהוי שפה אוטומטי (Language ID): זיהוי מיידי של השפה שבה נכתב או נאמר הטקסט כדי לנתב אותו לאנליסט המתאים.
    2. תמלול דיבור (Speech-to-Text): הפיכת קבצי קול לטקסט הניתן לחיפוש בקנה מידה רחב.
    3. תרגום מכונה (Machine Translation): מתן תרגום ראשוני ומהיר המאפשר לאנליסטים להבין את "רוח הדברים" לפני שהם מחליטים אם להעמיק בחומר.

    (U) מבט לעתיד

    (U//FOUO) בעודנו ממשיכים לפתח את יכולות ה-TURBULENCE, חטיבת ה-HLT פועלת להעביר את הכלים הללו לקצה (The Edge). המשמעות היא עיבוד השפה כבר בשלב האיסוף הראשוני, מה שיאפשר לנו לצמצם את העומס על מאגרי הנתונים ולהבטיח שרק המידע בעל הערך הגבוה ביותר יגיע לשולחנו של האנליסט.

    (U//FOUO) בעידן שבו הנתונים הם אינסופיים, טכנולוגיית השפה האנושית היא כבר לא מותרות – היא כלי קריטי להישרדות המודיעינית שלנו.

    קישור למאמר המקורי

    http://wayback.archive-it.org/5840/20150723204820/http://firstlook.org/theintercept/2015/05/05/nsa-speech-recognition-snowden-searchable-text/#/

    ארכיון

    Snowden Digital Surveillance Archive

    More videos in NSA Programs

    View category

    More articles you might enjoy

    Back to all articles
    🛰️
    🛰️ NSA Programs

    Fielded Capability: End-to-End VPN

    מסמך זה הוא מצגת הסוקרת בפירוט את היכולות והמגבלות של תוכנית GCHQ VPN SPIN 9 - תוכנית לפענוח VPN. המסמך מראה כיצד שירות ה-VPN מחובר לתוכניות SIGINT אחרות, ממפה מספר זרימות נתונים של עיבוד, ומספק רקע על רבות מהתוכניות המוזכרות בסוף.

    3 min read5/7/2026
    🛰️
    🛰️ NSA Programs

    Serendipity Briefing Slides

    מסמך זה הוא קטע ממצגת של ה-NSA. הוא מתאר את SERENDIPITY, שנראה כמאמץ של ה-NSA למקד את מיקרוסופט עבור תוכניות מקורות SIGINT דומות שהשפיעו על גוגל ויאהו. שקפים אלה מציגים מאמצים ליירט תקשורת מחשבונות דוא"ל של Hotmail ותקשורת מ-Windows Live Messenger.

    3 min read5/7/2026
    🛰️
    🛰️ NSA Programs

    XKEYSCORE, Cipher Detection, and You!

    מסמך זה הוא מצגת פנימית שהוכנה על ידי קבוצת המחקר למתמטיקה (MRG) של ה-NSA. הוא מתאר את המבנה, התכונות ודוגמאות השימוש בכלי ניתוח הנתונים XKEYSCORE. המצגת מתארת גם את הקשרים של XKEYSCORE למאגרי נתונים אחרים של ה-NSA כגון MARINA, PINWALE, PRESSUREWAVE ו-TRAFFICTHIEF.

    3 min read5/7/2026

    Cookies & Privacy 🍪

    We use cookies to improve your experience

    For more information, see our Privacy Policy