Classification Guide for Human Language Technology Models 2-20
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט טכנולוגיית השפה האנושית של ה-NSA. הוא מפרט את רמות הסיווג עבור מודלים שונים של ניתוח שפה אנושית, כולל זיהוי דוברים, זיהוי מגדר וזיהוי חריגות, בין היתר.
תקציר
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט טכנולוגיית השפה האנושית של ה-NSA. הוא מפרט את רמות הסיווג עבור מודלים שונים של ניתוח שפה אנושית, כולל זיהוי דוברים, זיהוי מגדר וזיהוי חריגות, בין היתר.
פרטי המסמך
יוצר: National Security Agency - Human Language Technology Research
מפרסם: The Intercept
תאריך יצירה: 2011-05-18
תאריך הדלפה: 2015-05-05
סיווג: Unclassified
תוכניות מעקב: SIGINT
תיאור מקורי (אנגלית)
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט טכנולוגיית שפה אנושית של ה-NSA. הוא מפרט את רמות הסיווג עבור המודלים השונים של ניתוח שפה אנושית, הכוללים בין היתר זיהוי דוברים, זיהוי מגדר וזיהוי חריגות.
תרגום לעברית
TOP SECRET//SI//NOFORN
מדריך סיווג: Human Language Technology (HLT)
1. סקירה כללית
מסמך זה קובע את סיווג המידע הקשור ליכולות, למחקר ולתוצרים של פרויקט ה-Human Language Technology (HLT) בתוך ה-NSA. הנחיות אלו חלות על כלל המפתחים, האנליסטים והשותפים העובדים על טכנולוגיות ניתוח שפה.
2. רמות סיווג עבור מודלים של HLT
| יכולת / מודל | רמת סיווג | הערות |
|---|---|---|
| Speaker Identification (זיהוי דוברים) | TOP SECRET | חשיפה של יכולת שיוך קול למטרה ספציפית בתוך רשתות תקשורת. |
| Gender Identification (זיהוי מגדר) | SECRET | סיווג אוטומטי של תעבורת קול על בסיס מאפיינים מגדריים. |
| Language Identification (זיהוי שפה) | CONFIDENTIAL | היכולת להבחין בין דיאלקטים ושפה מדוברת בזמן אמת. |
| Anomaly Detection (זיהוי חריגות) | TOP SECRET//SI | שימוש באלגוריתמים לזיהוי דפוסי דיבור חריגים העשויים להעיד על הונאה או על ניסיונות הטעיה. |
3. קווים מנחים ליישום
- מודלים של Machine Learning: ארכיטקטורת המודל (כגון
Neural Networks) עשויה להיות UNCLASSIFIED, אך משקולות המודל (Weights) שאומנו על נתוני סיגינט (SIGINT) מסווגות כ-TOP SECRET. - מקורות נתונים: כל קשר בין מודל HLT לבין מקור נתונים ספציפי של ה-NSA או ה-GCHQ מעלה את רמת הסיווג באופן מיידי ל-TOP SECRET//SI.
- ביצועים: נתונים המצביעים על אחוזי הצלחה (Accuracy) או שיעורי שגיאה (Error Rates) של המערכות מול יעדי מודיעין נחשבים למידע רגיש ביותר.
4. שיתוף פעולה עם שותפי Five Eyes
שיתוף מודלים וטכנולוגיות עם GCHQ, CSE, ASIS, ו-GCSB כפוף להנחיות ה-Signals Intelligence Security Policy. אין להעביר מודלים לזיהוי חריגות ללא אישור מפורש מראש הפרויקט.
דרוג מסמך זה: TOP SECRET//COMINT//REL TO USA, FVEY





