Classification Guide for Human Language Technology Models 2-20
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט טכנולוגיית השפה האנושית של ה-NSA. הוא מפרט את רמות הסיווג עבור מודלים שונים של ניתוח שפה אנושית, כולל זיהוי דוברים, זיהוי מגדר וזיהוי חריגות. המדריך מסייע לקבוע את רמת הסודיות של נתונים וניתוחים בתחום זה.
תקציר
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט טכנולוגיית השפה האנושית של ה-NSA. הוא מפרט את רמות הסיווג עבור מודלים שונים של ניתוח שפה אנושית, כולל זיהוי דוברים, זיהוי מגדר וזיהוי חריגות. המדריך מסייע לקבוע את רמת הסודיות של נתונים וניתוחים בתחום זה.
פרטי המסמך
יוצר: National Security Agency - Human Language Technology Research
מפרסם: The Intercept
תאריך יצירה: 2011-05-18
תאריך הדלפה: 2015-05-05
סיווג: Unclassified
תוכניות מעקב: SIGINT
תיאור מקורי (אנגלית)
מסמך זה הוא מדריך סיווג שהוכן על ידי פרויקט ה-Human Language Technology של ה-NSA. המדריך מפרט את רמות הסיווג עבור המודלים השונים של ניתוח שפה אנושית, הכוללים בין היתר זיהוי דוברים, זיהוי מגדר וזיהוי חריגות (anomaly detection).
תרגום לעברית
(U) מדריך סיווג: Human Language Technology (HLT)
(U) היקף וייעול
(U) מדריך זה קובע את רמות הסיווג עבור המודלים השונים של ניתוח שפה אנושית המיוצרים ומיושמים על ידי ה-NSA. טכנולוגיות אלו כוללות, בין היתר, זיהוי דוברים, זיהוי מגדר וזיהוי חריגות (anomaly detection).
(U) הנחיות סיווג
| תיאור היכולת | רמת סיווג | הערות |
|---|---|---|
| (U) Speaker Recognition | CONFIDENTIAL | היכולת לזהות באופן אוטומטי דובר ספציפי מתוך קובץ שמע. |
| (U) Gender Identification | UNCLASSIFIED | היכולת לקבוע את מגדר הדובר (זכר/נקבה). |
| (U) Anomaly Detection | SECRET//COMINT | זיהוי דפוסים חריגים או סטיות מהתנהגות לשונית רגילה המצביעים על פעילות פוטנציאלית של יעד. |
| (U) Language Identification | UNCLASSIFIED | זיהוי אוטומטי של השפה המדוברת או הכתובה. |
(U) פיתוח מודלים ונתונים
- (U) אלגוריתמים גנריים: פיתוח אלגוריתמים של HLT המבוססים על נתונים גלויים (Open Source) יישאר ברמת UNCLASSIFIED.
- (U) אופטימיזציה למטרות מודיעין: התאמת מודלים קיימים לנתוני SIGINT ספציפיים או ליעדים ספציפיים תסווג ברמת SECRET ומעלה, בהתאם למקור הנתונים.
(U) הפצה ושימוש
(U) כל תוצרי ה-HLT המשולבים במערכות מבצעיות של ה-NSA או ה-GCHQ חייבים לשאת סימוני סיווג מתאימים בהתאם למקור המידע הגולמי (Raw Data) ששימש להפקתם.





