על ChatGPT, תוכן זבל, מלכודת כנריות וטום קלנסי
נכתב ב-13 בדצמבר 2022
מחולל הטקסטים מבוסס הבינה המלאכותית, ChatGPT, כבר מעורר שאלות אתיות וענייני זכויות יוצרים – בדומה לכל מחולל AI אחר.
עכשיו מדברים על יצירת סימן מים (Watermark) שיזהה את הטקסטים וימנע מאנשים להציג אותם כאילו הם יצירה מקורית אנושית. אבל איך עושים ווטרמארק על טקסט? מייצרים ניסוחים ספציפיים וייחודיים, שניתן לזהות אם הועתקו ונעשה בהם שימוש אחד לאחד. אין כאן שום דבר חדש, האמת, מלבד הטכנולוגיה שמאפשרת לעשות את זה מהר יותר.
בספר "משחקים פטריוטיים", הסביר ג'ק ראיין, הגיבור הבלתי-מעורער של טום קלנסי, על שיטה לאיתור הדלפות של חומר חסוי, שפיתח עבור ה-CIA. במהלך כתיבת דו"חות סודיים, יוצרים בסוכנות הביון עותקים ממוספרים עם ניסוחים שונים במקצת בכל עותק. העותקים הממוספרים מועברים לאנשים שונים ויש כמובן תיעוד למי הועבר איזה עותק. וכך, כשיש הדלפה, בודקים מה הניסוח שמודלף, ומגלים מי הדליף. בשיטה הזו אפשר בימינו גם לגלות מי גנב לכם תוכן מהאתר, למשל. אבל תגידו – מה הבעיה לעקוף את זה? קצת שימוש במילים נרדפות ושינוי נוסח, כמו שמעתיקים שיעורי בית, ופתרנו את הבעיה.
"טקסט על מסך מחשב", נוצר באמצעות Stable Diffusion
כאן החוכמה האנושית נכנסת לפעולה – כותבי הדו"ח מקפידים לנסח חלק מהמשפטים בצורה דרמטית וסנסציונית, על מנת לפתות עיתונאים (או שופרות) לצטט את הדו"חות מילה במילה. השיטה הזו נקראת "מלכודת כנריות". היום, בעידן העצלות והווטסאפ, כולם פשוט מפיצים את צילום המסך היחיד שנשלח, ולאף אחד לא אכפת מי הדליף מה. וזה מחזיר אותנו ל-ChatGPT. כי כמו שיש כלי שמחולל טקסטים בלחיצת כפתור, יש גם כלי שמשכתב אותם, מתרגם אותם לשפה אחרת וגם אפשר לעשות את זה ידנית אם צריך. שום ווטרמארק לא יעצור את הררי האשפה הטקסטואליים שיישפכו פה בעקבות השימוש בכלים האלה.
מה יהיו ההשלכות על אוריינות דיגיטלית והיכולת להבחין בין טקסט עובדתי ואמיתי ובין שטויות שנפלטו ממחשב חושב? לא יודעת. גדול עליי לנחש. האמת, מה זה משנה? גם ככה התוכן זונה. עכשיו הוא יהיה זונה זולה אפילו יותר.