האם בינה מלאכותית תחליף את הקריינים/ות בשר ודם?

לפני כמה חודשים* פרץ לחיינו Chat GPT שפתח את הסכר לנהר ה AI השוצף ומאז עסוקה האנושות בספקולציות לגבי אילו מקצועות יתייתרו וישָטפו תחת זרם המהפכה הטכנולוגית משנת סדרי העולם הזו. גם בקבוצות הוואטסאפ של הקריינים הבינה המלאכותית והשלכותיה, כולל השאלה האם היא תעלים את המקצוע שלנו מעל פני האדמה, היא נושא פופולרי מאד, אולי הכי פופולרי.

בפוסט הזה אנסה למפות את העולם הזה כפי שנחשפתי אליו (אפשר רק לדמיין על מה עובדים במעבדות של גוגל, מייקרוסופט, מטא ושלל החברות הקטנות והסטארטאפים בתחום שאני לא מכיר), אעלה את ההשערה שלי בעניין וכמובן אתן ל Chat GPT עצמו לענות על השאלה “האם האינטליגנציה המלאכותית תעלים את הקריינים האנושיים”.

יכולותיה של הבינה המלאכותית בתחום הן מדהימות. אחת הפסגות שנחשפתי אליהן היא זו של מייקרוסופט שפיתחה אלגוריתם שמאפשר יצירת קובץ סאונד מכל טקסט שהוא, בעזרת דגימת קול בת שלוש שניות בלבד.

במישור הפיקנטי לכאורה, ושמעלה שאלות נוקבות בענייני בעלות וזכויות יוצרים, אפשר להשתמש בקולותיהם של שחקנים וזמרים מוכרים, חיים או מתים, כדיפ פייק שיקראו עבורכן/ם כל טקסט שתחפצו. הנה פודקאסט שבו דגימותיהם של מראיינים/ות מפורסמים/ות “מראיינים” מרואיינים/ות מפורסמים/ות לא פחות.

“אופרה וינפרי” לקוח מתוך האתר של Podcast.ai

יונתן גפן ז”ל, כתב פעם “מתי הקולנוע הפסיק לחקות את החיים והחיים התחילו לחקות את הקולנוע?”. ארי פולמן חזה את כל זה ב”כנס העתידנים” הנפלא שלו ב 2013. הוא לא היה הראשון מן הסתם, אבל מדובר בסרט מעולה שאני ממליץ לרוץ ולראות אם טרם יצא לכן/ם. בסרט, שמבוסס על ספרו של סטניסלב לם, רובין רייט (“הנסיכה הקסומה”, “בית הקלפים”) הנפלאה מככבת בתפקיד עצמה, בסיטואציה בה מוצע לה דיל של פעם בחיים – לוותר על “עצמיותה” לטובת הבינה המלאכותית, כלומר לתת למחשב לדגום אותה מכל כיוון וליצור אינספור “רובין רייט”‘יות שיככבו בסרטים מכל הסוגים (“בלי פורנו” היא אומרת בסרט, והסוכן שלה עונה “לא. ויתור מוחלט, על הכל”).

כמו כל טכנולוגיה, גם את זו אפשר לנצל לרע (האם זה באמת שי ג’ינגפינג שמתקשר להיפרד ממני אישית כי טילים בעלי ראש נפץ גרעיני יכו בי עוד לפני שהשיחה תסתיים) ולטוב – הנה חברת סוננטיק, שאיפשרה לואל קילמר לשמוע את עצמו מקריין את הדוקו שנעשה עליו בקולו שאבד עם החמרת מחלת ה ALS שלו, מסבירה איך זה נעשה.
(ואגב, יש עוד גופים שמנסים לעזור לחולי ALS לבטא את עצמם באמצעות שימוש בסימפולים מקולותיהם שאבדו כמו העמותה הזאת, ALS Voice)

והנה חברת דיפדאב הישראלית שמאפשרת לצופות ולצופים במדינות שאוהבות את התכנים שלהן מדובבים (בעיקר ספרד, איטליה, רוסיה וסין) לשמוע את השחקנים/ות האהובים/ות עליהם/ן מדבבים/ן את עצמם/ן בשפות שהם מעולם לא למדו, כולל תנועות שפתיים והכל.

כמובן שבעברית הדרך ארוכה היא ורבה, קחו כדוגמא את הקריינויות האוטומטיות של YNET או את של “ישראל היום”, אבל מי ששמע את “רובו שאול”, הפרק בן שני החלקים של “חיות כיס” שבו שאול אמסטרדמסקי יוצא למסע אחרי הרובוט שיכתוב, יקריין ויפיק בעצמו פרק לָפודקאסט, יודע שיש א/נשים טובות/ים מאד שם בחוץ שמנסות/ים להדביק את הפער (הנה חלק א’ וחלק ב’ (תוספת מאוחרת: בינתיים יצא גם חלק ג’ ואחרון).

“שאול הופך לרובוט”, תאגיד השידור הישראלי

סאונד הוא מתמטיקה. גובהי התדרים, העוצמה, המשך, הדגשים, כל אלה ניתנים למדידה כמו גם גוון הצליל (מה שהופך סאונד של חצוצרה לשונה מזה של גיטרה או את זה של גיל קומר לשונה מזה של מורגן פרימן).

ב 2018 פרסמתי את הטור הזה ב”הארץ” שחזה עתיד שבו ספוטיפיי הופכת לכותבת השירים המצליחה בעולם. עושה רושם שהעולם אכן מתקדם בכיוון, אלא שמי שחותר לשם היא לא ספוטיפיי אלא חברות סטארט אפ שונות. אבל האם הבינה המלאכותית תצליח לדחוק אותנו, הקרייניות והקריינים, או לצורך העניין את הזמרות והזמרים, השחקניות והשחקנים, לגמרי?

יש קריינויות שהן “טמפלטים”.
אם אבקש מכם לומר “ועכשיו מבצע” בטון של פרסומת תדעו בדיוק איך הקריינות אמורה להישמע. “ארץ נהדרת” צחקו על זה עוד ב 2007 עם “אוהבים נקניקיות” של טל פרידמן הענק.

לא אשכח איך הוזמנתי פעם לסשן קריינות לפרסומת, לבד באולפן עם הטכנאי ועם טקסט שהלקוחה שלחה, שהיה בו הצירוף “ועכשיו מבצע”. אמרתי לטכנאי (היי לירון) “בוא נעשה ‘ועכשיו מבצע’ אחר לשם שינוי!” והקלטנו 25 גרסאות שונות של הצירוף הזה שהשמענו אחר כך ללקוחה בטלפון. נחשו באיזה טייק היא בחרה? נכון. בסטנדרטית.
בתחום שלנו, שכירי חרב שאנחנו, יצירתיות ומעוף הם עניין שתלוי בלקוח. היכולות הן שלנו, אבל הוא זה שמאפשר לנו לפרוש כנפיים או מבקש שנתיישר לפי הספר.
ה”ספר” כתוב כבר. כל מה שנשאר הוא להעתיק אותו, ובְהעתקה המחשבים עולים עלינו אינסוף מונים.

אבל מה קורה במקומות שבהם נדרש מעוף אמיתי, הבנה עמוקה של טקסט וניואנסים שיצליחו להעביר את המורכבות האנושית באופן שרק אנשים יכולים להבין אותה?

בקורס הקריינות שלי וגם בקורס הרדיו, אני משמיע קטע מראיון נפלא עם הדר’ רועי צזנה ב “טכניוניסטים” (הפודקאסט של בוגרי הטכניון) שבו הוא אומר שבסופו של דבר, המכונות יאלצו אותנו להפך לדבר היחיד שהן לא יודעות להיות – לבני אדם.

קריינות היא בעיני לא פחות ולא יותר מאשר לדעת לדבר בצורה מקצועית.
בני אדם מדברים, ובדיבור הזה הם מעבירים רעיונות וסבטקסטים של כוונות ורגש (הנה תרגיל בקריינות – נסו להגיד “אני אוהב/ת אותך” בחמש אינטונציות שונות. יש “אני אוהב/ת אותך” של לפני שיוצאים לעבודה ויש של סיטואציה אינטימית, יש “אני אוהב/ת אותך” ציני, יש קצר, יש ארוך.. יש מלא. אולי אפילו כמספר סוגי האהבות).

קריינות היא מקצוע שיש בו הרבה מן המשחק ומה שמבדיל בין סוגי טקסטים הוא הניואנסים הקטנים (או הגדולים) שממסגרים את הרגש שהם נועדו להעביר. קריינות לסרט מבצע של רשת שיווק ששוברת את השוק נועדה להקפיץ את הצרכן מהכסא ולהביא אותו במהירות לרשת; כשז’וזה סרמגו כותב “למחרת, בשעת ארוחת הערב, אם כמה פרוסות עלובות של לחם יבש ובשר מעופש ראויים לשם כזה…”, הוא מחייה עולם שלם של מראות, ריחות ורגש, של מצב רוח, שרק קריין/ית טוב/ה תוכל להעביר. (על העיוורון תרגמה מרים גבעון, הוצאת הספרייה החדשה, עמ 141) .

אז למרות שאמאזון ואפל מאפשרות הורדת ספרים קוליים שקוריינו על ידי בינה מלאכותית ולמרות שהן עושות עבודה לא רעה בכלל; למרות שיש מאזינות/ים שלא ישימו לב אם מדובר בקריינות אנושית או ממוחשבת ולמרות ש-כן, לחיצה על Enter היא הרבה יותר זולה ובטוחה מאשר להזמין עבודה מאיש/ה, למרות שהעולם הזה עומד לעבור שינוי דרמטי, לשיטתי תמיד יהיה מקום לבני אדם. אין מורגן פרימן אחר, ואף אחד לא היה מעלה בדעתו להמציא אחד.

ואולי אתן/ם המורגן פרימן, הסר דיוויד אטנבורו, הדון להפונטיין (הקול של “In a world”…) או המל בלנק (גדול המדבבים מאז ומעולם) הבא? או בעברית, הנעם אבירם, הגיל קומר, הליאת לשם, העדי לרנר או הדרור קרן הבאות/ים שלנו?
בכל מקרה, אתן/ם אתן/ם, עם הקול האישי שלכן/ם. וכזה – יש רק אחד.

ומה יש לצ’אט ג’י פי טי לומר בעניין?

לסיום, שאלתי לדעתו של Chat GPT בכבודו ובעצמו וזו תשובתו לשאלה “Will AI turn human voice over obsolete” (נעזרתי בגוגל בשעת הניסוח):

“בעוד שטכנולוגית בינה מלאכותית עשתה צעדים משמעותיים ביצירת קולות דמויי אנוש אמינים, קשה להניח שהיא תוכל להעלים את המקצוע לחלוטין בעתיד הקרוב (אהבתי “בעתיד הקרוב” א.א.).

בעוד שמערכות TTS (Text to speech) השתפרו וכיום והן יכולות לייצר דיבור דמוי אנושי באיכות גבוהה, עדיין יש ניואנסים ורגשות שקול אנושי יכול להביע באופן אפקטיבי יותר.

לקול האנושי יש יכולת נדירה להביע רגשות, אמפטיה ואמינות ש AI ימצא כמאתגרים לחיקוי. בתעשיות הבידור, הפרסום והאודיובוקס שבהם צריך ליצור קשר רגשי עם הקהל או הלקוחות, עדיין מעדיפים לשכור את שירותיהם של קריינים בשר ודם. עם זאת, ל AI יש את היתרונות שלה. היא יכולה לספק פתרונות יעילים, זולים ויציבים עבור פרוייקטים כמו ספרים קוליים, עזרים קוליים, תרגום והנגשה, ול AI יש יכולות להתגבר על מחסומי שפה.

ככל שהטכנולוגיה תתקדם, קולות מסונתזים ע”י AI יהפכו לפחות ופחות מובדלים מקולות אנושיים אבל לא סביר להניח שהן תחלפנה את הקולות האנושיים לגמרי. בעתיד כנראה שנראה שיתופי פעולה בין קריינים אנושיים למכונות בהם כל אחד יוכל להביא לידי ביטוי את החוזקות שלו.”

לא יכולתי לומר את זה יותר טוב 🙂

ומה דעתכן/ם?

*הפוסט נכתב במאי 2023, והנה תוספת מאוחרת, מאוגוסט אותה שנה:
אני מאמין שבעתיד, כשנלך לתאטרון או לקולנוע, נראה שם תערובת של שחקניות/ים אנושיות/ים ואוואטארים ותופעת הדוגמניות/ים, משפיעניות/ים הוירטואליות/ים תתעצם אבל בני ובנות אדם שימלאו את אותן הפונקציות יתקיימו לצידם.
משום שקריינות היא מקצוע שיש בה קצת מן המשחק וקצת מן הדוגמנות (שימעו איזה קול יפה/מיוחד/מהפנט יש לי), גם כאן – יהיו כאלה וכאלה. יש, ויהיה, מקום לכולן/ם.

ומשזה נאמר, כאמור, באוגוסט 23, מי יודע איך נראה העולם כשאתן/ם קוראות/ים את הפוסט הזה 🙂

והנה נ.ב, מספטמבר 23′: עידן קוולר ועידו קינן ראיינו אותי ב”שישבת” בגלי צה”ל בשביל לדבר על העניין ולקראת סוף השיחה הגענו לתרחיש מגניב שבו ה AI בעצם יעזור לנו הקריינים לגבות הרבה יותר – כי *אנחנו* נהיה המצרך הנדיר. הראיון נמצא כאן (מתחיל ב 01:30:48)

Blog

האם בינה מלאכותית תחליף את הקריינים/ות בשר ודם?

כתיבת תגובה לבטל