שישה אתגרים בתרגום מיקרו-קופי והטכנולוגיות שיעזרו

כתבה: מיכל קסל שטרית - CEO בטרנס.מי, חברת תרגום ותוכן

אם אתם חושבים שלכתוב מיקרו-קופי זה מורכב, נסו לעשות את זה בכמה שפות במקביל. כשעבדתי כמתרגמת ועורכת עצמאית, ובהמשך בחברת התרגום שלי, יצא לי לעבוד עם מגוון סוגי מיקרו-קופי: בתוכנות, באתרים, באפליקציות וגם במוצרים פיזיים.

בעולם התרגום, כל תחום דורש כישורים ייחודיים, וגיליתי שבמיקרו-תרגום יש אתגרים שונים מאוד מאלו שמתגלים בתרגום של טקסטים ארוכים. ככל שעולה מספר הסגמנטים (השורות הלתרגום), כך קשה יותר לעבוד בצורה מסודרת ולשמור על סגנון קבוע, טרמינולוגיה אחידה וטון דומה.

כשעובדים בצוותים או בקבוצות גדולות, העניינים מסתבכים עוד יותר, ואני לא רוצה אפילו להתחיל לדבר על תהליך העבודה עם מתכנתים (אבל אדבר על זה בכל זאת, כי זה משהו שצריך לעשות לפעמים).

אז כמו שכבר הבנו, מיקרו-תרגום הוא תחום לא פשוט. החדשות הטובות: השנה היא 2019. המכוניות שלנו תכף נוסעות לבד, השואבים שלנו מנקים את הרצפה בעצמם, תוכנות תרגום עושות לכם חיים קלים, ובן אנד ג'ריז מחזירים את פינט באטר קאפ למדפים. זה עולם מופלא.

במאמר הזה אתייחס לכמה מהאתגרים המרכזיים שאנחנו נתקלים בהם כשאנחנו מתרגמים את המיקרו-קופי המשובח שלנו לשפות אחרות, ואכיר לכם כמה תוכנות CAT (ראשי תיבות של Computer Assisted Translation) שיכולות לעזור. יש מוצרי תוכנה נהדרים לדסקטופ, אבל הסקירה הזו תתמקד בפתרונות בענן, כי החיים קצרים מכדי לשלוח לעצמנו קבצים במייל.

אם אתם כבר עוסקים בתרגום, יכול להיות שחלק מההסברים ייראו לכם בסיסיים. זה בסדר – המאמר נכתב מתוך מחשבה על כותבי מיקרו-קופי שאין להם הרבה ניסיון בכלים לתרגום מקצועי. אפשר בהחלט לדלג קדימה, בסוף יש טבלה שימושית עם השוואה בין התוכנות המומלצות ומטאפורה קצת סטרצ'ית על דייטים.

1. טרמינולוגיה

למה זה כל כך חשוב?

רשימת המונחים היא השלד שסביבו נבנית חוויית המשתמש. המילים הנכונות יאפשרו למשתמשים להזדהות עם המוצר, להתחבר אליו, לזכור אותו או פשוט להשתמש בו בקלות רבה יותר.

אבל הרבה פעמים, כשהתרגום נמשך זמן ארוך מאוד, מתמקד בנפח גדול של תוכן, או מתבצע על ידי יותר מאדם אחד, נוצר סלט, ולא מהסוג הטעים עם בטטה ותערובת נשנושים. סלט המונחים הזה פוגע מאוד בחוויה, כי הוא מבלבל את המשתמשים ומקשה עליהם לנווט בקלות במוצר שלנו. הכאוס גדל במקביל לפרויקט התרגום, וככל שהזמן עובר אנחנו עשויים לגלות עוד ועוד מונחים שונים עם משמעות זהה וניסוחים לא תואמים.

חשוב לנהל כבר מהרגע הראשון רשימת מונחים מסודרת ולהקפיד להשתמש באותה טרמינולוגיה בכל פעם, כדי לוודא שאנחנו שומרים על אחידות ושהמשתמשים יבינו את הסביבה שלהם בכל רגע נתון. אם אתם כבר באמצע פרויקט לוקליזציה ענק, זה הזמן לעצור, לבדוק את התרגומים הקיימים, לבצע הרמוניזציה (=האחדה) לכל התוכן, ורק אז להמשיך קדימה בצורה יעילה וחכמה יותר.

מה זה Glossary

כדי שנדע לדבר במונחים הנכונים מעתה והלאה, ניעזר בפיצ'ר קטן ושימושי שיש ברוב תוכנות התרגום: ה-glossary או בסיס המונחים (term base). בהשקעה ראשונית קטנה הוא יחסוך לנו הרבה עבודה בעתיד ויעזור לנו לוודא שכל מי שעובד על הטקסט משתמש בטרמינולוגיה שבחרנו.

איך נקבע אילו מילים יופיעו ברשימת המונחים שלנו? אם יש לנו מעט חומר, יהיה כנראה די קל לבחור את המילים לבד. כשמדובר בנפח גדול, אפשר להשתמש בתוכנת שליפה (term extractor) לבחירתכם. בחלק מתוכנות התרגום קיימת אפשרות שליפת מונחים, ואחרות ידרשו מכם להשתמש בתוכנה חיצונית (באופן אישי, היה לי ניסיון חיובי עם Xbench). תוכנות כאלו יודעות לנתח את הטקסט ולשלוף ממנו את המונחים המרכזיים והחשובים, לפי קריטריונים שאתם מגדירים מראש.

לא משנה איך יצרתם את הרשימה, ברגע שתזינו אותה לבסיס המונחים היא תוכל לשדרג משמעותית את איכות המיקרו-קופי שלכם.

כל תוכנות התרגום כוללות מנוע חיפוש שדרכו אפשר לעיין בטרמינולוגיה. חלק גדול מהן גם יציגו לנו את המונחים בחלונית קטנה כשאנו עובדים על שורה שמכילה אותם, או ידגישו לנו מונחים שנמצאים ב-glossary, כדי שנדע שאנחנו יכולים לגשת ולחפש אותם שם. בכל מקרה, בסיום התרגום, כלי בקרת האיכות של התוכנה יתריע בפנינו אם השתמשנו במונחים לא נכונים (עוד על בקרת איכות – בהמשך).

זיכרון התרגום (translation memory)

זיכרון התרגום הוא עוד פיצ'ר שימושי שמאפשר לנו לשמור על אחידות. זה קובץ חכם, ובניגוד לבני אדם, הוא באמת זוכר את כל התרגומים ששמרתם בעבר, גם אם הוא יצא לשתות עם קבצים אחרים בערב לפני וחזר הביתה מחוק.

גם 10 כאלה לא יפריעו לו לעשות עבודה טובה

בניגוד לבסיס המונחים, אין צורך להכין אותו מראש – טוענים אותו בתחילת התרגום, ושומרים אותו בסיום. כששורות חוזרות על עצמן, זיכרון התרגום יעזור לנו לשמור על ניסוח אחיד, וכשאנחנו לא בטוחים באיזו מילה השתמשנו, נוכל לבצע חיפוש ולבדוק. אם יש לנו שורות שחוזרות על עצמן באותו קובץ, נוכל אפילו להגדיר את התוכנה כך שתעדכן כל שינוי שנבצע בכל השורות הזהות (אבל בזהירות! שינויים גורפים כאלה עשויים ליצור בעיות הקשר בהמשך. על כך בפסקה הבאה).

2. משבר ההקשר

כמה מדכא לבדוק את התוכנה ולגלות שהשורה שחשבתם שתופיע בכותרת היא בעצם כפתור. או שיצאתם גוגל טרנסלייט והפכתם את "case" ל"תיבה" במקום ל"מקרה".

תשמחו לגלות שהיום קיימים בשוק כמה כלים שמציגים בכל שורה את המסך או את העמוד שבהם היא מופיעה, ואפילו מאפשרים להזין את הטקסט ישירות אל תוך ה-GUI.

בפוסט הזה רואים איך זה עובד ב-Smartling.

היתרון ברור. כשאנחנו מתרגמים ישירות אל תוך הממשק, קל לנו הרבה יותר לבחור את הטקסט המתאים ביותר להקשר. אנחנו יכולים להתמודד טוב יותר עם שומרי מקום (placeholders), כי הממשק הגרפי מציג דוגמה לטקסט שיחליף אותם בהמשך. ויותר מזה – אנחנו יכולים לוודא בזמן אמת שהמבנה והאורך שאנחנו בוחרים מותאמים לעיצוב הקיים של המסך.

החיסרון, כמובן, הוא שלא מדובר בפתרון זריז. הוא דורש הכנה מראש של החומר והגדרה של התוכנה. אם אתם צריכים לתרגם כמות קטנה של טקסט, לא בטוח שהטרחה שווה את זה, אבל בפרויקטים גדולים מדובר ביכולת מופלאה שיכולה לשפר משמעותית את איכות התוצאה.

גם Crowdin מציעה פיצ'ר דומה. יכולים לנסות בעצמכם פה: https://demo.crowdin.com

3. עבודה במקביל

אוקיי, אתם אומרים. כל זה ממש נחמד, אבל בואי, אנחנו עסק מודרני, אנחנו ערימות של WiFi. אי אפשר שרק אחד מאיתנו יעבוד על התוכן בכל זמן נתון.

צודקים. אחד היתרונות העיקריים של טכנולוגיות הענן הוא שהיכולת לשתף פעולה ולעבוד במקביל נמצאת בהן בילט-אין. לא כל המערכות מנצלות את הפוטנציאל הזה במלואו (אני מסתכלת עליכם, Memsource), אבל אלו שכן מציעות מגוון תכונות שימושיות במיוחד.

למשל, במערכות שמאפשרות עריכה ותרגום של אותו קובץ במקביל, אפשר לעבוד בקלות גם על קבצים גדולים ולבצע עדכונים בטרמינולוגיה ובניסוח כבר בתחילת העבודה, כך שלא תצטרכו לתקן שוב ושוב בהמשך.

באותם כלים ניתן גם לחלק קובץ יחיד בין כמה מתרגמים, כשזיכרון התרגום מתעדכן בזמן אמת ועוזר לשמור על אחידות. וכמובן, הודות לתכונות של הערות וצ'אטים כל המשתתפים בפרויקט יכולים להעביר ביניהם מידע תוך כדי עבודה באופן יעיל ומהיר.

ב-Smartcat, כל מתרגם מקבל חלק אחד מהקובץ – אבל כולם מעדכנים את אותו זיכרון תרגום

4. התממשקות לפיתוח

ומה לגבי המפתחים? אנחנו רוצים לעשות להם חיים קלים, כי מתכנת טוב הוא מתכנת רגוע. למזלנו, רוב הכלים המתקדמים מציעים API, כך שהתרגום יכול להתממשק ישירות ובאופן אוטומטי לתהליך הפיתוח – פיצ'ר שחוסך זמן ותחלופה אינסופית של קבצים ומיילים.

כל מערכת עובדת עם פלטפורמות פיתוח שונות, אז הכי טוב לבדוק במערכת עצמה או עם שירות הלקוחות ולבדוק איזו מערכת מתאימה לפלטפורמה הספציפית שלכם.

5. בקרת איכות

תרגמתם 10,000 מקטעים.

ב-10% מהם יש רווח לפני הנקודה, שזה, כידוע, פשע דקדוקי מחריד.

ב-12% יש טרמינולוגיה לא נכונה.

ב-3% אחרים הקלדתם בטעות 5 במקום 4 (המקשים ממש קרובים).

שנייה, אל תתאבדו עדיין.

כלי בקרת האיכות יזהה בשבילכם את הבעיות (לפי פרופיל שתגדירו מראש) ויאפשר לכם לצפות רק בשורות הפגומות. הוא יעזור לכם למצוא את כל מה שדורש תיקון, יבדוק בשבילכם שוב שלא פספסתם כלום, ויחסוך לכם המון זמן חיפוש שתוכלו לנצל להכנת פנקייקים, או משהו.

חשוב לציין: מחשבים זה סבבה, אבל כלי בקרת האיכות לא יעלה על 100% מהטעויות בטקסט.

אילו סוגים של טעויות הוא יודע לזהות?

- שגיאות הקלדה

- שימוש בטרמינולוגיה שלא תואמת את בסיס המונחים

- רווחים כפולים או במקומות לא נכונים

- נקודות חסרות בסוף משפט

- משפטים ארוכים באופן חריג או ארוכים מהמגבלה שנקבעה

- מספרים חסרים או לא נכונים

- תרגום שונה לשני משפטי מקור זהים, או תרגום זהה לשני משפטי מקור שונים (עוזר מאוד כשמפספסים הבדל קטן בין שני משפטים).

מה הוא לא יודע לזהות?

- בעיות של עימוד ויישור

- טעויות שנובעות משימוש בשומרי מקום (כמו בתמונה בהמשך)

- שגיאות הקלדה שיוצרות מילה אמיתית (עכבר במקום כבר)

- הבדלים בין שם עצם לציווי (scroll = גלילה או גלול?)

- טעויות שנובעות מההקשר

- וכמובן, תרגומים לא איכותיים/לא טבעיים

לפעמים, בגלל הבדלים שקשורים למבנים הלשוניים בעברית, הוא יתריע על טעות גם כשבפועל התרגום תקין. לכן חשוב מאוד גם לעבור על התוכן בעצמנו ולוודא שהכל בסדר.

ובכל זאת, הפיצ'רים האלו הם דרך נהדרת לצמצם טעויות אנוש או הבדלי העדפה בתרגום (מה שנקרא preferential translation) ולשמור על תיאום בין אנשים שונים שעובדים על אותו התוכן.

אופס! פלייסהולדר שובב, תראה מה עשית. מתוך הדמו של PhraseApp, פה: https://demo.phraseapp.com

6. אבטחה ופרטיות

כשאנחנו עובדים על כלים מבוססי ענן, אנחנו נהנים מגמישות ויעילות שתוכנות מהסוג הישן פשוט לא יכולות לספק. הן מאפשרות לערוך תוכן מכל מקום, בכל זמן וממגוון עצום של מכשירים – אפילו סמארטפונים, וכל מה שהן דורשות בתמורה הוא חיבור קבוע ואיכותי לאינטרנט.

החיסרון העיקרי של התוכנות בענן: יש לנו הרבה פחות שליטה על רמת האבטחה של התוכן שאנחנו מעלים אליהן. בניגוד למחשבים שלנו, שעליהם אנחנו יכולים להגן באיזו דרך שנרצה, כשאנחנו מעלים קבצים למערכות מבוססות רשת, אנחנו מפקירים את הקבצים האלו לחסדי פרוטוקולי האבטחה שלהן ומאפשרים להן גישה לתוכן שאנחנו מעלים ולתרגומים שאנחנו יוצרים.

אין צורך להיבהל. אבטחה במערכות כאלו נחשבת כבר לסטנדרט קבוע, וכל אחת מהן מחזיקה עמוד ייעודי שבו היא מפרטת את אמצעי האבטחה המגינים על המידע שלכם. אם אתם לא בטוחים שהמידע מאובטח מספיק, או שאתם חוששים שמערכת מסוימת עושה שימוש בתוכן שאתם מעלים למטרות אחרות, בקשו מידע נוסף מנציגי התמיכה. זו גם דרך מצוינת לוודא שיש דרך נוחה וקלה לקבל מענה מנציג אנושי, למקרה שתצטרכו מענה כזה בעתיד.

לסיכום

כמו בעולם הדייטים, גם פה – אין מערכת מושלמת, וכל אחד צריך לשקלל עבור עצמו את המאפיינים החשובים יותר ולבחור את זו שהכי מתאימה, או להתלבט הרבה מאוד ואז להתייאש ולחזור לאקסל (להלן: רווקות מאוחרת).

הטבלה הבאה, כמו החברה הזו שכל הזמן משדכת בין כולם, רק מנסה לעזור ולעשות סדר בפיצ'רים השונים שדיברנו עליהם.

צאו לתרגם ושיהיה לכם בהצלחה!

על הכותבת

מיכל קסל שטרית - מנהלת-שותפה בטרנס.מי, מתרגמת, עורכת וכותבת, עם חולשה למילים, לספרים ולפסטה.

לינקדאין | אתר