דוא"לים של Meta מחשפים הורדה מונית של ספרים מפרצים לאימון AI

Image by Nokia621, from Wiki Commons

דוא"לים של Meta מחשפים הורדה מונית של ספרים מפרצים לאימון AI

זמן קריאה: 3 דק'

פרטי מיילים שהוסר מהם החסימה לאחרונה הופיעו כמה שמחברי ספרים מתארים כ"הראיות הממחישות באופן מרשים ביותר" נגד Meta בתביעה מתמשכת בנושא זכויות יוצרים, כפי שדווח לראשונה על ידי Ars Technica.

ממהרת? הנה העובדות החשובות!

  • מטה הזרימה באינטרנט 81.7 טרה-בייטים של ספרים שנגנבו מספריות צללים כמו LibGen ו-Z-Library.
  • דוא"לים פנימיים מראים שעובדי מטה העלו דאגות משפטיות לגבי הזרמת והפצת חומרים שמוגנים בזכויות יוצרים.
  • לכאורה, מטה הסתירה את פעילות ההזרמה על ידי המנעה משרתי פייסבוק ומזערת את פעילות ההפצה.

דיווח של Ars Technica מציין שהמחברים מאשימים את Meta באימון בלתי חוקי של מודלי הAI שלה על ספרים שנשדדו, והאימיילים מגלים דאגה פנימית לגבי חוקיות הטורנט ושיתוף החומר המוגן בזכויות יוצרים.

חודש שעבר, Meta הודתה שהורידה קובץ מידע מוסרר ומעורר מחלוקות בשם LibGen, שמכיל עשרות מיליונים של ספרים שנפרצו.

עם זאת, הפרטים נשארו לא ברורים עד שהופקו לציבור האימיילים ללא הסתרה.

לפי התביעה שהגישו המחברים לבית המשפט, Meta הורידה באופן חסר חוקי "לפחות 81.7 טרה-בייט של מידע ממספר ספריות צלים שונות דרך האתר Anna’s Archive, כולל לפחות 35.7 טרה-בייט של מידע מ-Z-Library ו-LibGen". בנוסף, "Meta כבר הורידה בעבר 80.6 טרה-בייט של מידע מ-LibGen."

"הממדים של תוכנית ההורדה החסרת חוקיות של Meta פשוט מדהימים", כך נאמר בהתביעה של המחברים, והוסיפו שאף "פעולות פראטיית מידע הרבה יותר קטנות – רק 0.008 אחוז מכמות היצירות שנפרטו באופן חסר חוקי על ידי Meta – הובילו להפניית ההתנהגות למשרדי התובעים הפדרליים בארה"ב לחקירה פלילית."

ארס טכניקה מעירה שהאימיילים גילו גם חרדה פנימית בין עובדי Meta. באפריל 2023, כתב מהנדס המחקר ניקולאי באשליקוב, "מהרסנות ממחשב חברתי לא מרגיש נכון," והוסיף אימוג'י של חיוך.

הוא הביע חשש משימוש בכתובות IP של Meta "לטעינת תוכן פיראטי דרך טורנטים." עד ספטמבר 2023, באשליקוב הפסיק עם ההומור, התייעץ עם צוות המשפטים של Meta והזהיר ש"שימוש בטורנטים יכול לכלול 'זריעה' של הקבצים – כלומר, שיתוף התוכן בחוץ, זה עלול לא להיות חוקי."

למרות אזהרות אלו, מחברים מאשימים את מטה שהמשיך להוריד תוכן מפרטי באמצעות טורנטים ולהפיץ אותו, ואף ניסה להסתיר את פעילותו.

Ars Technica מדווחת כי הודעות פנימיות מראות שמטה הימנע משימוש בשרתי פייסבוק להורדת מאגר הנתונים כדי "להימנע" מה"סיכון" שמישהו י"מעקב אחרי המפיץ/המוריד", כפי שתיאר החוקר פרנק זאנג.

מייקל קלארק, מנהל בכיר במטה, הודה גם בהפקדה שהגדרות שונו "כך שהזריעה הכי קטנה אפשרית תוכל להתרחש."

המחברים כעת טוענים שחובה להפקיד שוב את צוות מטה שהיה מעורב בהחלטה להשתמש בטורנט, שכן הראיות החדשות כאמור "מנהגות סתירה לעדויות ההפקדה הקודמות."

לדוגמה, בעוד שהמנכ"ל מארק צוקרברג טען שלא התערב בשימוש ב-LibGen לאימון ה-AI, הודעות לא מעורערות מציעות ש"ההחלטה להשתמש ב-LibGen התרחשה" לאחר "הסלמה קודמת אל MZ."

Ars Technica מדווח ש-Meta הוחזקה בטענה שאימונה של ה-AI ב-LibGen מהווה "שימוש הוגן" ודחתה כל הפצה בלתי חוקית של יצירות המחברים. אף על פי כך, התגליות בנוגע להזרמה המונית של קבצים דרך רשתות טורנט מורכבות את ההגנה שלה, ומאפשרות למחברים להרחיב את טענותיהם של הפרת זכויות יוצרים ישירה.

ככל שהתיק מתקדם, מטה נמצאת תחת בחינה מוגברת בגין הטיפול שלה בחומרי זכות יוצרים, והסופרים נחישים להאשים את הגיגנטית הטכנולוגית על מה שהם מתארים כ"תכנית הזרמה בלתי חוקית מרשימה".

אהבתם את המאמר הזה? דרגו אותו!
שנאתי לא ממש אהבתי היה בסדר די טוב! אהבתי!

אנחנו ממש שמחים לשמוע שנהניתם!

כקוראים המוערכים שלנו, תוכלו לקחת רגע ולפרגן לנו ב-Trustpilot? זה מהיר וממש חשוב לנו. תודה רבה שאתם כאלה מדהימים!

דרגו אותנו ב-Trustpilot
0 0 משתמשים הצביעו
כותרת
תגובה
תודה לכם על המשוב
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

השאירו תגובה

Loader
Loader הצג עוד...