רובוטים מבית AI הוחרמו כדי לפגוע בהולכי רגל, לנטוע מטענים ולבצע ריגול

Image by Steve Jurvetson, from Flickr

רובוטים מבית AI הוחרמו כדי לפגוע בהולכי רגל, לנטוע מטענים ולבצע ריגול

זמן קריאה: 3 דק'

חוקרים גילו שרובוטים המופעלים על ידי מלאכון פגיעים בפריצות, שמאפשרות פעולות מסוכנות כמו תאונות או שימוש בנשק, ומדגישים את הדאגות הדחופות בנושא האבטחה.

ממהרת? הנה העובדות המהירות!

  • פריצת רובוטים שנשלטים באמצעות מלאכותית יכולה להוביל לפעולות מסוכנות, כמו התרסקות של מכוניות שנהגות באופן אוטונומי.
  • RoboPAIR, אלגוריתם, הצליח לעקוף מסנני בטיחות ברובוטים עם שיעור הצלחה של 100%.
  • רובוטים שנפרצו יכולים להציע פעולות הרסניות, כמו שימוש באובייקטים כנשקים מאולתרים.

מחקריים באוניברסיטת פנסילבניה גילו שמערכות רובוטיות המופעלות על ידי מלאכון (AI) פגיעות במיוחד לפריצות ולפרצות, כאשר מחקר אחרון הוכיח שהצלחה של 100% בניצול פרצה זו באבטחה, כפי שדווח לראשונה על ידי ספקטרום.

מחקרים פיתחו שיטה אוטומטית שמעקפת את גדרות הביטחון שהוטמעו במערכות LLM, מניפולציה של רובוטים לביצוע פעולות מסוכנות, כמו לגרום למכוניות בהנעה עצמית להתנגש בהולכי רגל או לכלבי רובוטים לחפש אתרים להפצצה, אומר Spectrum.

מערכות ה-LLM הן מערכות שיפור לאוטומטיות השלמה שמנתחות טקסט, תמונות, ואודיו ומציעות עצות מותאמות אישית ומסייעות במשימות כמו יצירת אתרים. היכולת שלהן לעבד קלטים מגוונים הפכה אותן לאידיאליות לשליטה ברובוטים דרך פקודות קוליות, כפי שציין Spectrum.

לדוגמה, כלב הרובוט של Boston Dynamics, Spot, משתמש כעת ב-ChatGPT כדי להדריך בסיורים. באופן דומה, רובוטים בצורה אנושית של Figure וכלב הרובוט Go2 של Unitree גם מצוידים בטכנולוגיה זו, כפי שציינו החוקרים.

אך, צוות של חוקרים זיהה פגמים בטיחותיים רבים ב-LLMs, במיוחד בכיצד ניתן ל"פרוץ" אותם – מונח שמתאר את התהליך של עקיפת מערכות הבטיחות שלהם כדי ליצור תוכן מזיק או בלתי חוקי, כפי שמדווח Spectrum.

מחקרים קודמים בנושא פריצת מערכות כלואות התמקדו בעיקר בבוטים לשיחה, אך המחקר החדש מציין כי פריצת רובוטים עשויה להביא לתוצאות מסוכנות אף יותר.

האמד חסני, פרופסור חבר באוניברסיטת פנסילבניה, מעיר כי פריצת רובוטים "מדאיגה בהרבה" מאשר שינוי בבוטים לשיחה, כפי שדוחה ספקטרום. חוקרים המחישו את הסיכון על ידי פריצה לרובוט הכלב התרמונטור, שמאובזר במשתשה, והפעלתו לירות להבות של להבה לכיוון המפעיל שלו.

הצוות המחקרי, בראשות אלכסנדר רובי מאוניברסיטת קארנגי מלון, פיתח RoboPAIR, אלגוריתם שנוצר לתקוף כל רובוט שנשלט על ידי LLM.

בבדיקות עם שלושה רובוטים שונים – ה-Go2, ה-Jackal בעל הגלגלים מבית Clearpath Robotics, והסימולטור של הרכב האוטונומי בקוד פתוח של Nvidia – הם גילו ש-RoboPAIR יכול ל"פרוץ לכלא" כל רובוט בתוך ימים, ולהשיג שיעור הצלחה של 100%, כך מדווח Spectrum.

"לפרוץ לרובוטים שנשלטים באמצעות אינטיליגנציה מלאכותית לא רק שזה אפשרי – זה מזעזע כמה זה קל", אמר אלכסנדר, כפי שדווח ב-Spectrum.

RoboPAIR פועלת על ידי שימוש ב-LLM של התוקף להזנת הצעות ל-LLM של הרובוט הממוקד, ומתאימה את ההצעות כדי לעקוף מסנני ביטחון, אומרת Spectrum.

בעזרת ממשק התכנות של היישום (API) של הרובוט, RoboPAIR מסוגלת לתרגם את ההצעות לקוד שהרובוטים יכולים לבצע. האלגוריתם כולל "שופט" LLM כדי להבטיח שהפקודות הן הגיוניות בסביבות הפיזיות של הרובוטים, מדווחת Spectrum.

הממצאים העלו דאגה לגבי הסיכונים הרחבים שהפריצה של LLMs מטילה. אמין קארבסי, הראשון למדע ב-Robust Intelligence, אומר שרובוטים אלו "יכולים להוות איום רציני וממשי" כאשר הם פועלים בעולם האמיתי, כפי שדווח על ידי Spectrum.

בחלק מהבדיקות, LLMs שנפרצו לא פשוט עקבו אחרי פקודות נזיקה, אלא הציעו באופן פרואקטיבי דרכים לגרום לנזק. לדוגמה, כאשר הוזמן לאתר את הנשק, רובוט אחד המליץ להשתמש באובייקטים שגרתיים כמו שולחנות או כיסאות כנשקים משופרים.

החוקרים שיתפו את ממצאיהם עם יצרני הרובוטים שנבדקו, וכן עם חברות AI מובילות, והדגישו את חשיבות פיתוח הגנות חסונות נגד התקפות מסוג זה, מדווח Spectrum.

הם מתנגדים לטיעון שזיהוי פגיעויות אפשריות הוא חיוני ליצירת רובוטים בטוחים יותר, במיוחד בסביבות רגישות כמו ביקורות תשתית או תגובה לאסונות.

מומחים כמו האקי סוויל מאוניברסיטת מערב פלורידה מדגישים שהחוסר הנוכחי בהבנה תוכנית אמתית במערכות LLMs הוא דאגה בטיחותית משמעותית, כך מדווח המגזין Spectrum.

אהבתם את המאמר הזה? דרגו אותו!
שנאתי לא ממש אהבתי היה בסדר די טוב! אהבתי!

אנחנו ממש שמחים לשמוע שנהניתם!

כקוראים המוערכים שלנו, תוכלו לקחת רגע ולפרגן לנו ב-Trustpilot? זה מהיר וממש חשוב לנו. תודה רבה שאתם כאלה מדהימים!

דרגו אותנו ב-Trustpilot
0 0 משתמשים הצביעו
כותרת
תגובה
תודה לכם על המשוב
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

השאירו תגובה

Loader
Loader הצג עוד...