
Image by Matheus Bertelli, from Pexels
AI של DeepSeek לומדת לחשוב לבד
הסטארט-אפ הסיני DeepSeek, בשותפות עם אוניברסיטת צינגהואה, מצהיר שפיתח שיטה חכמה יותר שתעזור לדגמים של בינה מלאכותית לחשוב טוב ומהר יותר, בלי צורך במחשבים עצומים או משאבים יקרים.
ממהרים? הנה העובדות המהירות:
- DeepSeek יצרה AI משתפרת באופן עצמי באמצעות תיאום ביקורת עצמית מבוססת עקרונות (SPCT).
- SPCT מלמדת AI לשפוט את העבודה שלה באמצעות חוקים שהיא מייצרת באופן עצמי.
- השיטה מעלה את ביצועים מבלי להזדקק לעוצמת מחשוב מרשימה.
הדריכה מגיעה מטכניקה חדשה בשם תיאום ביקורת עצמית מבוססת עקרונות (SPCT). SPCT שונה מאוד משיפור ביצועים של מודלים של אינטיליגנציה מלאכותית פשוט על ידי הגדלתם – SPCT לא דורשת הרבה אנרגיה ויכולת חישוב ללמד את האינטיליגנציה המלאכותית לשפוט את העבודה שלה באמצעות סט של כללים שהיא יצרה בעצמה.
הדרך בה המערכת עובדת היא באמצעות "שופט" מובנה שמאמת שתגובת הAI היא בהתאם לכללים הפנימיים שלה להגיון, ומתאימה לפלט אנושי. כאשר הAI מספקת תגובה מוצקה, היא מקבלת משוב חיובי, שעוזר לה לשפר את יכולתה לענות על שאלות דומות במקרים עתידיים.
DeepSeek מיישמת את השיטה הזו כחלק ממערכת DeepSeek-GRM שלה, שמסמלת Generative Reward Modeling. GRM פועלת באופן שונה משיטות מסורתיות כי היא מבצעת בדיקות מקבילות כדי לשפר את הדיוק והעקביות.
"אנו מציעות את התאמת הביקורת המבוססת-עקרונות (SPCT) כדי לעודד התנהגויות יצירת תגמולים שיכולות להתרחב," כתבו החוקרות ב-מאמר שלהן. "SPCT מאפשר ל-[the model] לקבוע עקרונות וביקורות באופן מתאים בהתאם לשאילתא ולתגובות שנכנסות, מה שמוביל לתגמולים טובים יותר."
עם מערכת זו, DeepSeek מטענה שה-AI שלה עכשיו יכול להציג ביצועים טובים יותר מאשר מתחרים כמו ג'מיני של Google, לאמה של Meta, ו-GPT-4o של OpenAI, במיוחד כאשר מדובר במשימות מורכבות כמו הגיוניות או קבלת החלטות, כפי שנמצא על ידי Euronews.
חשוב לציין, DeepSeek מציינת שהיא מתכננת לשחרר את הכלים החדשים האלה כתוכנה במקור פתוח, אף שלא נמסר תאריך שחרור ממוחשב.
השאירו תגובה
בטל