Apple เปิดตัว OpenELM โมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์ส (LLM) หลายรุ่น ที่ออกแบบมาให้ทำงานบนอุปกรณ์ แทนที่จะทำงานผ่านเซิร์ฟเวอร์คลาวด์ โดยเผยแพร่โค้ดบน Hugging Face Hub คอมมูนิตี้สำหรับนักพัฒนาซอฟต์แวร์ AI
OpenELM มีทั้งหมด 8 โมเดล ซึ่งไม่ใช่ทุกโมเดลที่สำเร็จรูปพร้อมใช้ แต่ยังมีบันทึกการฝึกอบรม และโมเดลที่ยังไม่ผ่านการฝึกอบรมขั้นสุดท้ายแบบเต็มที่
เป้าหมายของการพัฒนา OpenELM คือ ให้ผลลัพธ์จาก LLM ดีขึ้น มีความถูกต้องมากขึ้นโดยไม่ต้องใช้โทเค็นการฝึกอบรมมากเท่าแต่ก่อน
Apple กล่าวว่าการแชร์โมเดลโอเพ่นซอร์สทำให้นักวิจัยมีวิธีตรวจสอบความเสี่ยง ข้อมูล และอคติของโมเดลได้