SCB 10X บริษัทภายใต้ SCBX Group เปิดตัว “ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่สำหรับภาษาไทยโดยเฉพาะ
โดยทางบริษัทพัฒนาขึ้นมาเป็น 2 เวอร์ชั่น คือ
- 1. Pretrained Model สอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก
- 2. Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม
ทางบริษัทระบุว่า ผลการทดลองในชุดข้อสอบภาษาไทยของ Typhoon มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ในตอนนี้ทั้งหมด มีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย มีพารามิเตอร์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย โดยมีเป้าหมายเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก ข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ และมุ่งสู่เป้าหมายการเป็น AI-First Organization ควบคู่กับการสร้างธุรกิจใหม่ๆ ผ่านการเป็นผู้ให้บริการด้านโซลูชันและเทคโนโลยีขั้นสูง
ผู้ที่สนใจและนักพัฒนาสามารถทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model ภายใต้ใบอนุญาต Apache 2.0 ได้ฟรี
- ดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b
- รายงานเชิงเทคนิคประกอบ https://arxiv.org/abs/2312.13951
ลงทะเบียนเพื่อรอทดลองใช้งานโมเดล Instruction-tuned เวอร์ชันเริ่มต้นในรูปแบบของ API ได้ในเร็วๆ นี้ ที่ https://opentyphoon.ai