Insiderly AI - TH
Posts
อัพเดทความเคลื่อนไหวโลก AI ประจำ 29 ก.ค. - 4 ส.ค. 2024

อัพเดทความเคลื่อนไหวโลก AI ประจำ 29 ก.ค. - 4 ส.ค. 2024

Worawisut Pinyoyang
August 04, 2024

In partnership with

อัพเดทความเคลื่อนไหวโลก AI ประจำ 29 ก.ค. - 4 ส.ค. 2024

ไม่ได้เขียนอัพเดทข่าวนาน เพราะวันธรรมดางานเยอะมากกก ทำไม่ทันแล้ววว ก็เลยใช้วันหยุดมานั่งรีวิว อัพเดทต่างๆกัน

สัปดาห์ที่ผ่านมา โลก AI เรียกว่าอัพเดทกันแบบ ตามแทบไม่ทัน มันไวมากกก จะร้องไห้แล้ววว

อะ เริ่มต้น

OpenAI อัพเกรดโมเดล GPT-4o ให้รองรับ Context ที่ยาวขึ้นถึง 64,000 tokens

ตอนนี้เราก็สามารถโยนอะไรยาวๆ ไฟล์ใหญ่มากขึ้นให้มันได้ครับ จากเดิม ออกมาใหม่ๆ รับได้ 4,000 tokens ตอนนี้ขยายไปถึง 64,000 tokens หรือ 16 เท่า ...บ้าไปแล้ว
Context ใหญ่ขึ้นขนาดนี้ ทำอะไรได้บ้าง ... พวกสรุปต่างๆ จากการยัดข้อมูลใหญ่ๆไป ก็จะทำได้ดีขึ้นมาก พวกสัมมนายาวๆทั้งวัน แล้วถอดเสียงเป็นสคริปต์ ส่งให้มันสรุปต่อก็จะง่ายขึ้นละ ไม่ต้องตัดเป็นหลายก้อน ...ไหนจะเรื่องการทำ Research ที่ต้องใช้ research paper มากมายเกินกว่ามนุษย์จะอ่านจบในเวลาสั้นๆ หรือการสร้างบทความที่มีคุณภาพขึ้น จากการยัดข้อมูลส่งไปให้มันเรียน ก็จะเขียนดีขึ้นด้วย

OpenAI ต่อ กับ Advanced Voice Mode

OpenAI เริ่มทะยอยเปิดฟีเจอร์ Advanced Voice Mode ที่อวดชาวโลกไปไม่กี่เดือนก่อน สามารถคุยโต้ตอบกับคนได้เป็นธรรมชาติมาก แต่เราได้แค่เห็นในคลิป ไม่ได้ใช้งานจริงซักที รอบนี้ เริ่มเปิดให้คนอื่นได้ใช้แล้ว เฉพาะผู้ใช้ ChatGPT Plus บางคน (เปิดแบบเบาๆ เรียกว่า Alpha 55)
โหมดนี้ เค้าเรียกว่า Hyper Realistic Audio ที่สามารถหยุดรอจังหวะการสนทนาได้อย่างเป็นธรรมชาติด้วย...ไม่ธรรมดา...เราจะแยกลำบากแล้วว่ากำลังคุยกับคน หรือคุยกับ AI อยู่

Google ปล่อยโมเดล Gemini 1.5 Pro

มาที่ Google บ้าง หลังจากปล่อย Gemini 1.0 Pro เมื่อเดือน ก.พ. ทาง Google ก็เงียบหายไป แถมยังโดนประนามว่า ถามอะไรไปก็ไม่ค่อยตอบ ฉันเป็นโมเดลภาษา เรียกว่า เปิดมาฟอร์มใหญ่ แต่ลงสนามจริง โดนบุลลี่หนักเลย (จริงๆถ้าเล่นหลังบ้าน คือ Google AI Studio มันจะปิดการเซนเซอร์พวกนี้ได้นะ)
มารอบนี้ Gemini 1.5 Pro (รุ่น Experimental 0801) กลับมาทวงบัลลังก์เบอร์ 1 ของการ Benchmark (ทดสอบโดย LMSYS ซึ่งจะอัพเดท Leaderboard ของ LLMs แต่ละค่ายเป็นประจำ) ...ความน่าเชื่อถือ ยังคงเป็นปริศนา บางคนก็ไม่ค่อยเชื่อการทดสอบจากค่ายนี้

https://x.com/lmsysorg/status/1819048821294547441/photo/1

การทดสอบ ก็คงเป็นการทดสอบ เป็นการลองแบบเฉพาะเจาะจงกับงานบางอย่าง แต่พอใช้งานจริง ก็มีคนด่าอยู่ดี 555 ...ใครที่สมัครใช้ Gemini Advance ตอนนี้ เค้าอัพเกรดเป็นโมเดล Gemini 1.5 Pro เรียบร้อย
Gemini 1.5 Pro เป็นโมเดลแบบ Multimodal ที่ฉลาดขึ้น รองรับทั้ง ตัวหนังสือ, รูปภาพ ไฟล์เสียง และวิดีโอ เช่นเดิม พร้อมกับขยาย Context Windows คือ ขนาดของข้อมูลที่โยนใส่เข้าไป เพิ่มเป็น 2,000,000 tokens ใหญ่กว่า Gemini 1.0 Pro ถึง 2 เท่า
งานซับซ้อนต่างๆสำหรับธุรกิจ ก็จะทำได้เก่งขึ้นมากเช่นกัน เพราะมันประมวลผลข้อมูลได้ใหญ่มากขึ้น โดยเฉพาะงานด้านการวิเคราะห์ข้อมูลที่ซับซ้อน การพัฒนาซอฟท์แวร์

4. Google ปล่อยโมเดล Gemma 2 สำหรับรันบนอุปกรณ์

ปล่อยโมเดลพี่ใหญ่อย่าง Gemini 1.5 Pro ไปแล้ว มาถึงโมเดลน้องเล็ก อย่าง Gemma 2 ที่รันบนอุปกรณ์ต่างๆได้ (เรียกว่า Gemma 2 2B คือ ฝึกด้วยชุดข้อมูล 2 พันล้านพารามิเตอร์ เทียบกับ GPT3.5 ที่ใช้ถึง 175 พันล้าน)
เรียกว่าเป็นโมเดล ที่เพียงพอต่อการใช้งานทั่วไป ใช้ทรัพยากรน้อยลงหลายสิบเท่า แต่ความสามารถสูสีกัน จนเอามายัดใส่อุปกรณ์ต่างๆได้
Gemma 2 เปิดแบบ 2 ตัว คือ แบบเล็กมากๆ (Gemma 2 2B) กับ แบบใหญ่ขึ้นมาอีกหน่อยแต่ยังเล็กอยู่ (Gemma 2 27B) ตัวหลัง Google คุยกว่าความสามารถสูสีกับ Llama 3 70B ของ Meta เลย (ในขนาดต่างกันเกินครึ่ง)

มาที่ Meta บ้าง กับโมเดลใหม่ Segment Anything Model หรือ SAM 2

อาทิตย์ก่อนหน้า พี่มาร์คเล่นใหญ่ ปล่อยตัว Llama 3.1 แบบ 70B และ 405B แบบสะเทือนวงการ
มาอาทิตย์นี้ ก็ยังปังไม่ยอมหยุด กับโมเดลที่ฮือฮามาก คือ Segment Anything Model หรือ SAM 2 ที่มีความสามารถในการแยกแยะวัตถุต่างๆในรูปและวิดีโอได้
สำหรับคนใช้ iPhone, iPad ให้นึกถึงตอนเราเปิดรูป เอานิ้วแตะตัวคน หรือจาน หรือวัตถุอะไรก็ตามในรูป แล้วลากมาวางในแอปอื่นๆได้ อารมณ์แบบนั้น
แต่ SAM2 มันทำกับวิดีโอได้แล้ว เรียกว่าจะสร้างประโยชน์ให้กับวงการวิดีโออีกมากเลย เพราะมันเลือกวัตถุในวิดีโอหรือ Prompt สั่งแล้วเปลี่ยนได้แบบ Real Time ได้เลย ไม่ต้องรอ render วิดีโอใหม่
ลองกันได้ที่นี่ครับ https://sam2.metademolab.com/demo

Midjourney ออกเวอร์ชั่นใหม่ 6.1

คุณภาพรูปที่มันสร้างมาได้ สวยกว่าเดิมมากกก โดยเฉพาะรูปคน เหมือนจนแยกไม่ออก พวกแขน ขา ตัว body คน skin texture ต่างๆ
เจนได้เร็วกว่าเดิม 25%

Runway ออกโมเดล Image-to-Video รุ่น 3

เร็วกว่า ถูกกว่า โมเดลรุ่นก่อน
มีออกมา 2 ตัว คือ Gen 3 Alpha กับ Gen 3 Alpha Turbo ที่เร็วกว่ารุ่นปกติ 7 เท่า

สมรภูมิ Generative Video นี่เดือดสุดๆครับ เล่นเปิดตัวมาชนกัน ใกล้ๆกันเลย ทั้งของ Pika Labs, Dream Machine จากค่าย Luma AI, Kling ของจีน และ Sora จากค่าย OpenAI
จากเดิมตอน Sora ออกมาใหม่ๆ คนว้าวกันมาก จน Lumier จาก Google ดับหายไปเลย
มาตอนนี้ ทุกคนก็พัฒนาตัวเองจนความสามารถใกล้ๆกันละ แถมราคาค่าบริการ ก็น่ารัก เป็นมิตรกับกระเป๋าเงิน (นึกว่าจะมาแบบเดือนละ $50) เจอ Kling ของจีน มาเดือนละ $5 เท่านั้นเอง เป็นราคาโปรที่ลดจากเดือนละ $12 (โปรหมดพรุ่งนี้) - https://klingai.com/

Canva ซื้อกิจการ Leonardo.ai

คนในวงการ Creator ก็ตื่นเต้นกันอยู่พอประมาณครับ เพราะ Leonardo.ai นี่เป็นเครื่องมือเจนภาพและวิดีโอที่ดัง ใช้งานไม่ยากมาก สร้างภาพและวิดีโอคุณภาพสูงแบบเสมือนจริงได้ มีคนใช้ราวๆ 19 ล้านคน (เยอะอยู่ 55)
เป็นการซื้อเข้าไปเสริมความแข็งแรงให้ Product หลักได้เป็นอย่างดี ซึ่ง Canva ก็ซื้อธุรกิจที่เกี่ยวข้องมาอย่างต่อเนื่อง ปีนี้ก็เพิ่งซื้อ Affinity ที่ทำโปรแกรมคล้ายๆ Adobe Photoshop, Illustrator เข้ามาเสริม
เราสมัครใช้ Canva กันถูกและใช้คุ้มค่ามากกกกก มันเก่งขึ้นเรื่อยๆ เราก็ยังจ่ายเท่าเดิม (ขอให้เป็นแบบนี้ไปนานๆ)

โอลิมปิก ปารีส 2024 กับ AI

คนอาจจะยังไม่ค่อยรู้นะครับว่าโอลิมปิกครั้งนี้ มีการนำ AI มาใช้งานค่อนข้างเยอะเลย
ตั้งแต่การตัดต่อวิดีโอเพื่อทำ Highlight เป็นการตัดด้วย AI แบบอัตโนมัติ และยังปรับขนาดเป็นหลายฟอร์แมท เพื่อลงแพลตฟอร์มออนไลน์ต่างๆ โดยแพลตฟอร์มนี้เป็นของ Intel ชื่อว่า Intel Geti AI
ยังใช้ AI ทำการพากย์และแปลเป็นภาษาอื่นๆด้วย เพื่อให้เข้าถึงคนทั้งโลกได้จริงๆ
มีการใช้ AI เพื่อมอนิเตอร์แอคเคาท์บนโซเชียลมีเดีย นับแสนๆแอคเคาท์ เพื่อตรวจสอบข้อความ ความถูกต้อง หรือมีเรื่องข่าวปลอมมั้ย
มีการทดสอบการใช้งาน AI Chatbot บนแพลตฟอร์ม Athlete365 (https://olympics.com/athlete365) ด้วย เพื่อช่วยตอบคำถามเกี่ยวกับกฏระเบียนต่างๆในการแข่งขัน กฏการตรวจสอบการใช้สารเสพย์ติด
มีการนำเทคโนโลยี Digital Twin มาใช้ด้วย เพื่อทำ simulation การแข่งขันต่างๆ
ระบบกล้องที่ใช้ในการแข่งขัน มีการพาร์ทเนอร์กับ Alibaba เพื่ออัดคลิปและรีเพลย์ รวมไปถึงการใช้ AI มาสร้างภาพ 3 มิติ จำลองการแข่งขันในกีฬาต่างๆ และประมวลผลมุมกล้องหลายตัวให้ดูได้ครบทุกมุม
ขนาดนาฬิกา Omega ที่ใช้ในโอลิมปิกเพื่อจับเวลา ยังเพิ่มฟังก์ชั่น AI เข้าไปเลย โดยมีการใช้งานร่วมกับกล้อง เพื่อเก็บข้อมูล เช่น การวิ่งเข้าเส้นชัย การว่ายน้ำ กระโดดสูง ขี่จักรยาน แล้วนำมาเป็น data เพื่อวิเคราะห์ เปรียบเทียบ Performance
เรียกได้ว่า โอลิมปิกครั้งนี้ เป็นครั้งแรกที่เป็นโอลิมปิกแบบ AI-powered มีการใช้งาน AI ในแทบทุกอณูของงาน โดยพาร์ทเนอร์หลักด้าน AI ในโอลิมปิกครั้งนี้ คือ Intel !! ....ที่ผลประกอบการแย่ หุ้นตกหนัก และเพิ่งให้พนักงาน 15,000 คน ออก

สุดท้าย เป็นเรื่อง Responsible AI ระหว่างประเทศบราซิลกับ บริษัท Meta

หน่วยงานที่ชื่อว่า National Data Protection Authority (ANPD) ของบราซิล ที่คอยดูแลเรื่องความปลอดภัยและข้อมูลความเป็นส่วนตัวของประเทศบราซิล ได้ทำการแบนบริษัท Meta ห้ามนำ AI มาใช้งานในบราซิล หลังจากสั่งให้บริษัท ห้ามนำข้อมูลส่วนตัวของประชากรบราซิลที่ใช้งาน Facebook และ Instagram ทั้งหมด กว่า 102 ล้านคน ไปเทรน AI
แต่ Meta ก็ยังคงไม่ปฏิบัติตามกฏอย่างเคร่งครัด ไม่ยอมชี้แจงว่าเอาข้อมูลอะไรไปบ้างและไปทำอะไรบ้าง จนโดนแบน
อยากให้บ้านเราเข้มกับแพลตฟอร์มเหล่านี้ให้มากขึ้น เพราะเราไม่รู้เลย ว่าเค้าเอาข้อมูลอะไรของเรา ไปเทรน AI เค้าบ้าง

สรุปงาน SCBX Unlocking AI EP 10: Responsible AI in Action: From Regulation to Real-World Impact

The AI Regulatory Landscape: Navigating Current and Future Framework
โดย ดร.ศักดิ์ เสกขุนทด ที่ปรึกษาด้าน Digital Transformation จากสำนักงานพัฒนาธุรกรรมทางอิเล็กทรอนิกส์ (สพธอ.)
AI Success Story: Implementing Responsible AI Across Industries Around the Globe
โดย คุณกฤติยาณี บูรณตรีเวทย์ ทนายความและพาร์ทเนอร์จาก Baker McKenzie
How to Maximize AI Transformation in Corporate from Day 1 to Scale Out
โดย คุณณัฐพล จงจรูญเกียรติ Vice President จากบริษัท พีทีที โกลบอล เคมิคอล จำกัด (มหาชน) หรือ GC
Demarginalizing the Underserved with AI Lending
โดย คุณถิรนันท์ อรุณวัฒนกูล ประธานเจ้าหน้าที่ปฏิบัติการ บริษัท มันนิกซ์ (MONIX) จำกัด
Kickstarting All In Organizations: Creating Responsible AI Policies and Best Practices for Compliance

Newsletter ฉบับนี้ สปอนเซอร์โดย Intercom.com บริษัทซอฟท์แวร์ด้าน Customer Support ระดับโลก

เค้ากำลังแจกส่วนลด 90% ให้กับคนทำ Startup ทั่วโลก แนะนำให้รีบกดไปรับส่วนลด 90% เลยนะครับ เพราะระบบเค้า Software as a Service ใช้กันทั้งโลก ของเค้าดีจริง

Intercom for Startups

Join Intercom’s Early Stage Program to receive a 90% discount.

Get a direct line to your customers. Try the only complete AI-first customer service solution.

Apply now

ดาวน์โหลดบทความในรูปแบบ Presentation ได้ที่นี่

	Insiderly - Trend Update 4 Aug 24.pdf1012.71 KB • PDF File

Reply

or to participate.