หน้าแรก ตรวจหวย เว็บบอร์ด ควิซ Pic Post แชร์ลิ้ง หาเพื่อน Chat หาเพื่อน Line Page อัลบั้ม คำคม Glitter เกมถอดรหัสภาพ คำนวณ การเงิน ราคาทองคำ กินอะไรดี
ติดต่อเว็บไซต์ลงโฆษณาลงข่าวประชาสัมพันธ์แจ้งเนื้อหาไม่เหมาะสมเงื่อนไขการให้บริการ
News บอร์ดต่างๆค้นหาตั้งกระทู้

Microsoft ได้เปิดเผยเทคนิคการเจาะระบบ AI แบบใหม่ที่ชื่อว่า “Skeleton Key” 🙂

เนื้อหาโดย Annonymus TN

Microsoft ได้เปิดเผยเทคนิคการเจาะระบบ AI แบบใหม่ที่ชื่อว่า “Skeleton Key”

ซึ่งสามารถเลี่ยงการป้องกันที่มีอยู่ใน AI หลายรุ่นได้ เทคนิคนี้สามารถเอาชนะการป้องกันด้านความปลอดภัยที่ติดตั้งไว้ในระบบ AI ได้เกือบทุกระดับ ทำให้ต้องมีการปรับปรุงมาตรการรักษาความปลอดภัยที่แข็งแกร่งในทุกชั้นของระบบ AI

 

เทคนิค Skeleton Key ใช้วิธีสร้างขั้นตอนการส่งข้อมูลเพื่อโน้มน้าวให้ AI มองข้ามข้อกำหนดด้านความปลอดภัยที่มีอยู่ เมื่อทำสำเร็จแล้ว ระบบ AI จะไม่สามารถแยกแยะคำขอที่เป็นอันตรายหรือคำขอที่ไม่ได้รับอนุญาตออกจากคำขอที่ถูกต้องได้ ทำให้ผู้โจมตีสามารถควบคุม AI ได้อย่างสมบูรณ์

 

ทีมวิจัยของ Microsoft ได้ทดสอบเทคนิค Skeleton Key กับ AI รุ่นสำคัญๆ หลายรุ่น เช่น Meta’s Llama3-70b-instruct, Google’s Gemini Pro, OpenAI’s GPT-3.5 Turbo และ GPT-4, Mistral Large, Anthropic’s Claude 3 Opus และ Cohere Commander R Plus

 

AI ทุกตัวตอบรับคำขอที่อันตรายตัวอย่างเช่น วัตถุระเบิด อาวุธชีวภาพ เนื้อหาทางการเมือง การทำร้ายตนเอง การเหยียดเชื้อชาติ ยาเสพติด เนื้อหาทางเพศ และความรุนแรง

 

การโจมตีนี้มีวิธีทำงานโดยสั่งให้ระบบ AI ปรับเปลี่ยนแนวทางการทำงานของตนเอง ทำให้ AI ตอบสนองต่อคำขอใดๆ ก็ตามที่ถูกร้องขอ ซึ่ง AI จะกระทำการรุกราน อันตราย หรือผิดกฎหมายได้ เทคนิคนี้เรียกว่า “Explicit: forced instruction-following” และพิสูจน์แล้วว่าได้ผลกับ AI เกือบทุกตัว

 

“ Skeleton Key ทำให้ผู้ใช้สามารถใช้ AI แสดงพฤติกรรมที่ถูกห้ามจากผู้สร้างซึ่งอาจรวมถึงการสร้างเนื้อหาที่เป็นอันตรายหรือการทำผิดกฎการตัดสินใจที่ถูกระบุไว้ในบริษัท

 

หลังการค้นพบนี้ Microsoft ได้ดำเนินการอัพเดทการป้องกัน AI ใหม่ทั้งหมด รวมถึงผู้ช่วย AI Copilot Microsoft ทาง Microsoft ยังออกคำเตือนไปถึงผู้สร้างรายอื่นอย่างเปิดเผยว่า ให้ทำการอัพเดทเพื่อค้นหาคำสั่งที่เป็นอันตรายและและบล็อกการโจมตีโดยใช้ Prompt Shields

 

เพื่อป้องกันการโจมตีแบบ Skeleton Key และเทคนิคการเจลเบรคอื่นๆ Microsoft แนะนำวิธีการหลายชั้นสำหรับนักออกแบบระบบ AI: ได้แก่

 

1.การกรองข้อมูลขาเข้าเพื่อค้นหาและบล็อกข้อมูลที่เป็นอันตรายหรือมีเจตนาร้าย

 

2.การจัดการข้อความอย่างรอบคอบเพื่อเสริมสร้างพฤติกรรมที่เหมาะสม

 

3.การกรองผลลัพธ์จาก AI ที่ส่งให้ผู้ใช้เพื่อป้องกันการสร้างข้อมูลที่ละเมิดเกณฑ์ความปลอดภัย

 

4.ระบบการตรวจสอบการละเมิดกฏผู้สร้างที่ได้รับการฝึกฝนจากตัวอย่างโจมตีเพื่อตรวจจับและลดพฤติกรรมดังกล่าว

 

5.Microsoft ยังได้อัปเดต PyRIT (Python Risk Identification Toolkit) ของตนให้มีการบรรจุการโจมตี Skeleton Key ลงไปเพื่อให้นักพัฒนาและทีมรักษาความปลอดภัยสามารถทดสอบระบบ AI ของตนกับภัยคุกคามใหม่นี้ได้

 

ในอนาคตภัยคุกคามจาก AI จะเพิ่มมากขึ้นอีกมหาศาลการอัพเดทความปลอดภัยจึงสำคัญ อย่าลืมอัพเดทความรู้กันใหม่ที่นี้ MAI กันนะครับ

เนื้อหาโดย: Annonymus TN
⚠ แจ้งเนื้อหาไม่เหมาะสม 
Annonymus TN's profile


โพสท์โดย: Annonymus TN
เป็นกำลังใจให้เจ้าของกระทู้โดยการ VOTE และ SHARE
Hot Topic ที่น่าสนใจอื่นๆ
รถยนต์แบรนด์ไทย ที่ประสบความสำเร็จและมียอดขายมากที่สุดเลขเด็ด เลขมาเเรง เลขดัง "รวมหวยเด็ดสำนักดัง vol.29" งวดวันที่ 16 กรกฎาคม 2568พระบรมราชโองการ ยกเลิกสถาปนาสมณศักดิ์-พระราชทานสัญญาบัตรตั้งสมณศักดิ์ 81 รูปเพจดัง เปิดเผย นาทีทหารเขมรไปเอาปืน เตรียมจะไล่ยิง ทหารไทย จนทหารไทยต้องวิ่งหลบออกมาก่อนงวดนี้เลขชนเพียบ! สรุปเลขเด็ดจากทุกสำนัก งวด 16 ก.ค. 2568 เลข “93” มาแรงสุด มาดูรายละเอียดกันภูเขาน้ำแข็งขนาด "ตึกระฟ้า" เคลื่อนตัวเข้าใกล้เมือง ประกาศเตือนภัยฉุกเฉิน "กังวลภัยพิบัติคลื่นยักษ์"เลขเด็ด "แม่จำเนียรล็อตเตอรี่" มาแล้ว! งวดวันที่ 16 กรกฎาคม 68..คอหวยส่องด่วน!คริสติน เปาลิลลา ลูกเป็ดขี้เหร่ทายนิสัยจาก ‘สีผม’ ที่ชอบ สามารถบอกบุคลิก ตัวตนที่เป็น10 เลขขายดี "สลากใบแดง" งวดวันที่ 16 กรกฎาคม 68..พรุ่งนี้รวย คอหวยส่องด่วน!!วุฒิสภาเห็นชอบ นายอิทธิพร อัยการสูงสุดคนที่ 20Petfluencer สัตว์เลี้ยงอินฟลูเอนเซอร์ ที่สามารถครองใจได้มากกว่า อินฟลูเอนเซอร์ที่เป็นมนุษย์
Hot Topic ที่มีผู้ตอบล่าสุด
ดราม่าสะเทือนวงการเพลง “นักร้องนำ วงOnly Monday” นอกใจแฟนสาว!!ส่องทรัพย์สิน ‘นายกเบี้ยว’ เจ้าของวลีในตำนาน “คนธัญบุรีกินหญ้าหวาน” ที่แท้รวยกว่า 36 ล้าน!อำเภอเดียวของจังหวัดในภาคกลาง ที่มีพื้นที่อยู่ติดกับต่างประเทศ
กระทู้อื่นๆในบอร์ด ข่าววันนี้
ดราม่าสะเทือนวงการเพลง “นักร้องนำ วงOnly Monday” นอกใจแฟนสาว!!สีกากอล์ฟ มีเงินหมุนเวียนในบัญชีกว่า 385 ล้านบาท ปัจจุบันมีเงินคงเหลือไม่ถึงหมื่น ทำเอาชาวเน็ต ต่างสงสัยว่าเงินหายไปไหนหมดสีกากอล์ฟ มีเงินหมุนเวียน 385 ล้าน ถอนออกเหลือ 8,000 พบเอาไปเล่นเว็บพนันเพจดัง เปิดเผย นาทีทหารเขมรไปเอาปืน เตรียมจะไล่ยิง ทหารไทย จนทหารไทยต้องวิ่งหลบออกมาก่อน
ตั้งกระทู้ใหม่