หน้าแรก ตรวจหวย เว็บบอร์ด ควิซ Pic Post แชร์ลิ้ง หาเพื่อน Chat หาเพื่อน Line หาเพื่อน Skype Page อัลบั้ม คำคม Glitter เกมถอดรหัสภาพ คำนวณ การเงิน
ติดต่อเว็บไซต์ลงโฆษณาลงข่าวประชาสัมพันธ์แจ้งเนื้อหาไม่เหมาะสมเงื่อนไขการให้บริการ
News บอร์ดต่างๆค้นหาตั้งกระทู้

Microsoft ได้เปิดเผยเทคนิคการเจาะระบบ AI แบบใหม่ที่ชื่อว่า “Skeleton Key” 🙂

เนื้อหาโดย Annonymus TN

Microsoft ได้เปิดเผยเทคนิคการเจาะระบบ AI แบบใหม่ที่ชื่อว่า “Skeleton Key”

ซึ่งสามารถเลี่ยงการป้องกันที่มีอยู่ใน AI หลายรุ่นได้ เทคนิคนี้สามารถเอาชนะการป้องกันด้านความปลอดภัยที่ติดตั้งไว้ในระบบ AI ได้เกือบทุกระดับ ทำให้ต้องมีการปรับปรุงมาตรการรักษาความปลอดภัยที่แข็งแกร่งในทุกชั้นของระบบ AI

 

เทคนิค Skeleton Key ใช้วิธีสร้างขั้นตอนการส่งข้อมูลเพื่อโน้มน้าวให้ AI มองข้ามข้อกำหนดด้านความปลอดภัยที่มีอยู่ เมื่อทำสำเร็จแล้ว ระบบ AI จะไม่สามารถแยกแยะคำขอที่เป็นอันตรายหรือคำขอที่ไม่ได้รับอนุญาตออกจากคำขอที่ถูกต้องได้ ทำให้ผู้โจมตีสามารถควบคุม AI ได้อย่างสมบูรณ์

 

ทีมวิจัยของ Microsoft ได้ทดสอบเทคนิค Skeleton Key กับ AI รุ่นสำคัญๆ หลายรุ่น เช่น Meta’s Llama3-70b-instruct, Google’s Gemini Pro, OpenAI’s GPT-3.5 Turbo และ GPT-4, Mistral Large, Anthropic’s Claude 3 Opus และ Cohere Commander R Plus

 

AI ทุกตัวตอบรับคำขอที่อันตรายตัวอย่างเช่น วัตถุระเบิด อาวุธชีวภาพ เนื้อหาทางการเมือง การทำร้ายตนเอง การเหยียดเชื้อชาติ ยาเสพติด เนื้อหาทางเพศ และความรุนแรง

 

การโจมตีนี้มีวิธีทำงานโดยสั่งให้ระบบ AI ปรับเปลี่ยนแนวทางการทำงานของตนเอง ทำให้ AI ตอบสนองต่อคำขอใดๆ ก็ตามที่ถูกร้องขอ ซึ่ง AI จะกระทำการรุกราน อันตราย หรือผิดกฎหมายได้ เทคนิคนี้เรียกว่า “Explicit: forced instruction-following” และพิสูจน์แล้วว่าได้ผลกับ AI เกือบทุกตัว

 

“ Skeleton Key ทำให้ผู้ใช้สามารถใช้ AI แสดงพฤติกรรมที่ถูกห้ามจากผู้สร้างซึ่งอาจรวมถึงการสร้างเนื้อหาที่เป็นอันตรายหรือการทำผิดกฎการตัดสินใจที่ถูกระบุไว้ในบริษัท

 

หลังการค้นพบนี้ Microsoft ได้ดำเนินการอัพเดทการป้องกัน AI ใหม่ทั้งหมด รวมถึงผู้ช่วย AI Copilot Microsoft ทาง Microsoft ยังออกคำเตือนไปถึงผู้สร้างรายอื่นอย่างเปิดเผยว่า ให้ทำการอัพเดทเพื่อค้นหาคำสั่งที่เป็นอันตรายและและบล็อกการโจมตีโดยใช้ Prompt Shields

 

เพื่อป้องกันการโจมตีแบบ Skeleton Key และเทคนิคการเจลเบรคอื่นๆ Microsoft แนะนำวิธีการหลายชั้นสำหรับนักออกแบบระบบ AI: ได้แก่

 

1.การกรองข้อมูลขาเข้าเพื่อค้นหาและบล็อกข้อมูลที่เป็นอันตรายหรือมีเจตนาร้าย

 

2.การจัดการข้อความอย่างรอบคอบเพื่อเสริมสร้างพฤติกรรมที่เหมาะสม

 

3.การกรองผลลัพธ์จาก AI ที่ส่งให้ผู้ใช้เพื่อป้องกันการสร้างข้อมูลที่ละเมิดเกณฑ์ความปลอดภัย

 

4.ระบบการตรวจสอบการละเมิดกฏผู้สร้างที่ได้รับการฝึกฝนจากตัวอย่างโจมตีเพื่อตรวจจับและลดพฤติกรรมดังกล่าว

 

5.Microsoft ยังได้อัปเดต PyRIT (Python Risk Identification Toolkit) ของตนให้มีการบรรจุการโจมตี Skeleton Key ลงไปเพื่อให้นักพัฒนาและทีมรักษาความปลอดภัยสามารถทดสอบระบบ AI ของตนกับภัยคุกคามใหม่นี้ได้

 

ในอนาคตภัยคุกคามจาก AI จะเพิ่มมากขึ้นอีกมหาศาลการอัพเดทความปลอดภัยจึงสำคัญ อย่าลืมอัพเดทความรู้กันใหม่ที่นี้ MAI กันนะครับ

เนื้อหาโดย: Annonymus TN
⚠ แจ้งเนื้อหาไม่เหมาะสม 
Annonymus TN's profile


โพสท์โดย: Annonymus TN
เป็นกำลังใจให้เจ้าของกระทู้โดยการ VOTE และ SHARE
Hot Topic ที่น่าสนใจอื่นๆ
ภาพจักรพรรดิ​นี​หว่า​นห​รง​ ราชวงศ์​ชิงอาคาร 5 ชั้นในหุบเขากุ้ยโจว : ฐานเพาะพันธุ์ซาลาแมนเดอร์ยักษ์จีนสาลี่ เดอะสตาร์ โพสต์คลิปสวีตอวยพรวันเกิด ตงตง กฤษกร หวานจนแฟนคลับแซวสนั่นครบรอบ 26 ปีความหายนะเมือง Raccoon ย้อนเวลาดูสิ่งที่เกิดขึ้นวันนันกันเกาหลีใต้เจอศึกหนัก ธุรกิจทรุดหลายเดือน แถมไทยก็แบนไม่หยุด ต้องหันหน้าหาญี่ปุ่นอดีตศัตรูสยบอาการ ปวดฟัน ด้วย 7สมุนไพรที่คุณอาจนึกไม่ถึงวันหยุดเราต้องใช้เวลาให้เกิดประโยชน์ประวัติความเป็นมา ของเมืองที่ถูกยุบลงเป็นตำบล #ภูแล่นช้าง (อำเภอนาคู จังหวัดกาฬสินธุ์)ครบรอบ 34 ปี Rockman 3 บเครื่อง FamicomDoraemon The Movie เรื่องที่ 44 พร้อมกำหนดฉายพร้อมชื่อตอนต้นหมีเหม็นสมุนไพรชื่อแปลกๆสรรพคุณทางยาที่คุณรู้แล้วต้องร้องว้าว....Monster Hunter Wilds ไม่สามารถรันที่ 60fps ได้แม้แต่บน PS5 Pro
Hot Topic ที่มีผู้ตอบล่าสุด
นาโตเตรียมตั้งศูนย์บัญชาการใกล้ชายแดนรัสเซียลุงต๋องแฉแม่ตั๊ก ให้เงินในคลิป 3,000 บาท ถ่ายเสร็จขอคืน 2,000 หวังช่วยรักษาเท้าแต่เป็นแค่ลมปากสยบอาการ ปวดฟัน ด้วย 7สมุนไพรที่คุณอาจนึกไม่ถึงประวัติความเป็นมา ของเมืองที่ถูกยุบลงเป็นตำบล #ภูแล่นช้าง (อำเภอนาคู จังหวัดกาฬสินธุ์)Monster Hunter Wilds ไม่สามารถรันที่ 60fps ได้แม้แต่บน PS5 Proทำไมปวดหัวจี๊ดหลังดื่มน้ำ หรือ เครื่องดื่มที่เย็นจัด
กระทู้อื่นๆในบอร์ด ข่าววันนี้
เปตาร์ บลาโกเยวิช หรือ "แวมไพร์แห่งคิซิลเยโว"Ian Stewart: แฮร์รี่ พอตเตอร์ตัวจริง ทำลายสถิติด้วยการแสดงมายากลมากที่สุดในหนึ่งนาที"ตีนแมว" เจอ "ตีนคน"! ถูกกระทืบปากแตกก่อนถูกส่งตำรวจชาวบ้านพบคู่รักพนักงานออฟฟิศแอบซั่มกัuในที่ทำงาน
ตั้งกระทู้ใหม่