دریافت ویدیو
What is Superalignment_720.mp4_snapshot_03.09.665
4

مفهوم Superalignment در هوش مصنوعی

آیا هوش مصنوعی پیشرفته واقعاً می‌تواند با ارزش‌های انسانی همسو شود؟ Superalignment به مقابله با ریسک‌هایی مانند فریب استراتژیک، از دست دادن کنترل و حفظ بقا در هوش مصنوعی پیشرفته می‌پردازد. در این ویدیو این مفهوم و روش‌هایی مانند RLHF، RLAIF و نظارت مقیاس‌پذیر را بررسی می‌کنیم تا اطمینان حاصل شود که هوش مصنوعی آینده […]
AI Model Penetration Testing LLMs for Prompt Injection Jailbreaks (720p).mp4_snapshot_08.33.813
1

بررسی انواع تست نفوذ به مدل‌های هوش مصنوعی مثل Prompt Injection و Jailbreak

در این ویدیو قرار است در مورد روش‌های نفوذ به مدل‌های هوش مصنوعی صحبت شود. مدل‌های AI غیرقابل نفوذ نیستند— حملاتی مانند Prompt Injection، Jailbreak و داده‌های آلوده می‌توانند امنیت آن‌ها را تهدید کنند. در این ویدیو، روش‌های تست نفوذ از جمله Sandboxing، Red teaming و اسکن‌های خودکار برای حفاظت از مدل‌های زبانی بزرگ (LLMs) […]