جست‌وجو در سایت

برای بستن، دکمه Esc یا ضربدر را فشار دهید.

18 آبان 1404

|

3

|

0 نظر

|

کدخبر: 10260

|

Agent Lightning؛ فریم‌ورک متن‌باز جدید مایکروسافت برای RL

مایکروسافت فریم‌ورک متن‌باز جدیدی با نام Agent Lightning معرفی کرد. این فریم‌ورک به توسعه‌دهندگان کمک می‌کند تا عامل‌های هوش مصنوعی (AI Agents) را با استفاده از یادگیری تقویتی (Reinforcement Learning) و روش‌های خود-بهبود آموزش دهند و بهینه کنند. دسترسی و سازگاری این ابزار تحت مجوز MIT منتشر شده و در اختیار عموم قرار دارد. توسعه‌دهندگان … ادامه مطلب

Agent Lightning؛ فریم‌ورک متن‌باز جدید مایکروسافت برای RL

مایکروسافت فریم‌ورک متن‌باز جدیدی با نام Agent Lightning معرفی کرد. این فریم‌ورک به توسعه‌دهندگان کمک می‌کند تا عامل‌های هوش مصنوعی (AI Agents) را با استفاده از یادگیری تقویتی (Reinforcement Learning) و روش‌های خود-بهبود آموزش دهند و بهینه کنند.

دسترسی و سازگاری

این ابزار تحت مجوز MIT منتشر شده و در اختیار عموم قرار دارد. توسعه‌دهندگان می‌توانند با آن هر نوع ایجنتی را که با چارچوب‌هایی مانند LangChain، AutoGen یا OpenAI Agent SDK ساخته‌اند، بدون نیاز به بازنویسی کد آموزش دهند و عملکردش را ارتقا دهند.

هدف طراحی

مایکروسافت در طراحی Agent Lightning تمرکز را بر جداسازی لایه‌ی آموزش از لایه‌ی اجرای ایجنت گذاشت. با این رویکرد، هر عامل فعال می‌تواند به سامانه متصل شود تا داده‌های رفتاری‌اش ذخیره گردد و همان داده‌ها برای یادگیری و بهبود تصمیم‌گیری استفاده شوند.

ساختار سیستم

طبق مستندات رسمی، این فریم‌ورک از دو بخش اصلی تشکیل شده است:

  1. Lightning Server – داده‌های تعامل را جمع‌آوری می‌کند، پاداش‌ها را تخصیص می‌دهد و فرآیند یادگیری را مدیریت می‌کند.

  2. Lightning Client – عامل هوش مصنوعی را در محیط اجرا می‌کند و داده‌های رفتاری را به سرور می‌فرستد.

نحوه‌ی کار

Agent Lightning داده‌های تعامل را به‌صورت مجموعه‌ای از رویدادها (spans) ذخیره می‌کند. سپس ماژولی به نام Lightning RL این داده‌ها را به یک مدل تصمیم‌گیری مارکوف (MDP) تبدیل می‌کند. در این مدل، حالت (state)، عمل (action) و پاداش (reward) تعریف می‌شوند تا الگوریتم‌های RL بتوانند رفتار عامل را بهینه کنند.

روش‌های پشتیبانی‌شده

مایکروسافت در مقاله‌ی پژوهشی خود اعلام کرد که این چارچوب از چند روش یادگیری پشتیبانی می‌کند:

  • یادگیری تقویتی کلاسیک برای بهینه‌سازی سیاست‌ها؛

  • بهینه‌سازی پرامپت‌ها (Prompt Optimization)؛

  • ریزآموزش (Fine-Tuning) مدل‌های زبانی بزرگ؛

  • یادگیری مشارکتی در سامانه‌های چندعاملی.

ویژگی‌های کلیدی

Agent Lightning امکانات زیر را در اختیار توسعه‌دهندگان قرار می‌دهد:

  • پشتیبانی از ایجنت‌های چندمرحله‌ای و چندابزاره؛

  • نظارت بر خطاها و اصلاح رفتارهای نامطلوب؛

  • آموزش بدون نیاز به بازنویسی کد؛

  • سازگاری با محیط‌های GPU و اجرای توزیع‌شده؛

  • ثبت خودکار عملکرد و نتایج یادگیری.

نتایج آزمایشی

مایکروسافت اعلام کرد که در آزمایش‌های اولیه، این فریم‌ورک در وظایفی مانند تبدیل متن به SQL و مدیریت ابزارهای چندمرحله‌ای، دقت و پایداری عامل‌ها را به‌طور قابل توجهی افزایش داده است.

دسترسی به کد منبع

کد منبع Agent Lightning در GitHub منتشر شده و مستندات رسمی آن در وب‌سایت Microsoft Research در دسترس عموم قرار دارد.

Github: https://github.com/microsoft/agent-lightning

نظر خود را وارد کنید

آدرس ایمیل شما در دسترس عموم قرار نمیگیرد.

پربحث ترین ها
پیشنهادی: