مایکروسافت فریمورک متنباز جدیدی با نام Agent Lightning معرفی کرد. این فریمورک به توسعهدهندگان کمک میکند تا عاملهای هوش مصنوعی (AI Agents) را با استفاده از یادگیری تقویتی (Reinforcement Learning) و روشهای خود-بهبود آموزش دهند و بهینه کنند. دسترسی و سازگاری این ابزار تحت مجوز MIT منتشر شده و در اختیار عموم قرار دارد. توسعهدهندگان … ادامه مطلب
- برگه نخست
- نوشته ها
- Agent Lightning؛ فریمورک متنباز جدید مایکروسافت برای RL
Agent Lightning؛ فریمورک متنباز جدید مایکروسافت برای RL
مایکروسافت فریمورک متنباز جدیدی با نام Agent Lightning معرفی کرد. این فریمورک به توسعهدهندگان کمک میکند تا عاملهای هوش مصنوعی (AI Agents) را با استفاده از یادگیری تقویتی (Reinforcement Learning) و روشهای خود-بهبود آموزش دهند و بهینه کنند.
دسترسی و سازگاری
این ابزار تحت مجوز MIT منتشر شده و در اختیار عموم قرار دارد. توسعهدهندگان میتوانند با آن هر نوع ایجنتی را که با چارچوبهایی مانند LangChain، AutoGen یا OpenAI Agent SDK ساختهاند، بدون نیاز به بازنویسی کد آموزش دهند و عملکردش را ارتقا دهند.
هدف طراحی
مایکروسافت در طراحی Agent Lightning تمرکز را بر جداسازی لایهی آموزش از لایهی اجرای ایجنت گذاشت. با این رویکرد، هر عامل فعال میتواند به سامانه متصل شود تا دادههای رفتاریاش ذخیره گردد و همان دادهها برای یادگیری و بهبود تصمیمگیری استفاده شوند.
ساختار سیستم
طبق مستندات رسمی، این فریمورک از دو بخش اصلی تشکیل شده است:
-
Lightning Server – دادههای تعامل را جمعآوری میکند، پاداشها را تخصیص میدهد و فرآیند یادگیری را مدیریت میکند.
-
Lightning Client – عامل هوش مصنوعی را در محیط اجرا میکند و دادههای رفتاری را به سرور میفرستد.
نحوهی کار
Agent Lightning دادههای تعامل را بهصورت مجموعهای از رویدادها (spans) ذخیره میکند. سپس ماژولی به نام Lightning RL این دادهها را به یک مدل تصمیمگیری مارکوف (MDP) تبدیل میکند. در این مدل، حالت (state)، عمل (action) و پاداش (reward) تعریف میشوند تا الگوریتمهای RL بتوانند رفتار عامل را بهینه کنند.
روشهای پشتیبانیشده
مایکروسافت در مقالهی پژوهشی خود اعلام کرد که این چارچوب از چند روش یادگیری پشتیبانی میکند:
-
یادگیری تقویتی کلاسیک برای بهینهسازی سیاستها؛
-
بهینهسازی پرامپتها (Prompt Optimization)؛
-
ریزآموزش (Fine-Tuning) مدلهای زبانی بزرگ؛
-
یادگیری مشارکتی در سامانههای چندعاملی.
ویژگیهای کلیدی
Agent Lightning امکانات زیر را در اختیار توسعهدهندگان قرار میدهد:
-
پشتیبانی از ایجنتهای چندمرحلهای و چندابزاره؛
-
نظارت بر خطاها و اصلاح رفتارهای نامطلوب؛
-
آموزش بدون نیاز به بازنویسی کد؛
-
سازگاری با محیطهای GPU و اجرای توزیعشده؛
-
ثبت خودکار عملکرد و نتایج یادگیری.
نتایج آزمایشی
مایکروسافت اعلام کرد که در آزمایشهای اولیه، این فریمورک در وظایفی مانند تبدیل متن به SQL و مدیریت ابزارهای چندمرحلهای، دقت و پایداری عاملها را بهطور قابل توجهی افزایش داده است.
دسترسی به کد منبع
کد منبع Agent Lightning در GitHub منتشر شده و مستندات رسمی آن در وبسایت Microsoft Research در دسترس عموم قرار دارد.
- صدور مجوز اپراتورهای هوش مصنوعی؛ گام جدید دولت برای توسعه اقتصاد دیجیتال
- هوش مصنوعی، موتور محرک افزایش بهرهوری در زنجیره حملونقل کشور
- رونمایی از دستیار هوشمند صنعت حملونقل در کشور با محوریت هوش مصنوعی
- افتتاح نهمین نمایشگاه حملونقل با تمرکز بر هوش مصنوعی و تقویت جایگاه لجستیکی ایران
- رصدخانه نخبگان با هوش مصنوعی وارد فاز عملیاتی شد
- مهدی خسروی: تحول نمایشگاههای ایران با هوش مصنوعی؛ از ثبتنام هوشمند تا تجربه دیجیتال
- راهاندازی نخستین اپراتور هوش مصنوعی و داده در کشور تا پایان سال
- رونمایی Ideagen از Mazlan؛ ورود نسل تازه Agentic AI به مدیریت انطباق با قوانین
- OpenAI وضعیت «Code Red» اعلام کرد؛ رقابت شدید با Google Gemini اوج گرفت
- Fujitsu از فناوری نوین پیشبینی رفتار انسان و اشیاء برای ارتقای ایمنی همکاری انسان و ربات رونمایی کرد
- کسب رتبه سوم بریکس توسط تیم دانشگاه تهران با طرح ترکیبی انسان–ماشین در مدلسازی احتراق
- ایران در آستانه جهش دیجیتال؛ عارف: کشور میتواند هاب منطقهای فناوری اطلاعات شود
- آغاز صدور پروانه اپراتور هوش مصنوعی در کشور گام جدید دولت در توسعه اقتصاد دیجیتال
- علیبابا با عینک هوش مصنوعی Quark وارد بازار گجتهای پوشیدنی شد
- هشدار نسبت به عقبماندگی ایران در هوش مصنوعی تأکید بر ضرورت سرمایهگذاری فوری
- مدیرعامل Reddit: چتباتهای هوش مصنوعی تهدیدی برای ترافیک و تعامل کاربران ما نیستند
- سیستمهای آموزشدهنده هوشمند: آینده یادگیری شخصیسازیشده
- Qualcomm با چیپهای جدید، چالشگر جدید Nvidia
- اختراع سامانه خودکار حضور و غیاب دانشگاه Devi Ahilya Vishwavidyalaya
- چیپهای هوش مصنوعی انویدیا؛ قرارداد ۱۰ میلیارد دلاری با کره جنوبی
- Gemini در Google Maps
- دکتر سیزمون ماچایفسکی: پیشگام در کاربرد هوش مصنوعی در آموزش
- SPICE؛ چارچوب متا برای یادگیری خودکار هوش مصنوعی بدون نظارت
- افتتاح نخستین کلینیک دولتی هوش مصنوعی در هند برای تشخیص زودهنگام بیماریها
- استخدام اساتید هوش مصنوعی در دانشگاه اوهایو؛ جهش بزرگ علمی
- OpenAI «کد قرمز» اعلام کرد؛ تمرکز کامل بر ارتقای ChatGPT
- سیسکو ایجنتهای هوش مصنوعی را معرفی کرد
- علیبابا با عینک هوش مصنوعی Quark وارد بازار گجتهای پوشیدنی شد
- خیز بزرگ Trio AI و AbbyPay برای ساخت نسل آینده پرداختهای هوشمند در آسیا
- هشدار جدی ساندار پیچای درباره خطرات اعتماد کامل به هوش مصنوعی
نظر خود را وارد کنید
آدرس ایمیل شما در دسترس عموم قرار نمیگیرد.