جست‌وجو در سایت

برای بستن، دکمه Esc یا ضربدر را فشار دهید.

21 مهر 1404

|

11

|

0 نظر

|

کدخبر: 9893

|

مدل زبانی پزشکی فارسی Gaokerena-V در هوش مصنوعی سلامت

🩺 پژوهشگران ایرانی نخستین مدل زبانی پزشکی فارسی را معرفی کردند تیمی از محققان دانشگاه اصفهان و تهران مدل زبانی متن‌باز Gaokerena-V را توسعه دادند.این مدل قرار است دانش پزشکی را در مدل‌های هوش مصنوعی بومی فارسی تقویت کند. زبان فارسی تا امروز منابع تخصصی کمی در حوزه‌ی هوش مصنوعی پزشکی داشته است.در حالی که … ادامه مطلب

مدلمدل زبانی پزشکی فارسی Gaokerena-V در هوش مصنوعی سلامت زبانی پزشکی فارسی

🩺 پژوهشگران ایرانی نخستین مدل زبانی پزشکی فارسی را معرفی کردند

تیمی از محققان دانشگاه اصفهان و تهران مدل زبانی متن‌باز Gaokerena-V را توسعه دادند.
این مدل قرار است دانش پزشکی را در مدل‌های هوش مصنوعی بومی فارسی تقویت کند.

زبان فارسی تا امروز منابع تخصصی کمی در حوزه‌ی هوش مصنوعی پزشکی داشته است.
در حالی که مدل‌هایی مانند Med-Palm و ChatDoctor سال‌ها در جهان پزشکی فعالیت می‌کنند، پژوهشگران ایرانی اکنون با ساخت Gaokerena-V این فاصله را کاهش داده‌اند.
پیش از این فقط مدل Sina-BERT وجود داشت، اما چون کد آن بسته بود، پژوهشگران نمی‌توانستند از آن بهره ببرند.


🧩 داده‌های بومی برای آموزش مدل

پژوهشگران برای آموزش مدل، حجم بزرگی از داده‌های فارسی گردآوری کردند:
۹۰ میلیون واژه از مجلات پزشکی و ۲۰ هزار گفت‌وگوی واقعی پزشک و بیمار از سایت‌هایی مانند drhast، niniban و doctor-yab.
آن‌ها پس از پاک‌سازی داده‌ها و حذف اطلاعات شخصی، مجموعه را آزادانه در اختیار جامعه‌ی علمی قرار دادند تا دیگران هم بتوانند از آن استفاده کنند.


⚙️ آموزش کم‌هزینه و سازگار با محیط‌زیست

تیم توسعه مدل را بر پایه‌ی aya-expanse-8b آموزش داد.
آن‌ها با استفاده از روش کم‌هزینه‌ی LoRA (Low-Rank Adaptation) مصرف منابع را کاهش دادند.
فرایند آموزش فقط ۱۹ ساعت طول کشید و تنها ۲٫۶۶ کیلوگرم دی‌اکسیدکربن تولید کرد؛ عددی بسیار کمتر از مدل‌های جهانی.


🧠 عملکرد فراتر از انتظار

Gaokerena-V توانست در آزمون ورودی علوم پایه پزشکی ایران (IBSEE) نمره‌ی قبولی بگیرد؛ در حالی که مدل پایه از این مرحله عبور نکرد.
در نسخه‌ی فارسی آزمون MMLU نیز میانگین دقت مدل بیش از ۲٫۶ درصد افزایش یافت.
ارزیابی کیفی با GPT-4o نشان داد پاسخ‌های این مدل از نظر دقت و طبیعی بودن، برتری محسوسی نسبت به سایر مدل‌های فارسی دارد.


🔮 گام بعدی: تحلیل تصویر پزشکی

پژوهشگران گفتند نسخه‌ی بعدی Gaokerena-V می‌تواند تصاویر پزشکی مانند MRI و سی‌تی‌اسکن را هم تحلیل کند.
آن‌ها قصد دارند با همکاری پزشکان و استفاده از یادگیری تقویتی با بازخورد انسانی (RLHF) دقت و اطمینان مدل را بیشتر کنند.


📰 جمع‌بندی
مدل Gaokerena-V نخستین گام جدی برای بومی‌سازی هوش مصنوعی پزشکی فارسی است.
این پروژه نشان می‌دهد پژوهشگران ایرانی حتی با منابع محدود هم می‌توانند دستاوردهای بزرگ علمی رقم بزنند.
به گفته‌ی تیم توسعه، این مدل در آینده می‌تواند پایه‌ی ساخت دستیارهای هوشمند پزشکی فارسی‌زبان باشد که به پزشکان و بیماران ایرانی کمک می‌کنند.

نظر خود را وارد کنید

آدرس ایمیل شما در دسترس عموم قرار نمیگیرد.

پربحث ترین ها
پیشنهادی: