«مدل‌های زبانی کوچک» زندگی روزمره را هوشمند می‌کنند/ وقتی هوش مصنوعی همه جا در دسترس می‌شود

به گزارش مهر؛ انتشار عمومی چت‌چی‌پی‌تی، چت‌بات مشهور شرکت «OpenAI»، در نوامبر سال ۲۰۲۲، هیاهویی بزرگ در فناوری هوش مصنوعی بپا کرد و سبب تشدید رقابت میان غول‌های فناوری شد.

اکنون بسیاری از شرکت‌های بزرگ فناوری در اقصی نقاط جهان، در عرصه توسعه هوش مصنوعی مولد و مدل‌های زبانی بزرگ گام برداشته و محصولاتی مبتنی بر این فناوری تولید کرده‌اند.

در این میان، شرکت مایکروسافت روز ۲۳ آوریل از تحولی بزرگ در این رقابت همه‌جانبه خبر داد. این شرکت اعلام کرد که در راستای جذب مشتریان متقاضی گزینه‌های مقرون به صرفه، یک مدل زبانی کوچک (SLM) خواهد ساخت. مدل جدید به نام «Phi 3 mini» اولین نسخه از سه مدل زبانی کوچک است که این شرکت قصد دارد، در آینده نزدیک عرضه کند. طبق اعلام کارشناسان این شرکت، مدل مذکور با هزینه پایین‌تر نسبت به مدل‌های زبانی بزرگ، طیف گسترده‌ای از قابلیت‌ها را در اختیار کاربران قرار می‌دهد.

به عقیده کارشناسان، مدل‌های زبانی کوچک، در چشم‌انداز به سرعت در حال تکامل هوش مصنوعی، به عنوان یک پیشرفت مهم ظاهر شده‌اند و نویدبخش توسعه فناوری هوش مصنوعی با دسترسی بیشتر، کارآمدی بالاتر و هزینه کمتر هستند.

این نوشتار کوتاه به بررسی ماهیت، ویژگی‌ها، مزایا، چالش‌ها و چشم اندازهای آینده مدل‌های کوچک زبانی اختصاص دارد.

چیستی و ماهیت مدل‌های زبانی کوچک

مدل‌های زبانی کوچک، نسخه‌های کوچک‌شده مدل‌های هوش مصنوعی بزرگ‌تر هستند که برای انجام وظایف مشابه در حوزه پردازش زبان طبیعی، مانند تولید متن، تصویر، ترجمه و … مورد استفاده قرار می‌گیرند. این مدل‌ها با پارامترهای کمتر و در نتیجه نیازهای محاسباتی کمتر طراحی شده‌اند. به عقیده بسیاری از متخصصان، درک مفهوم حفظ تعادل بین عملکرد و کارایی، امکان استفاده گسترده‌تر هوش مصنوعی مولد در دستگاه‌ها و برنامه‌های کم‌قدرت‌تر را فراهم می‌کند؛ دستگاه‌هایی که استقرار مدل‌های بزرگ در آن‌ها عملاً غیرممکن است.

از مزایای کلیدی استفاده از مدل‌های زبانی کوچک می‌توان به موارد زیر اشاره کرد.

مقیاس پذیری: مدل‌های زبانی کوچک به دلیل حجم و اندازه کمتر، ذاتاً مقیاس پذیرتر از مدل‌های بزرگ هستند. به بیان دیگر، می‌توان چنین مدل‌هایی را به طور مستقیم بر روی دستگاه‌هایی مانند تلفن‌های همراه هوشمند، تجهیزات متصل به اینترنت (IOT) و سایر سیستم‌های دارای توان محاسباتی محدود مستقر کرد.

کارایی: بر اساس برآوردهای صورت گرفته، مدل‌های زبانی کوچک به توان محاسباتی کمتری نیاز دارند. امری که به معنای مصرف انرژی کمتر و زمان پردازش کوتاه‌تر است و همین ویژگی آن‌ها را برای کاربردهای سریع و آنی به گزینه‌ای ایده آل بدل می‌کند.

مقرون به صرفه بودن: در مدل‌های کوچک زبانی، نیازهای محاسباتی کمتر به معنای کاهش هزینه‌های مربوط به پردازش و ذخیره سازی داده‌ها است. همین امر مدل‌های مذکور را به یک راهکار مقرون به صرفه برای بسیاری از مشاغل و توسعه دهندگان تبدیل می‌کند.

دسترس‌پذیری: از سوی دیگر، مدل‌های مذکور با کم کردن نیاز به منابع، موانع دسترسی به هوش مصنوعی مولد را کاهش می‌دهد و به سازمان‌ها و افراد کوچک‌تر اجازه می‌دهد که استفاده از هوش مصنوعی را توسعه داده و این فناوری را بیش از پیش به کار گیرند.

امکان سفارشی سازی: با توجه به اندازه مدل‌های زبانی کوچک، این ابزار فناورانه را می‌توان به راحتی برای کارهای یا صنایع خاص در مقایسه با همتایان بزرگ‌تر خود تنظیم و سفارشی‌سازی کرد.

تأثیرات زیست محیطی: مدل‌های زبانی کوچک با کاهش ردپای کربن در قیاس با راه‌اندازی و اجرای مدل‌های هوش مصنوعی در مقیاس بزرگ به چشم انداز هوش مصنوعی پایدارتر و دوست‌دار محیط زیست کمک می‌کنند.

حفظ حریم خصوصی داده‌ها: مدل‌های کوچک زبانی با پردازش داده‌ها به صورت محلی در دستگاه‌ها، حریم خصوصی را افزایش می‌دهند زیرا داده‌ها برای پردازش نیازی به ارسال به فضای ابری ندارند و در نتیجه خطر قرار گرفتن در معرض نقض داده‌ها کاهش می‌یابد.

کاربردهای شاخص مدل‌های کوچک زبانی

قابلیت‌های ذکر شده در توصیف مدل‌های کوچک زبانی، امکان استفاده از این فناوری را در طیف گسترده‌ای موارد و تجهیزات الکترونیکی میسر می‌سازد. در این بخش به بررسی برخی از کاربردهای کلیدی این مدل‌ها می‌پردازیم.

برنامه‌های تلفن همراه: مدل‌های کوچک زبانی می‌توانند چت‌بات‌های درون برنامه، ترجمه همزمان زبان‌های گوناگون و دستیارهای صوتی هوشمند را مستقیماً در دستگاه‌های تلفن همراه گنجانده و تقویت کنند.

فناوری پوشیدنی: ویژگی‌های این مدل‌ها، آن‌ها برای ادغام در دستگاه‌های پوشیدنی برای نظارت بر سلامت، ارائه بینش‌ها و هشدارهای بلادرنگ بر اساس گفتار یا ورودی متن کاربر به ابزاری ایده‌آل تبدیل می‌کند.

دستگاه‌های اینترنت اشیا: به عقیده کارشناسان، ادغام مدل‌های زبانی کوچک با اینترنت اشیا، می‌تواند سیستم‌های اتوماسیون خانگی و صنعتی هوشمندتر را با پردازش دستورات و اطلاعات به صورت محلی فعال کند.

محاسبات لبه: مدل‌های کوچک زبانی در محیط‌های محاسبات لبه ای بسیار مهم و حیاتی هستند؛ جایی که پردازش باید در نزدیکی منبع جمع آوری داده‌ها انجام شود تا زمان پاسخگویی بهبود و استفاده از پهنای باند کاهش یابد.

چالش‌های مدل‌های کوچک زبانی

با وجود همه مزایای ذکر شده برای مدل‌های کوچک زبانی، توان و قدرت پردازش کمتر آن‌ها، برخی معایب نیز در بر دارد. که از جمله آن‌ها می‌توان به موارد زیر اشاره کرد.

محدودیت‌های عملکرد: در حالی که مدل‌های زبانی کوچک در بسیاری از موارد کارآمد و توانمند هستند، اما معمولاً دقت و قابلیت‌های مدل‌های بزرگ‌تر را ندارند. از همین روی ممکن است این ویژگی کاربرد آن‌ها را در سناریوهای پیچیده محدود کند.

خطر بروز سوگیری و ارائه اطلاعات غلط: مجموعه داده‌های کوچک‌تری که برای آموزش این مدل‌ها استفاده می‌شوند ممکن است چندان متنوع نباشند و همین امر به طور بالقوه منجر به نتایج مغرضانه یا کاهش بی‌طرفی در فرآیندهای تصمیم‌گیری می‌شود.

پیچیدگی فرایند توسعه: متعادل کردن اندازه، کارایی و عملکرد در فرایند توسعه مدل‌های زبانی کوچک می‌تواند چالش برانگیز باشد و ممکن است به رویکردهای جدید در معماری مدل و تکنیک‌های آموزشی نیاز داشته باشد.

آینده مدل‌های زبانی کوچک

پیشرفت‌های فناورانه بدیع در تکنیک‌های فشرده‌سازی مدل‌های هوش مصنوعی و فرایندهای یادگیری می‌تواند بسیاری از محدودیت‌های فعلی مدل‌های زبانی کوچک را برطرف کند. به عقیده بسیاری از کارشناسان، ادامه تحقیق و نوآوری در این حوزه، احتمالاً توانایی مدل‌های مذکور را افزایش می‌دهد و آن‌ها را حتی در مقام رقابت با مدل‌های بزرگ‌تر قرار می‌دهد. علاوه بر این، با افزایش آگاهی و درک پتانسیل این مدل‌های زبانی، ادغام آن‌ها در بخش‌های مختلف نیز افزایش می‌یابد.
به عقیده طیف گسترده‌ای از کارشناسان، می‌توان مدل‌های زبانی کوچک را گام بلند بعدی در انقلاب هوش مصنوعی دانست.

سخن پایانی

به جرئت می‌توان مدعی شد که مدل‌های زبانی کوچک نشان دهنده یک پیشرفت امیدوارکننده در زمینه حوزه هوش مصنوعی مولد هستند. آن‌ها با ایجاد تعادل بین عملکرد و کارایی، مزایای هوش مصنوعی را به نقاطی که قبلاً به دلیل محدودیت منابع محدود شده بودند، گسترش می‌دهند. با پیشرفت فناوری، مدل‌های کوچک زبانی نقشی اساسی در فراگیر کردن هوش مصنوعی ایفا، نوآوری را در بسیاری از بخش‌ها هدایت و دوره جدیدی از برنامه‌های کاربردی هوشمند را آغاز می‌کنند؛ دوره‌ای که فراگیرتر و پایدارتر از هر زمان دیگری است.

همان طور که این مدل‌ها به تکامل خود ادامه می‌دهند، احتمالاً به چشم‌انداز فناوری روزمره ما تبدیل می‌شوند و انقلاب هوش مصنوعی را به روش‌هایی به پیش می‌برند که در حال حاضر مدت زیادی از درکشان توسط بشر نگذشته است.

توسعه و ادغام این ابزار فناورانه پتانسیل بازتعریف صنایع، بهبود زندگی شخصی و حرفه‌ای و هموار کردن راه را برای آینده‌ای فراهم می‌کند که در آن هوش مصنوعی واقعاً همه جا حاضر و با نیازها و ارزش‌های انسانی همسو است. با این وجود، سفر جهان در مسیر توسعه مدل‌های زبانی کوچک تازه شروع شده است و تأثیر کامل آنها بر آینده هنوز دارای نقاط ابهام بسیاری است.