طور مختبر أبحاث الذكاء الاصطناعي في Yandex ، إلى جانب جامعات العلوم والتكنولوجيا الرائدة ، طريقة سريعة لضغط نماذج اللغة الكبيرة (LLM) دون فقدان الجودة. الآن ، فإن العمل مع النماذج والهواتف الذكية أو أجهزة الكمبيوتر المحمولة يكفي ولا تحتاج إلى استخدام خوادم باهظة الثمن ووحدات معالجة الرسومات القوية.

تتيح لك هذه الطريقة التحقق بسرعة وتنفيذ حلول جديدة بناءً على شبكة الأعصاب ، وتوفير الوقت والمال لتطويرها. هذا يجعل LLM أكثر سهولة ليس فقط للشركات الصغيرة والمختبرات والمنظمات غير الربحية والمطورين والباحثين الأفراد.
في وقت سابق ، من أجل بدء نموذج لغة على الهواتف الذكية أو أجهزة الكمبيوتر المحمولة ، من الضروري أداء كميها على خادم باهظ الثمن ، ويستغرق بضعة أسابيع. يمكن الآن إجراء القياس الكمي مباشرة على الهاتف أو الكمبيوتر المحمول لبضع دقائق.
اليوم ، صعوبة استخدام نماذج اللغة الكبيرة هي أنها تتطلب حسابات كبيرة. وهذا ينطبق أيضا على نموذج OpenSors. على سبيل المثال ، لا يتم وضع أحدهم ، Deepseek-R1 ، على خوادم باهظة الثمن ، مصممة للعمل مع الذكاء الاصطناعي والتعلم الآلي. هذا يعني أنه لا يمكن إلا لدائرة محدودة من الشركات استخدام نماذج كبيرة ، حتى لو كان النموذج نفسه في الأماكن العامة.
تتيح لك الطريقة الجديدة تقليل حجم النموذج والحفاظ على جودته وإطلاقها على الأجهزة بأسعار معقولة. على سبيل المثال ، باستخدام هذه الطريقة ، يمكن ضغط النماذج الكبيرة مثل DeepSek-R1 مقابل 671 مليار معلمة و Llama 4 Maverick مقابل 400 مليار معلمة ، لا تزال تشير إلى أبسط الطرق مع خسارة كبيرة في الجودة.
توفر الأساليب الكمية الجديدة المزيد من الفرص لاستخدام LLM في مجالات مختلفة ، وخاصة في الأماكن التي تكون فيها الموارد محدودة ، على سبيل المثال ، في التعليم أو النطاق الاجتماعي. يمكن الآن لشركات الناشئة والمطورين المستقلة استخدام نماذج الضغط لإنشاء منتجات وخدمات مبتكرة دون إنفاق معدات باهظة الثمن.
طريقة القياس التي طورها العلماء يسمى Higgs (الكلمة الإنجليزية ، فإنها تتيح لك ضغط شبكة الأعصاب دون استخدام بيانات إضافية ولا تحسب التحسين المعقد للمعلمات. وهذا مفيد بشكل خاص في المواقف التي لا تحتوي على بيانات كافية لتعلم النموذج. توفر هذه الطريقة توازنًا بين جودة وحجم النموذج وتعقيد الكمية ، مما يتيح لك استخدام نماذج عديدة مختلفة.
تم اختبار هذه الطريقة على النماذج الشائعة Llama 3 و Llama 4 و Qwen 2.5. أظهرت التجارب أن Higgs هي أفضل طريقة لقياس جودة وحجم النموذج بين جميع الطرق الكمومية الموجودة دون استخدام البيانات ، بما في ذلك GPTQ (GPT QUITIZATION) و AWQ (AWAPARY QUATITION).
علماء من NRU ، معهد ماساتشوستس للتكنولوجيا (MIT) ، معهد العلوم وتكنولوجيا النمسا (طريقة Higgs متاحة للمطورين والباحثين حول المعانقة والجيثب.