توسيع نطاق استدلال الذكاء الاصطناعي التوليدي وتحسينه باستخدام AI Optimizer for Z 2.1

تم تصميم AI Optimizer for Z 2.1 لخدمة نماذج الذكاء الاصطناعي وإجراء تحسين الاستدلال على مُسرِّع IBM Spyre. فهو يعمل على تحسين استدلال الذكاء الاصطناعي التوليدي عبر البنى التحتية من خلال قدرات التخزين المؤقت للقيمة الرئيسية (KV) والمراقبة التي تم تكوينها لعملاء IBM Z.

لماذا يجب استخدام AI Optimizer for Z 2.1

بالنسبة إلى المؤسسات التي تشغِّل أحمال التشغيل على IBM Z، فإن الطريق إلى تشغيل الذكاء الاصطناعي لا يتعلق بما إذا كان بإمكانها تشغيله أم لا، بل يتعلق بمدى كفاءة وأمان دمجه في البيئات الحالية.

تزداد أعباء العمل في الذكاء الاصطناعي وتستهلك موارد أكبر، خاصة مع تطبيقات الذكاء الاصطناعي التوليدي وتطبيقات النماذج اللغوية الكبيرة. في Z، يجب على العملاء تحقيق التوازن بين:

أحمال التشغيل الحساسة لزمن الانتقال التي لا يمكنها مغادرة المنصة.
متطلبات الامتثال وإقامة البيانات التي تحد من مكان تنفيذ الاستدلال.
ارتفاع تكاليف الحوسبة والطاقة بسبب النشر غير الفعال للنماذج.

صُمم AI Optimizer for Z 2.1 ليتوافق مع هذه الحقائق، ما يمكّن المؤسسات من اتخاذ قرارات يدوية أقل والأتمتة بذكاء أكبر فيما يتعلق بتوجيه والاستدلالات وتحسينها.

القدرات الأساسية لـ AI Optimizer for Z 2.1

يقدم هذا الإصدار العديد من التحسينات التقنية التي تحسن الأداء والكفاءة على حد سواء:

1. المراقبة والتصور في الوقت الفعلي لتحقيق الشفافية التشغيلية الكاملة

باستخدام لوحات معلومات Grafana وPrometheus، يوفر AI Optimizer for Z 2.1 مراقبة عميقة ورؤى في الوقت الفعلي تقريبًا لمقاييس أداء الاستدلال واستخدام الأجهزة وSpyre وأنماط استخدام النماذج ويحدد العوائق وأوجه الشذوذ في خدمة النماذج. على سبيل المثال، يمكن للمستخدمين تفسير البيانات المعقدة بشكل بديهي من خلال إحدى لوحات المعلومات، وتجنب الإفراط في التخصيص والتخطيط لاتخاذ قرارات مستقبلية بشأن البنية التحتية والميزانية باستخدام هذه المقاييس.

2. التخزين المؤقت متعدد المستويات للحصول على استجابات أسرع وإنتاجية أعلى

باستخدام خطة تسليم على مراحل، يمكن تمكين مستويين من التخزين المؤقت لإعادة استخدام العمليات الحسابية المحسوبة مسبقًا لتسلسلات الرموز المميزة الشائعة عبر طلبات الاستدلال المختلفة. المستوى الأول هو تخزين القيمة الرئيسية (KV) مؤقتًا باستخدام نموذج لغوي كبير واحد يُنشر على عدة وحدات أجهزة. سيتم تسريع طلبات الاستدلال التي تحتوي على نصوص مخزنة مؤقتًا ويمكن تحسين استخدام الأجهزة. والمستوى الثاني هو مشاركة التخزين المؤقت عبر عدة عمليات نشر للنماذج اللغوية الكبيرة، ما يسرع الاستدلال ويقلل من الوقت اللازم للوصول إلى الرمز المميز الأول ويزيد من معدل النقل.

3. تحسين الاستدلال للنماذج التي تعمل على Spyre، مع تسريعها من خلال التصميم

يمكن اكتشاف النماذج اللغوية الكبيرة التي تعمل على Spyre تلقائيًا بواسطة AI Optimizer for Z وتسجيلها لتحسين الاستدلال. يمكن للمستخدمين إنشاء خطط توجيه مخصصة حيث يأخذ جهاز التوجيه الذكي المدمج في الحسبان التوافر والاستخدام والأداء. يمكن تجميع أدوات النماذج اللغوية الكبيرة التي تخدم تطبيقات أو أغراضًا متشابهة معًا عن طريق إضافة علامات عليها. كما يمكن للمستخدمين تكوين العلامات الخاصة بهم وفقًا لمعايير واجهات برمجة تطبيقات OpenAI.

4. تسجيل النموذج الخارجي وتوحيد عمليات الذكاء الاصطناعي الهجين الخاصة بك

يمكن تسجيل النماذج اللغوية الكبيرة الخارجية التي يتم نشرها على بنى تحتية أخرى خارج IBM Z وIBM LinuxONE مع AI Optimizer for Z. ويمكن وضع علامات على هذه النماذج وتجميعها مع النماذج اللغوية الكبيرة المحلية التي تعمل على Spyre لضمان تجميع حالة الاستخدام وتحسينها. بحسب نشر النماذج اللغوية الكبيرة، يمكن دمج مراقبة النماذج اللغوية الكبيرة الخارجية في لوحة معلومات المراقبة عبر المنصات لإعطاء نظرة عامة على الذكاء الاصطناعي التوليدي.

وبحسب حاجة العمل لحالة استخدام الذكاء الاصطناعي التوليدي، قد تكون هناك حاجة إلى نماذج متعددة لتحقيق هدف معين. لذلك، يسمح AI Optimizer for Z بتسجيل النماذج الخارجية التي تعمل خارج IBM Z وIBM LinuxONE لتوحيد نقطة النهاية. يمكن تجميع النماذج اللغوية الكبيرة الخارجية والنماذج اللغوية الكبيرة المحلية معًا من خلال علامات مخصصة يمكن استخدامها في استدلال الطلبات من أجل تلبية احتياجات العمل.

AI Optimizer on Z وwatsonx Assistant for Z على Spyre

عندما يجتمع AI Optimizer for Z مع watsonx Assistant for Z على مُسرِّع IBM Spyre، تحصل المؤسسات على مزايا الاثنين: الذكاء والأداء في انسجام تام.

يضمن AI Optimizer توجيه كل الاستعلامات والاستدلالات والاستدعاءات النموذجية وتخزينها وتوسيعها لتحقيق أقصى كفاءة، بينما يوفر مساعد watsonx Assistant for Z تفاعلاً طبيعيًا وحواريًا مع العملاء والموظفين.

يعمل النظامان معًا على بنية Spyre عالية الأداء والموفرة للطاقة، ويتيح كلاهما معًا استجابات أسرع وزمن انتقال أقل ورؤية شاملة، ما يحول تفاعلات العملاء إلى تجارب سلسة مدعومة بالذكاء الاصطناعي أكثر ذكاءً وسرعة ومصممة لتناسب نطاق المؤسسات.

انضم إلى ندوتنا عبر الإنترنت القادمة لتتعرَّف على المزيد

Minaz Merali

VP IBM Z Data and AI

IBM

Mohamed Elmougi

Senior Product Manager - IBM Z Data and AI

IBM

تعرّف على المزيد

ما الجديد في رسالة IBM الإخبارية

تعرَّف على أبرز المنتجات والميزات الجديدة التي أعلنت عنها IBM.

توسيع نطاق استدلال الذكاء الاصطناعي التوليدي وتحسينه باستخدام IBM AI Optimizer for Z 2.1