تعد عملية تصميم وتطوير نماذج الذكاء الاصطناعي التوليدي مثل "تشات جي بي تي"، عملية ضخمة تصل تكلفتها إلى مئات الملايين من الدولارات، حيث تظهر توقعات المحللين، أن هذه التكلفة يمكن أن تستمر بالارتفاع لتصل إلى مليار دولار في السنوات القليلة المقبلة، بسبب الحاجة المستمرة لتحديث هذه النماذج، وضمان مواكبتها لأحدث التطورات التقنية.
ويذهب جزء كبير من تكاليف تطوير نماذج الذكاء الاصطناعي التوليدي، إلى النفقات المخصصة لشراء الرقائق الرسومية فائقة القوة، التي تنتجها شركات مثل إنفيديا والتي قد يتجاوز سعر الواحدة منها مبلغ 30 ألف دولار أميركي، فنماذج مثل "تشات جي بي تي" قد تكون بحاجة إلى عشرات الآلاف من الرقائق الرسومية باهظة الثمن، لضمان تقديم أداء سريع ودقيق.
العبء الخفي
ولكن بحسب تقرير أعدته مجلة "فورتشن" واطلع عليه موقع "اقتصاد سكاي نيوز عربية"، فإن الشركات التي تطور وتدرّب نماذج الذكاء الاصطناعي التوليدي، أو تعمل على تحسين أداء نماذجها الحالية، تكافح مع تكاليف باهظة أخرى، غالباً ما يتم تجاهلها، وهي تتعلق بمهمة "تصنيف البيانات" التي تعد عملية شاقة يتم من خلالها تدريب الذكاء الاصطناعي التوليدي على استخدام البيانات بمساعدة من البشر.
وتخضع نماذج الذكاء الاصطناعي التوليدي الكبيرة مثل "تشات جي بي تي" و"جيميني"، وغيرها لتمرين يتعلق بتصنيف البيانات يسمى Reinforcement Learning Human Feedback، حيث يقدم البشر خلال هذه العملية ملاحظات نوعية على البيانات التي يتم تزويد نماذج الذكاء الاصطناعي بها، وذلك حتى تتمكن هذه النماذج من تصنيفها بشكل صحيح وتتفادى ارتكاب الأخطاء.
والجهد المبذول في عملية "تصنيف البيانات" يعد سبباً رئيسياً لارتفاع تكاليف تطوير نماذج الذكاء الاصطناعي التوليدي، فتقديم البشر ملاحظاتهم أو تصنيفاتهم حول ما ينتجه الذكاء الاصطناعي تتطلب عمالة مكثفة، خصوصاً عند ارتباط الأمر بـ "تصنيف البيانات الفنية للغاية" والتي تتطلب وجود خبراء في مجالات مثل القانون والتمويل والرعاية الصحية، وهو ما يؤدي إلى زيادة النفقات بشكل باهظ، حيث تحتاج عندها الشركات لإستئجار أطباء ومحامين وحاملي الدكتوراه وعلماء لتصنيف بيانات معينة.
وبحسب "فورتشن" فإن "تصنيف البيانات" أمر صعب للغاية ومكلف ويستغرق وقتاً طويلاً، لكنه يستحق ذلك، نظراً للعائد المرتفع المحتمل تحقيقه من هذه العملية، حيث يقول الرئيس التنفيذي لمنصة تطوير الذكاء الاصطناعي Lightning AI، إن أي بيانات مرتبطة بأمور عالية المخاطر، تتطلب تصنيفاً على مستوى الخبراء، في حين يكشف أليكس راتنر، الرئيس التنفيذي لشركة Snorkel AI الناشئة لتصنيف البيانات، إن العملاء من الشركات يمكنهم إنفاق ملايين الدولارات على "تصنيف البيانات"، إذ أن هذه المهمة يمكن أن تستهلك 80 في المئة من وقتهم وميزانية الذكاء الاصطناعي.
بدوره يقول نيل شاه، الرئيس التنفيذي لشركة CareYaya، وهي منصة لمقدمي الرعاية لكبار السن، إن مهمة "تصنيف البيانات" يمكن أن تخلق مشاكل في الميزانية للشركات الناشئة في مجال التكنولوجيا، التي تعمل في مجالات مهمة مثل الرعاية الصحية، مشيراً إلى أن شركته حصلت على منحة من جامعة جونز هوبكنز لتطوير أول مدرب رعاية ذكي في العالم لمرضى الخرف، ولكن تكاليف "تصنيف البيانات" ترهق الشركة، فقد ارتفعت تكلفة تطوير هذا "المدرب الذكي" بنسبة 40 في المئة على مدار العام الماضي بسبب المعلومات المتخصصة المطلوب تصنيفها من قبل علماء الشيخوخة وخبراء الخرف ومقدمي الرعاية المخضرمين.
ما هي عملية تصنيف البيانات؟
ويقول مهندس الاتصالات عيسى سعد الدين في حديث لموقع "اقتصاد سكاي نيوز عربية"، إن أحد العناصر الأساسية التي تلعب دوراً محورياً في تطوير نماذج الذكاء الاصطناعي، تتمثل بمهمة "تصنيف البيانات" التي تشير إلى عملية تنظيم البيانات، ضمن فئات أو مجموعات محددة، فتنسيق البيانات أمر حاسم لنجاح وتحسين أداء النماذج الذكية وتطويرها وتحقيق المردود من خلالها، مشيراً إلى أن مهمة "تصنيف البيانات" قد تبدو للبعض موضوعاً تقنياً ولكنها ببساطة مجرد عملية تنظيم للبيانات.
ويشرح سعد الدين أن نماذج الذكاء الاصطناعي التوليدي، تعتمد على "البيانات المصنفة" من الإنسان، لتتعلم كيفية التنبؤ أو اتخاذ القرارات، فعلى سبيل المثال، إذا كانت احدى الشركات تقوم بتطوير نموذج للذكاء الاصطناعي يفهم ما تحتويه الصور، فإنه يجب على هذه الشركة ولكي ينجح نموذجها في تقديم إجابات صحيحة، أن تزوده ببيانات قام بإعدادها البشر تُصنّف الصور إلى فئات مثل قطط، كلاب، أشجار.. وبهذه الطريقة يتعلم النموذج كيفية التمييز بين هذه الفئات، وهذه القاعدة تنطبق أيضاً على نماذج الذكاء الاصطناعي المخصصة للطب والصناعة والتجارة، والمصارف والمطاعم والسيارات ومختلف المجالات الأخرى.
كلفة تصنيف البيانات
ويضيف سعد الدين إن "تصنيف البيانات" وباختصار، يساعد في تنظيم المعلومات الكبيرة والمعقدة، كي تصبح أسهل في الفهم من قبل الآلة، ولكن المشكلة الرئيسية في هذه المهمة، تكمن في كلفتها المرتفعة، والتي تتراوح من 2 دولار في الساعة، لتتجاوز مئات الدولارات في بعض الأحيان، فعلى سبيل المثال يمكن لشركة ما أن توظف اشخاصاً، مهمتهم تقتصر على تصنيف بيانات عادية ترتبط بإشارات المرور، وأصناف السيارات وأنواعها، وأنواع الحيونات وأعمار العملاء وغيرها الكثير من البيانات السهلة، حيث لا تحتاج الشركات لدفع كلفة مرتفعة لقاء تصنيف هذه البيانات، ولكن عند تصنيف بيانات مرتبطة بالطب والأدوية والهندسة والطاقة النووية وأمراض السرطان والسكري والقلب، فإن تكلفة تصنيف البيانات ترتفع بشكل هائل مع الحاجة لتوظيف مئات الآلاف من الخبراء لتصنيف مئات الآلاف من أطنان البيانات.
حجم البيانات في العالم
من جهتها تقول الكاتبة باتريسيا جلاد في حديث لموقع "اقتصاد سكاي نيوز عربية"، إن التكلفة الإجمالية لمهمة "تصنيف البيانات" لا يمكن تحديدها بشكل دقيق، لأنها تختلف بشكل كبير بناءً على عدة عوامل منها العمالة المتخصصة، حجم البيانات ونوعها، الأدوات والتقنيات المستخدمة والعناصر التي تتضمنها، ولكن بالمجمل فإن كلفة القيام بهذه العملية مرتفعة جداً، ويرجع ذلك إلى أن حجم البيانات العالمية وصل إلى حوالي 175 زيتابايت في عام 2024، ومجرد التفكير أن هذه الكمية من البيانات بحاجة إلى "تصنيف بشري"، يمكن إدراك أن التكلفة ستكون باهظة جداً مع الحاجة لتوظيف ملايين الأشخاص، علماً أن البيانات تتزايد بشكل مستمر ما يتطلب تحديثها بشكل منتظم ما قد يزيد من التكلفة الإجمالية.
بدائل التصنيف البشري
وتكشف جلاد أنه يمكن للشركات الاعتماد على التصنيف الآلي للبيانات وليس البشري، وذلك باستخدام خوارزميات الذكاء الاصطناعي نفسها، وهذه الطريقة تتطلب استثماراً في البرمجيات، ولكن الاعتماد على هذا الأسلوب دونه مخاطر كبيرة، مثل فقدان البيانات لقيمتها بسبب عدم دقة عملية التصنيف، والأخطاء التي قد ترتكبها الآلة في هذا المجال، والمرتبطة بعدم قدرتها على تصنيف بعض الأمور والأحداث والبيانات بشكل صحيح، ما قد يتسبب في ظهور نتائج خاطئة، ولذلك يبقى الدور الأفضل في هذا المجال للإنسان رغم التكلفة المرتفعة التي قد تنتج عن ذلك.
مردود "تصنيف البيانات"
وتؤكد جلّاد أن التكلفة التي تدفعها الشركات مقابل تصنيف البيانات يدوياً، تساهم في تحسين دقة النماذج في التنبؤات واتخاذ القرارات، مما يعزز القدرة التنافسية لتلك الشركات، ويساعدها في تطوير منتجات وخدمات مبتكرة تتفوق على المنافسين، مشيرة إلى أن هذه العملية تعزز أيضاً من العوائد المالية للاستثمار، حيث يمكن للنماذج الأكثر دقة، أن تفتح أبواباً لفرص جديدة، وتسهم في تحقيق عوائد مالية مرتفعة على المدى الطويل.